数据库经过40多年的发展与变迁已经改写了格局,在开源、云端浪潮之下曾经的数据库霸主Oracle也已经跌下王座,不断向着云与智能化发展,新的厂商也获得了各自机会,在云数据库时代是一个百花齐放、百家争鸣的状态。

由于业务飞速发展,亚马逊和阿里两位电商巨头在10年前开始了自己的去“O”(Oracle数据库)运动,一直以来阿里云在数据库方面被认为是AWS跟随者,如今已经基本做到与AWS持平,甚至在某些方面已经领先。

根据Gartner统计,阿里云已经位居全球云数据库市场份额前三,年增速在115%。同期AWS增速为74%,Oracle为66%。而POLARDB在2018年正式商业化后,目前已经是阿里云上增长最快的数据库产品。

去“O”运动中的数据库市场变迁

2013年阿里巴巴最后一个Oracle数据库从从其淘宝核心系统中下线,10月15日亚马逊宣布其消费者业务也关闭最后一个Oracle数据库。

上个世纪70年代以关系型数据库起家的Oracle一直以来都是商用数据库的王者,与IBM DB2以及微软的SQL Sever基本垄断了传统商业库市场,曾经阿里是Oracle数据库在中国市场的头部客户,但是随着业务的发展,Oracle在性能上已经无法满足,而且成本高昂。

2009年前后阿里巴巴的总体流量一直高速上涨,但王坚博士认为如果再以当时的架构持续下去,为了能够支持流量的承载,阿里巴巴购买服务器、数据库产品的支出就足够让阿里巴巴破产,所以阿里巴巴开始了整个IT架构的升级,在对上层进行了微服务化后开始去“IOE”之路,其中的“O”就是Oracle数据库。

数据库是最难迁移的技术之一,因为通常企业中的多个软件应用在数据库上运行,一旦更换新的数据库所有应用程序都要被重写或替换,往往数据库项目迁移需要数年时间,亚马逊和阿里数据库迁移便是很好的例证。

2008年之后阿里基于开源数据库MySQL做AliSQL对内核进行改造调优,2011年随着阿里云的发展,开始进一步基于AliSQL搭建RDS平台,既对内服务又对外输出。在2013年淘宝下线最后一个数据库,之后阿里云数据库更多的是对外商用,不仅将阿里云数据库的技术,还有实践经验对外输出,与此同时阿里云数据库也逐步构建起MySQL、AliSQL、PostgreSQL、MariaDB开放数据库生态,2017年阿里云数据库用户实例突破了10万大关。

阿里和亚马逊的去“O”之路是数据库市场变迁的一个缩影,从以Oracle、DB2、SQL Sever为主的传统商业数据库,到以MySQL、PostgreSQL、MongoDB、MariaDB、Hbase为代表的开源数据库,据悉阿里巴巴在2013年左右开始大规模使用开源数据库,这与DB-Engines的数据库流行度趋势非常吻合,从DB-Engines数据库流行度来看,开源数据库从2013年开始到现在一直增长,直追商业数据库。

而在云端浪潮之下,数据量的激增,使得传统数据库和开源数据库在性能和成本等方面已经无法满足,云原生数据库正在引领数据库市场的新潮流。

阿里云数据库事业部总经理曹伟在今年云栖大会上指出云原生数据库未来发展趋势:

弹性:弹性不仅仅是规格的弹性,而是未来CPU、容量等计算资源都可以按量付费。

HTAP:之前TP和AP是分开处理的,TP使用关系型数据库,而AP使用大数据存储。未来则会融合两者,提供一个入口跑事务,一个入口跑报表和BI。

智能:智能让数据库更加实用,未来数据库的磁盘备份、内存调度等都不需要DBA来操作,而是全部由数据库自己来完成。此外,数据库还能够自动完成诊断和修复。

混合云:因为一些合规的要求,并不是所有数据都能跑在云上,因此还需要使用云上云下互联的生态。

云原生数据库的发展来自于云计算厂商的数据库自研之路,AWS和阿里云是其中的代表,“我们背靠阿里巴巴集团,身处复杂的生态环境,从电商到线下的新零售,像盒马以及线上娱乐如优酷等等,不仅对我们的技术提出了非常大的挑战,也提供了极为丰富的练兵场。这是我们能够持续走下去并不断衍生出新技术的一个核心保障。”阿里云智能数据库事业部负责人李飞飞在接受ITPUB采访时指出。

而在云原生时代阿里云也完成了从跟随者到开作者的转变。

从跟随者到开拓者

从传统商业数据库到开源数据库,再到自研数据库。自研之路往往艰难,而这条艰难之路更代表未来。

2014年AWS发布了关系型数据库Aurora,2015年阿里开始自研新一代云原生数据库POLARDB,选择了和Aurora同样的思路,采用存储计算分离、软硬一体化设计。

2017年阿里云公测自研关系型数据库POLARDB,被阿里称为新一代数据库的POLARDB当时在业在内并没有引起太大的轰动,它被认为是AWS Aurora的跟随者。在云端,不仅是数据库模块,从IaaS到PaaS,AWS都是是绝对的领先者,但是中国的数据库产品跻身世界一流数据库品牌正是从阿里云推出POLARDB开始的。

李飞飞在接受ITPUB采访时曾坦言阿里云跟随者的身份:“我觉得我们一开始是一个Follower(跟随者),这个没什么不好意思承认的。但是我们要从Follower做到超越者,做到leader。”

经过十多年的发展阿里云已拥有非常丰富的云数据库产品家族,涵盖关系型数据库、非关系型数据库、分析型数据库以及迁移工具等,满足用户不同的数据库应用开发需求,并且解决企业核心业务上云的关键难题。

李飞飞认为阿里云已经从Follower做到基本与AWS持平,甚至在技术上某些领域做到了领先。比如OLAP , AnalyticDB的性能已经在TPC-DS上打榜,并排到了第一。通过和AWS官方Redshift对比(在AWS上去买Redshift跑同样的Workload),在TPC-DS的很多Query,AnalyticDB的性能都要优于Redshift。另外,在某些领域,阿里云已经做到了人无我有,比如,在分布式数据库板块,因为阿里集团的“双11”场景需求,需要做share-nothing的架构。因此在PolarDB基础上做了PolarDB分布式版本。以Share-nothing的分布式架构来支持“双11”海量高并发数据的应用场景支撑,AWS并没有和阿里云对标的产品。

很多业内人士指出实际上阿里云数据库的整体能力并不仅仅表现在相对完善产品堆栈,这一点AWS也比较完善,更多的是对中国市场和客户需求的理解以及这些年来积累的实践经验。李飞飞曾经谈到过中美客户的差异,比如很多大中型国有企业,美国没有这种组织架构,其需求和美国的商业公司肯定有不同。“这会对我们的技术演进之路提出一些新的思考、新的挑战,也就会使我们最终会走出一条不同于Aurora的技术之路。”

但是在云端浪潮下,更为激烈的变革序幕已经开启,“传统数据库会像马车一样被淘汰。”李飞飞表示。Gartner的调研报告指出云数据库正在快速增长,到2022年预计有3/4的数据库天然部署或者迁移到云上。

而在中国市场也到了传统产业变革的下半场,只是这个更为庞大的市场上云并没有那么快,尤其在核心的数据库方面,有的行业甚至无法上云,一位在数据库领域从业超过20年的老兵质疑过“云计算厂商开发的数据库系统,市场目标是在自家的云上提供服务,而不是作为传统软件卖许可证。因此,很多打算摆脱Oracle,采用国产数据库,但又还没打算上云的用户,就很难享受到这类产品。”

在云端曾经的数据库王者Oracle也不再拥有优势,这也给阿里云等挑战者一个超越的机会。

面对这样的困局,这一次阿里云走在了前面。在2019年云栖大会上阿里云首推云原生数据库一体机POLARDB BOX,它能够更好地帮助用户在私有云上使用POLARDB数据库,实现“把云带回家。”在云端转型更加深入的当下阿里云进行了有益的探索,“把云带回家”也让POLARDB从跟随者变成开拓者。

目前阿里云数据库已服务政务、零售、金融、电信、制造、物流等领域的龙头企业,已有约40万个数据库实例迁移到阿里云上。

阿里巴巴的价值观中有这样一条:“唯一不变的是变化”,在这个飞速变革的时代,技术的演进与更迭速度正在成倍增长,十多年的数据库实践让阿里云积累了技术经验和相关方法论,不过传统产业的需求更加复杂多样,其中也不乏华为、AWS等同台竞技的玩家,战争的号角也只是刚刚吹响,还需要阿里们深入到产业中去探索与磨合。


10月25日,阿里云数据库技术沙龙北京站即将举行,本次沙龙特别邀请阿里云数据库专家团队分享阿里云数据库在阿里巴巴集团业务的广泛应用以及阿里云数据库背后的黑科技,资深阿里云数据库专家也将对现场收集的问题和痛点进行解答。欢迎扫码报名观看直播。

Comments are closed.