撰文|宇婷
3月24日,阿里云瑶池数据库峰会在北京召开,并官宣了“瑶池数据库”这一全新品牌。瑶池在中国的古代神话里是“汇聚宝藏的地方”,寓意能够汇聚从OLTP到OLAP各方数据库产品、多种类型的数据,让数据业务持续在线,让数据价值不断放大。
“我们的理念很简单,更快、更稳、更安全、更好用。”阿里巴巴集团副总裁、阿里云智能数据库事业部总负责人李飞飞明确表达了他对云数据库这一赛道的未来思考和战略思考;以及基于用户和数据库技术发展的思考。
“云数据库已经成为数据库行业的事实标准。”
他在记者群访中进一步提醒:但是对于这个事实标准上,大家可能有不同的观点,比如是100%还是60%、70%的覆盖深度。
“如果今天还不去拥抱云原生数据库,不按照云原生数据库的方式来研发自己产品的厂商,我认为是没有前途的。只不过它们可能还有一些线下的独立部署机会,但是这个机会是在持续不断地萎缩。”站在数据库厂商的角度,他这样认为。
阿里云数据库产品事业部资深解决方案专家李圣陶也在访谈中进一步解释了云原生数据库主要区隔的是传统数据库,包括传统线下部署和商业化软件。这一不可逆趋势背后的用户刚需是唯有云原生架构能够解决新时代下系统架构的矛盾。
“云原生化不仅仅发生在数据库的领域里,也发生在应用、基础设施等领域里。”
“这本质是我们今天的业务开始接触互联网,甚至未来接触AI之后,业务的迭代速度会越来越快,业务都要为企业创造价值,这个过程中要求快速迭代、稳定、低成本、弹性的系统”
去年云栖大会,第一次听到李飞飞在演讲中分享了“四化”这个概念。仔细看这组分享,他的思考不仅仅是站在阿里云瑶池数据库的商业维度提出,而是站在云数据库赛道上提出“四化”。我想这也是李飞飞提出四化的原因之一,当下国内云原生数据库竞争激烈,也许最终会剩下不到20家甚至更少的玩家,竞争混乱之中需要有中正的声音,来指出行业发展的真正阶段。
这篇文章会以阿里云瑶池数据库为例,分析为什么云原生数据库是不可逆趋势?以及在这个趋势判断下,国内数据库赛道竞争中,站在厂商角度如何更好服务客户。
1、云原生数据库在快速地向“四化”演进
给李飞飞启发并提出“四化”的是——30年前或者准确地说40年前,中国启动了四个现代化的历程。这个思考被拆解为:云原生化、平台化、一体化、智能化;落实在“瑶池数据库产品上,是打造“云原生+一站式”的数据管理与服务,以作为国产数据库带领客户实现换道超车。
“坚决做一体化,通过标准的API打通,”
“本质上,这就像是作战方式,以前传统的作战方式:陆军是陆军,空军是空军,炮军是炮军,各打各的。今天各打各的没有希望成功,你应该海陆空立体作战,”在访谈中,李飞飞谈到一个数据,通过云原生一体化HTAP的解决方案,瑶池目前已经可以在用户场景中实现:用50%的成本获得近两倍的性能提升。
根据李飞飞的现场演讲和群访,我这样理解四化的含义:
首先关于云原生化,开篇已经分析了这一趋势。目前,没有人会质疑数据库向云原生化演进的必要性和现实的紧迫感,成熟的存储计算分离技术、存储池化、计算池化带来高可用、高可靠弹性,现在进入云原生2.0阶段,秒级弹性、智能的负载预测、跨机的能力,是云原生的具体表现。
第二点,关于平台化。随着数据量爆发式地增长,数据形态的多元化,以及ToB客户业务的多样化,数字化深入带来业务多样化是必然的。在这个趋势下,传统的单一的数据库产品包打天下解决所有问题的时代已经结束。取而代之的是用一个平台化的思维去构建可能有多个引擎,基于平台来提供一个一整套的、一站式的能力和解决方案,这是平台化里最核心的思想。
这一点上,可以拿阿里云瑶池数据的产品举例:例如云原生数据库PolarDB,在CPU、内存、存储三层技术上解耦,更容易实现云上资源秒级扩容,同时保障了金融级高可用、高可靠能力。以及PolarDB和云原生数据仓库AnalyticDB打通融合,形成“云原生一体化”的HTAP数据库。
当下数据库平台厂商不只瑶池这一个品牌,包括Oceanbase、华为、腾讯等友商都有基于云的数据库产品;还包括众多创业公司。如果在商言商,平台化的另外一个逻辑是你只有坚持做平台化,从商业的角度才可能得到边际成本下降的逻辑,这也是一个很朴素的道理。
坚持和云平台去打通做软硬协同创新,不要仅仅在软件这一层去创新,而是要联动底下硬件的基础设施,拿阿里云瑶池举例的话,比如神龙、倚天芯片、智能网卡、智能压缩卡与数据库产品联动,能够实现一个新的产品高度,降低厂商成本,进而降低ToB用户成本。
接下来说,第三点则是一体化。
云原生数据库会将大数据PaaS平台之间的孤岛打破。比如离在线一体化、处理分析一体化,OLTP和OLAP通过Zero-ETL核心技术,在存储层数据自动地搬迁、增量同步。这些比较偏向技术层面的解决方案核心是把ToB客户的复杂性屏蔽掉。这一点也是在AIGC时代之后,将多模数据统一在一个存储引擎成为未来的必然趋势。
这里特别想强调下对于“集中分布一体化”的理解。集中式数据库、分布式数据库的区分越来越没有必要。因为从客户视角看,客户是不想做这个区分的,这个问题应该由数据库解决。数据库能够在集中式和分布式之间平滑切换。
李飞飞解释,数据库的分类应该是传统的数据库和云时代的数据库,在传统数据库时代有集中式、有分布式,在云的时代也有集中式和分布式。集中式和分布式和云原生不是对等的。
因为在传统数据库的部署形态下,资源没有被池化,资源也没有被解耦,把集中式和分布式打通理论上是做不到。但是云原生数据库形态下,因为资源被池化了、资源解耦了,从集中式到分布式是平滑的过渡。做集中式到分布式平滑迁移的时候,数据必须要做物理搬迁,但是原生的话,存储池化、云盘,数据在云盘里去做自动的,因为是无感知,这是分布式一体化具象的表现。关于这一点,业界目前的逻辑不够严谨。
除了集中分布以外还有离在线一体化,传统大数据BSP、在线分析数据库MPP,这个边界今天也在快速被打破。所谓的湖仓一体,本质就是把MPP和BSP有机融合起来。从客户视角留给复杂数据库厂商,把简单留给客户。客户不用再关心从在线到离线搬迁、同步。从客户业务视角,客户技术团队不需要关心细节,该在线就在线,该离线就离线,你有智能化的调度、混合负载的能力、在线离线工作的隔离机制来满足该在线就在线,该离线就离线,互相做到不干扰,不影响。这些是正在发生或者接下来要突破的技术。
最后是智能化,用一句英语概括是:“AI For DB,DB For AI。”
AI For DB就是用智能化的技术来做数据库的运维,比如异常检测、HA切换,参数调参。这个过程类似于AI和智能驾驶的关系。
DB For AI,例如在PolarDB里用自然语言来做查询。阿里云瑶池数据库会在今年下半年正式发布PolarDB全新的接口。用云原生多模数据库Lindorm举例,多模数据处理一体化的能力在AIGC趋势下是前提。
除此之外,李飞飞还强调了瑶池数据库在AI维度的边界。阿里云瑶池自己不会做模型,但提供灵活的模型导入的能力和接口,可以把第三方以及客户自己研发的模型能够一键导入到内核里,并且支持模型的数据库化的存储和使用,从而做各种各样的推理。这是AIGC趋势下,Lindorm非常大的发展机会。
2、智能化AI浪潮下:云原生多模数据库Lindorm迎来新机会
本次峰会上,关于AI、AIGC对于瑶池数据库的改变,也是记者当天关注的焦点,同时也是整个数据库团队高管在表达过程中的兴奋点。
总结来看,AI和AIGC的趋势下,瑶池数据库整体发生三个层面变化:
一是从运维管控层面,智能化AI平民化以后,运维和调优会变得更加智能化。智能的调参,智能的运维,高可用的检测告警,异常的报警,所有这些东西都会智能化,AI和数据化的深度结合。
在数据库里,瑶池数据库会支持AIGC的应用。李飞飞解释,这里有一个前提,技术上必须能够支持海量的多模态的数据,而不是单一形态的数据。Lindorm灵动就非常好地满足了这个条件。
概括一下:海量的多模态数据的低成本、高效率的存储和处理;并且支持足够的开放,用平台化的方式去支持灵动,去无缝导入第三方的模型。
第二个改变在于瑶池数据库可以更开放的迎接多模态数据模型的导入。
李飞飞演示了在Lindorm灵动里通过简单一个SQL就可以导入任何第三方的模型,包括开源的模型和用户自建的模型。用户导入的模型类似被放一个机密容器里,保证安全。导入模型以后,结合多模态数据,想象空间天花板被打开。
多模态数据高效低成本的存储,加上第三方灵活开放应用的导入,“任何事情几乎都可以实现,个人认为一定是个爆发点。”李飞飞打了个比喻来形容效果。他再次强调,阿里云瑶池数据库产品只是平台化数据的基础设施和模型导入和数据结合的能力。
第三个改变则是,多模态灵动的数据库,传统结构化关系型数据库,人和它的交互的方式也会发生很大的变化,会变得更加自然的、更加智能的交互。
在演示和采访中,李飞飞还描述了——用自然语言问有多少歌曲,多少歌名,自动生成SQL,这个技术和PolarDB深度结合,从自然语言可以产生SQL来控制怎么样产生AI模型。
“怎么让客户更容易接触AI,这是最重要的,客户可以更自然的来使用AI模型。”阿里云数据库产品事业部PolarDB for MySQL产品部负责人杨辛军认为。
李飞飞也在采访中表达了自己对AI的思考。他认为,AI也在成为事实标准,现实世界数字化以后,高效处理数据的能力与下游应用能否爆发密切关联。
他认为:过去一二十年是信息时代数字化,也就是说企业的信息化办公实现了数字化。AI到了临界点,一定会催生这么两件事,一个叫物理世界数字化,还有一个是生物世界数字化。数据库在这里会发挥什么样的关键作用?第一,多模态的数据一定会成为事实标准,因为宏观世界数字化、微观世界数字化各种各样的数字一定会层出不穷,数据的多样性就像生物有多样性,数字化的世界里数据也是有多样性的。
回到数据库领域,因此多模态数据的存储和处理会促进处理多模态数据库爆发式增长。
那想象的天花板空间在哪里?
阿里云智能CTO周靖人也在当天的演讲中提到一点:“把数据能够有效地管理起来,特别是今天我们如何做好数据的存储、数据的分析。如何使用好数据,也发生了一系列的范式的转变。”
似乎在最近一个月,我们从数字化一步跨入了AI的时代。结合对周靖人的演讲分析。
云计算是以算力为基础,以数据为核心,以技术为牵引——这是计算算力的服务化,这就像是电力服务化一样。算力服务化以后,使之有意义的是数据的注入,因此物理世界数字化、生物世界数字化进一步映射。而以ChatGPT为代表的多模数据应用和背后的算法架构成为趋势后,算力+数据+智能,这是期待已久的数据核裂变。
3、“四化”是战略,“四做”是策略
在四化的战略和技术趋势判断之下,李飞飞还明确提出了阿里云瑶池数据库将坚持“四做”:做深基础、做强核心、做精场景、做好体验。
做深基础很好理解,是指承载云原生化和平台化的理念,和云平台进行深入地结合。做强核心是要在云原生这个赛道上持续做全球数据库的领导者,加强核心产品的核心能力。做精场景就是要结合各行各业不同的场景,比如说运营商、金融、互联网,打造场景化的解决业务痛点能力的数据能力。最后是做好体验,统一API,简化客户用户使用以及开发者使用数据库的门槛,结合智能化的不断提升数据库的应用性。
从去年云栖大会到当下的几个月里,阿里云瑶池数据库在“四做”上有怎样的进展?
杨辛军回复ToB新势力:“今年主要的工作聚焦在做好企业客户在新功能上的使用体验。要一步一步,重点把体验做好,比如Serverless怎么样更好展示客户使用了多少钱,让客户每天能够精准控制。”
他提到很多客户会担心用了Serverless对支付的价格有影响和波动,“这是我们要做好企业的工作,怎么让用户更好地使用这些功能。‘四做’肯定是一步一步地随着产品的发展逐步演进。”
阿里云数据库产品事业部产品与解决方案部总经理王伟民回复ToB新势力:“在业务需要永久保留数据资产的前提下,如何降低数据规模不断增大带来的成本压力,是当下关键。
数据库的技术演进,核心还是用户价值创造的三个方面,更好的效率,更低的成本和更好的体验。”
理解下王伟民和杨辛军的回答,当下全面云原生化,更有效利用云上的弹性和计算资源;对于客户来说时间就是效率,就是金钱;用户会越来越注重体验,包括API统计、控制台的治理、甚至文档等。以及面向行业的具体解决方案打造和示例,这些李飞飞的团队需要在未来的时间里一步步稳扎稳打,向前推进。
最后提供一些根据阿里云瑶池数据库官宣的产品和技术情况,阿里云数据库目前拥有全球领先的技术和认证,中国市场份额第一,Gartner连续三年进入领导象限,AnalyticDB和PolarDB多次获得国家奖项。
据了解,瑶池数据库目前已经应用于政企市场,如服务自然人税收管理系统、全国60%的省级医保信息平台、中国邮政、上海证券交易所、南方基金等ToB客户。瑶池旗下的PolarDB提供了100%兼容MySQL/PostGreSQL的版本,并且提供高度兼容oracle的能力。
在产品上,瑶池将在2023年下半年发布在PolarDB上智能的人机接口的产品的能力(NL2SQL技术),此前这一技术获得了NL2SQL耶鲁大学榜单全球第一名。
4、彩蛋:阿里云瑶池数据库三大产品Logo美学:
三个核心产品数据仓库AnalyticDB、云原生数据库PolarDB、云原生多模数据库Lindorm,这是阿里云瑶池数据库的三个核心产品。
三个产品logo设计有一致性的地方,都是一个“D”,然后把D的左下角定为坐标系的原点,以左下角坐标系的原点开始
AnalyticDB的logo,以那个原点往右上看45度是斜着火箭发射的样子,火箭的两个小翅膀
同时让它又是很巧妙的是“A”,火箭往下扩和往下收,又相当于它是MPP数据库,它是传统MPP数据库做在线加速,同时它的底座又蕴含着无限的能量和数据,暗示MPP数据库离在线一体化、湖仓一体的逻辑,而且45度看就是“A”,所以是AnalyticDB的Logo。
PolarDB是比较容易理解的,原来起名的含义就是“极致”的,PolarDB的含义是极致的数据库,我们要做世界第一、世界最极致的数据库。然后又取了一个Polar bear,北极熊,所以它是熊头,从左下角原点往上45度看是熊头。
最后讲Lindorm,中文叫做灵动,我们Logo从左下角的原点往上斜向45度看是海浪的样子。海浪是从海里来的,意味蕴含大量的数据,而且是多模态的数据,海洋生物多样性是这个地球上最丰富的,远超陆地世界,故Lindorm icon采用了活泼的波浪样式。
另外还有一个小彩蛋,Lindorm的logo从右下往左上看是一个小恐龙头,也就意味着lindorm希望它能够像恐龙一样强大,但是又是个小恐龙,非常灵活。
以上是这三个logo设计的含义。