加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 01、为什么Serverless将成为云上数据库服务的标准形态
    • 02、Serverless颠覆了数据库使用方式和体验,新兴行业或新兴业务场景是突破口
    • 03、Serverless是数据库厂商未来的必争之地,但发展策略和产品能力存差异
    • AWS
    • 阿里云
    • PingCAP
    • MongoDB
    • 04、Serverless数据库发展趋势展望
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

Serverless:数据库行业正在悄然掀起的一场革命

2023/01/10
1432
阅读需 23 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

调研 | 洪逸群

撰写|洪逸群

在AWS于2014年推出函数计算Lambda,为用户提供事件驱动、随用随付的计算服务之后,Serverless逐渐被业内所了解和关注。这些年来,从计算,到存储,到消息队列、API网关等应用集成服务,公有云厂商的各项服务也逐渐被Serverless化。

而现在,Serverless数据库也成了国内外各家公有云厂商,以及一些独立数据库厂商开始争相布局的领域。除了早已将数据库Serverless化的AWS,其它厂商如阿里云、腾讯云、MongoDB、PingCAP、Snowflake、Databricks均在最近一两年推出了相应的Serverless数据库服务。一时间,Serverless似乎成了数据库发展的大势所趋。

那为什么数据库会向Serverless的服务形态演化?Serverless数据库对于企业和开发者等用户而言有哪些价值?国内外主要厂商在Serverless数据库这个方向的思考和布局是怎样的?本篇文章将会中重点探讨这些问题。

01、为什么Serverless将成为云上数据库服务的标准形态

Serverless是云计算发展到深入阶段的必然产物

在20世纪初,云计算伴随大量互联网公司的快速兴起而产生。面对这些数字原生企业比以往更多、更复杂、更多变的对IT资源的需求,传统自购服务器硬件,并做大量规划、部署、配置、运维工作的方式逐渐变得难以应对。

云计算厂商由此开始建立起庞大的数据中心,并通过资源虚拟化、多路复用等技术,将运行应用程序所需要的各类软硬件资源以服务的形式提供给企业用户,从而帮助用户实现3个关键的目标:1)减少围绕IT资源的大量管理和运维工作;2)减少预先规划,更快更方便地扩展资源;3)降低使用成本,按月、天,甚至按小时租用服务。

然而,在过去多年中,云计算厂商提供的IaaS、PaaS服务虽然在一定程度上实现了上述目标,但用户依然需要处理大量跟基础设施相关的工作,资源扩展的弹性还不足,使用成本也仍然较高。这主要由以下三点因素引起:

    在资源方面,云计算使用虚拟机、容器等虚拟化技术,将存储、计算、网路等资源虚拟化,这给用户增加了很多管理虚拟化资源的工作,并需要人工做资源的预估、扩展。在应用方面,越来越多的应用程序是基于微服务架构而构建,这些微服务代表着业务当中具体任务或流程,如图片上传、网站点击等,为这些简单的程序去执行更繁重的资源配置工作难免本末倒置。对于有状态服务,如数据库,当其被迁移到云端时,由于需要让数据库在复杂的云资源环境中保持数据同步,而这个过程会消耗大量资源,并且此前数据库在云端冷启动时要花费较长时间,因此数据库在此前一直难以有效利用云的优势。

为了解决上述问题,云计算业内提出了Serverless的概念,并且以2014年AWS Lambda函数计算服务的推出为标志性事件,云计算厂商近年来开始逐步将存储、计算、数据库,以及消息队列、API网关等应用集成服务等相关的云服务全面Serverless化。

Serverless是一种全新的提供云服务的理念,通过多种技术和功能设计的组合,Serverless云服务在提供给用户时,可以做到让用户对服务器无感知,也即无需关心和处理任何跟资源管理相关的工作;同时,存储、计算等底层资源可以做到完全分离,并根据用户需求随启随停和近乎无限的扩展,其计费方式也转变为按使用量而不是预置的资源大小。

Serverless服务使得开发者可以专注应用创新,因此得以被越来越多的采用。随着这一过程的持续演进,云计算也显示出了逐渐从IaaS、PaaS服务转向下一代范式Serverless服务的趋势。

图1:Serverless发展历程及重要事件


各路厂商加快布局Serverless数据库,助推其成为云上数据库服务的标准形态

随着Serverless相关的技术、服务模式不断成熟,以及用户需求逐渐增加,数据库实现Serverless化的种种障碍已经逐渐被消除。在此背景下,国内外主流的云厂商,如AWS、Azure、GCP、阿里云、腾讯云,以及部分领先的独立数据库厂商,如MongoDB、PingCAP、CockroachDB、Snowflake,近年来纷纷布局Serverless数据库服务,并在最近一年加速投入。

自此,Serverless数据库这个Serverless生态中非常关键,也是最后一个待完善的拼图已经完成。用户因此可以在云上使用云计算厂商以及生态厂商共同提供的全栈Serverless解决方案,将云服务免维护、高弹性、低成本的优势利用到极致。而随着用户逐渐转向和适应Serverless的云服务,Serverless数据库也将逐渐成为云上数据库服务的标准形态。

02、Serverless颠覆了数据库使用方式和体验,新兴行业或新兴业务场景是突破口

Serverless数据库是指遵循Serverless计算范式而设计的各种类型的数据库,其通过对数据库底层的基础资源、以及数据库本身的复杂运维进行高度抽象,结合资源池化与弹性扩展、高可用、等特性,从而让企业用户可以基于对数据库的使用情况自动扩展和付费,而不是预置和维护大量的服务器或资源容量。

Serverless数据库能够给用户提供全新使用方式和体验通常而言,Serverless数据库具备如下四点关键的特性优势:

1) 按量计费且费用透明。

在Serverless数据库服务形态下,用户仅需为每次事务处理或查询分析所消耗的CPU、存储、网络带宽、磁盘I/O等资源使用量而付费,不用则不产生费用。这为用户节约了大量成本,尤其是在运行负载不稳定或不可预测的应用程序时。此外, Serverless数据库的计费方式完全透明,用户可以清晰了解资源消耗量,并计算准确的投入产出比,即ROI。

2) 极致弹性。

Serverless数据库可以跟随业务复杂变化自动匹配所需资源,在很短的时间内大幅扩展应对流量和负载高峰,也可以在没有需求时缩到0。从而帮助用户的应用程序总是能拥有合适的资源以保持最佳运行状态,而不用过度配置。

3) 使用简单。

Serverless数据库屏蔽了基础设施的复杂性,用户使用时不用做资源选型和容量预估,也不用再去关心底层的基础设施的管理维护。用户因此可以从繁琐的资源管理工作中彻底解放出来。

4) 高可用。

Serverless数据库能够在任何计算实例、网络,或者硬件发生故障时,通过多副本以及自动故障切换能力,保障用户的的数据始终可用,并且数据总是正确无误。在实际应用中,Serverless数据库的这些优势能给企业内不同类型终端用户带来的价值和使用体验的改变也将是颠覆式的:

对于应用开发者,他们可以在有需要时立即创建一个数据库实例,而无需关注规划和配置底层资源,开发者因此可以专注于业务和应用的创新,更快、更流畅地构建应用,而不用处理购买、部署和维护服务器、数据库等非常耗时,且与应用开发本身无关的工作。

对于数据分析师,他们不用再去向公司的IT部门申请数据库,避免繁琐的流程,以及对专业人员部署和维护数据库的依赖。通过自行创建和使用数据库,数据分析师可以直接登陆系统输入SQL,从而加速数据洞察,帮助业务部门更好地用数据赋能业务。并且随着数据分析门槛的降低,市场上会出现越来越多的数据分析师。

对于DBA,由于Serverless数据库厂商会承担大部分数据库管理运维的工作,DBA在数据库使用全生命周期很多环节的工作,如果安装部署、容量管理故障处理等,会被弱化,仅需专注在数据库日常使用中部分监控、备份、安全审计等工作。

图2: Serverless数据库的特性优势、用户价值以及适用场景

Serverless数据库当前适用的主要企业类型和应用场景

由于传统企业通常已经预置了大量软硬件资源,以及用户使用习惯不易改变等因素,Serverless数据库在传统企业现有业务中的采用将需要一定的过程,但在以下一些新兴行业企业或新兴业务场景,Serverless数据库正在快速展现其优势,并占据重要位置。

1) 初创公司或大型企业创新业务部门的有较大不确定性的业务。

这些业务在发展初期规模还很小,Serverless数据库可以帮用户以很低的门槛启动,并且将使用成本控制在较低的水平。而随着业务发展,企业很有可能出现业务规模快速扩大的情形,Serverless数据库也能够对数据库容量进行快速扩展,支撑业务发展。

2) 大促等需要极高资源弹性的营销活动。

例如在电商“双十一”等大规模促销活动中,企业可能需要应对比平日高几十甚至上百倍的流量激增。此时,Serverless数据库可以自动扩展容量以应对负载高峰期的需求,而当活动结束,又可以将容量缩减至平日水平,实现极高的弹性。

3) 大型公司内部众多的小型低频业务。

大型公司内部存在很多小型低频的业务,如财务审计、业务规划等,这些业务仅在每年或每月少数时间段需要进行集中数据处理,Serverless数据库按使用量计费可以最大程度地为这些业务降低成本。4) 多租户的SaaS应用。在SaaS应用中,SaaS软件提供商通常会为每个租户配置单独的数据库,当有成百上千甚至更多的数据库时,其管理成本非常高昂。而当使用Serverless数据库,每个租户的数据库容量都可以按需自动扩展,在不用时,数据库则被暂时关闭节约成本。5) 轻量级应用程序的测试、验证和评估。Serverless数据库可以帮助这类应用在几分钟内快速构建数据库并连接至应用,从而快速构建应用程序原型,验证功能,并且所需付的费用极低甚至免费。

03、Serverless是数据库厂商未来的必争之地,但发展策略和产品能力存差异

Serverless已经成为数据库领域的一个重要趋势,我们也看到,国内外主要的公有云厂商和一些领先的独立数据库厂商在最近一两年加速布局Serverless数据库。但由于各自的厂商性质、数据库内核能力的差异,各厂商在该领域的发展策略和产品能力也存在较显著的差异。

对公有云厂商而言,Serverless将成为云服务的默认范式,一些头部的云厂商在最近一年已经 “All in Serverless”,因此其更侧重提供全栈的Serverless解决方案。而Serverless数据库只是其中重要的一环,并且其Serverless数据库多由传统数据库延续而来。此外,很重要的一点是,由于公有云厂商在硬件资源方面有着巨大的投入,其商业策略必然还会以提高存储、计算等资源服务收入为核心,相关数据库服务也会与其自家的资源绑定。以AWS和阿里云为例:

AWS

    :AWS是业内最早探索Serverless的公有云厂商,其将Serverless架构定义为三层服务类别:计算、应用集成和数据存储,并以Serverless的形式为用户提供运行代码、管理数据和集成应用程序的完整解决方案。AWS的Serverless数据库包括:关系型数据库Aurora Serverless,键/值和文档数据库DynamoDB,图数据库Neptune,数据仓库Redshift等。以典型产品Aurora Serverless为例,这是一款基于MySQL和PostgreSQL构建的关系型数据库,以大规模事务处理能力为核心特色的基础上,加入了Serverless数据库的功能特性。

阿里云

    • :阿里云自2017年推出函数计算FC开始正式布局Serverless,到2022年,阿里云已经对包括应用集成、大数据、数据库、存储、微服务应用、AI在内的核心产品实现了全面Serverless化。

阿里云的Serverless数据库包括:关系型数据库PolarDB、数据仓库AnlyticDB以及基于开源数据库的RDS系列。PolarDB为阿里云自研,其100%兼容MySQL、PostgreSQL、高度兼容Oracle语法,具备较完备的企业级能力和丰富的运维功能;AnlyticDB则主要用于大规模数据的查询和分析。

对于独立数据厂商而言,Serverless是数据库产品服务形态顺应行业大势的进化。相比公有云厂商的产品,其Serverless数据库具备了云中立的先天优势,用户可以跨多个公有云使用。同时,我们看到,目前市面上由独立数据库厂商推出的Serverless数据库通常都具备独特的数据库内核能力优势,并从多个功能层面持续优化,提高开发者体验。以PingCAP和MongoDB为例:

PingCAP

    • :PingCAP 是业界领先的企业级开源分布式数据库厂商,其核心产品TiDB是一款同时支持在线事务处理与在线分析处理(HTAP )的融合型分布式数据库产品,具备一键水平伸缩,强一致性的多副本数据安全,分布式事务,实时 OLAP分析等重要的数据库内核层能力,在大规模数据处理、实时分析等场景具备优势。因此,TiDB也被中国平安、美团、Shopee、Airbnb等国内诸多头部公司采用。

PingCAP于2022年年末推出了Serverless数据库TiDB Cloud Serverless Tier,提供TiDB数据库内核层能力的同时,对TiDB原先的技术架构做了针对云资源的深度改造和优化,在充分利云厂商各种成熟服务的基础上,使数据库的存储、计算节点可以以非常低的成本进行快速扩展。同时,TiDB Cloud Serverless Tier能够很好适应云上多租户的场景,支持多租户资源完全隔离。因此,TiDB Cloud Serverless Tier可以做到仅用20秒的时间就创建一个 TiDB 集群,并且如果用户长时间不使用,再次连接时也仅需数百毫秒就可以唤醒完整的集群。

当然,作为一款真正的Serverless数据库,TiDB Cloud Serverless Tier同样具备完全无需用户运维,无需做容量规划,在需要时,可以根据流量自动进行扩缩容的特性。并且,很重要的一点是,TiDB Cloud Serverless Tier可以真正按使用量付费,不使用时,即使集群仍在运行,也不产生费用,这不同于有些Serverless数据库只要集群被创建出来,即使户不使用也会按集群规模收取费用。

此外,TiDB Cloud Serverless Tier近期还推出了自然语言查询工具Chat2Query, 用户可以用直白的语言文本生成SQL去做相应的数据查询,从而让用户可以以非常容易的方式从数据中获取洞察,并节省时间。

MongoDB

    • :MongoDB是一款非常流行的文档数据库,其将数据存储在文档中,并将文档映射到大多数流行的编程语言,允许开发人员快速开发他们的应用程序,同时也可以实现类似关系数据库单表查询的绝大部分功能。

MongoDB 在2022年发布了其Serverless数据库MongoDB Atlas Serverless,其包含 MongoDB 数据库内核的全部功能,并着重解决了一些Serverless数据库使用中的不足,提升用户体验,如随时待命避免冷启动问题;实行分层定价,为更高的使用率提供折扣;部署灵活,允许用户在Serverless和专用基础实施之间来回切换工作负载等。

04、Serverless数据库发展趋势展望

Serverless数据库给行业带来的革命才刚刚开始,我们认为随着用户对其价值以及实际采纳度的逐步提高,Serverless数据库领域将会发生以下几点重要的变化趋势。

    Serverless数据库赛道会有更多的厂家加入,竞争会逐渐加剧,但Serverless改变的是数据库的使用方式和体验,数据库内核的能力才是支撑业务实现的根本。因此,我们认为只有那些具备突出的数据库内核能力,并不断将提升开发者使用体验作为核心策略的厂商,才能够在该赛道脱颖而出。技术总是向更加简化和无感化,从而提升开发者效率的方向发展。在未来较长的时间周期里,数据库软件产品的形态也许仍然会保留,存在于一些企业特定的业务场景里,但企业业务上云已经成为一个不可逆的趋势,随着上云进程的加速,Serverless数据库的服务形态将逐渐被用户采用,因此更具前景。对开发者而言,目前还需要处理大量应用部署、CI/CD、监控、流量分发等方面的流程性工作。未来,存储、计算、网络、数据库等基础软硬件肯定将实现全栈Serverless化,而所有跟应用开发相关的基础软件,以及开发工具也都将实现全服务化时,应用开发的门槛会被降到更低,开发者可以将 100% 的时间都放在业务逻辑的开发上,进一步提高生产力。这也是以Vercel为代表的一些美国公司正在重点布局的方向。Open AI创造的AI Generated SQL能力和Serverless数据库的结合有很大想象空间。因为当用户能够通过AI使自然语言转化为SQL代码的时候,如果底层有免运维、弹性扩展、并且可以按量计费的数据支撑,那数据的查询分析可以变成任何人都可以实现的操作,人人都是数据分析师将成为现实。既然技术能力已然具备,相信这种数据查询分析方式将快速被很多业务人员采用。

相关推荐

电子产业图谱

爱分析是一家专注数字化市场的研究咨询机构,成立于中国数字化兴起之时,致力于成为决策者最值得信任的数字化智囊。凭借对新兴技术和应用的系统研究,对行业和场景的深刻洞见,爱分析为数字化大潮中的企业用户、厂商和投资机构,提供专业、客观、可靠的第三方研究与咨询服务,助力决策者洞察数字化趋势,拥抱数字化机会,引领中国企业数字化转型升级。