国产开源数据库迎来开展黄金期 清点2022

编者按

来,在基础软件畛域,“三驾马车”之一的 是无可争议的抢手赛道之一 用“花团锦簇”来描画数据库产业的开展也并不为过。各大厂商不止力图在 也在踊跃推进其数据库产品和相关处置打算的行业落地 以国产化、云为代表的厂商体现

随着信创树立的逐渐深化, 在顶层策略和行业开展的双轮驱动下,信创效果目前已逐渐进入片面推行以及外围系统适配革新阶段,其开展态势也由点及面,从传统强耦合的架构方式,转变为散布式多活的云计算架构。

借助散布式架构和私有云的崛起,还有国产化的驱动,国产数据库在过去数年间开展迅速。从需求的角度看,数字化转型的驱动和原有数据库的代替是数据库市场的两大增量。在此背景下, 也盼望减速产品迭代,从而满足各大行业企业信息基础设备更新的关键需求。

与此同时,咱们发现,细数 国产数据库厂商的开展历程,可以看到 最早都基于开源数据库构建底层代码, 近年来干流数据库产品纷繁拥抱开源,数据库厂商经过开源社区 极速取得正向反应有效放慢了产品开发和品质优化,构建了多方共赢的数据库生态。

不过也须要看法到,虽然国产化会带来数据库更新换代的机会,但出于常年开展的思考,干流的数据库用户在启动数据库选型时,还是会愈加器重数据库的技术上游性,技术放开性,在云端演进的速度,开源形式。散布式与云原生依然是国产数据库坚持上游的最关键方向,在2023年也将成为推进国产数据库技术开展的关键能源。

全体态势:以散布式、云原生、HTAP为开展重点

从数据结构来看,相关型数据库依旧占据主体,但近年来随着数据量激增以及数据类型一直丰盛的影响,相关型数据库的盛行水平呈降低趋向。非相关型数据库的市场份额有所优化, 在NoSQL畛域,以图、时序为代表的产品成为热点,一批初创企业和产品惹起关注。此外,NewSQL 是整合了相关型数据库和非相关型数据库的新型数据库。企业驳回 NewSQL 数据库须要较高的配件和学习老本,且须要承当产品不成熟带来的未知危险。

从技术架构来看,驳回集中式数据库的企业出现了向散布式架构过渡的趋向。随着云计算、人工默认、物联网等技术的遍及,发生了海量非结构化数据,业务场景中应答高并发、异构数据处置等需求一直涌现,散布式数据库因此迎来了开展的契机。当然散布式和集中式架构各有其实用场景,并不是便捷的非此即彼,代替与被代替的相关。

从部署形式来看,本地和云数据库混合部署成为干流,而在云数据库中,云原生数据库成为焦点。现阶段有肯定IT基础的企业会依据自身开展需求,采取本地与云数据混合部署的形式,从而在数据库读取与存储安保性和易用性上达成平衡。而在数据库厂商之间出现了更多的自有云原生数据库产品的竞赛,承载规模、弹性才干均成为了竞争要点,而Serverless方向有极大后劲成为后续开展重点。

从处置场景来看,HTAP作为新晋崛起的细分畛域成为业内新宠。以往大家比拟耳熟能详的是OLTP(在线事务处置)和OLAP(在线数据剖析)。过去普通以为这两大场景不能同时统筹,上班负载隔离和数据新颖度就是鱼和熊掌无法兼得的疑问。HTAP的出现却提供了一种新解。基于翻新的计算存储框架,HTAP数据库能够在一份数据上保障事务的同时允许实时剖析,防止在传统架构中在线与离线数据库之间少量的数据交互。这关于用户体验的改善来说至关关键。可以预感,HTAP将是数据库厂商竞争的重点畛域之一。

从商业形式来看,开源数据库附丽社区开展,开发人员可以依据开源容许协定在原始基础上修正或经常使用,防止了授权和服务费用。开源数据库的商业形式关键包含三种:其一,齐全开源式。借助基金会齐全托管;其二,开源版本和商业版本区分运营。经过运营开源版本积攒人才、打造品牌,再售卖商业版本失掉利润;其三,先开源后闭源。运作前期经过开源社区启动继续优化,之后中止社区的保养将产品闭源商业化。

背景:起步晚,但国际影响力逐渐优化

相较Oracle、Microsoft、IBM这些海外厂商,国际数据库行业起步较晚。因此很长一段时期内,国际很多企业高度依赖海外厂商研发的数据库系统。直到20世纪末,中国首个数据库“人大金仓 KingbaseES 数据库系统”降生,随后武汉达梦数据库、神通数据库系统等国产数据库系统相继面世,才打破这种格式。

2009 年,阿里巴巴成立阿里云,开局研发自己的数据库产品 AliSQL ,华为、腾讯等企业相继参与自主研发队伍,推出自有数据库产品 ,国产数据库开局进入蓬勃开展期。

2013年,棱镜门事情的迸发促使信息安保的自主可控回升为国度需求。国产数据库作为国产化代替的关键环节,在信创产业的指引下走上了开展的慢车道。

2019年,国产数据库在国际上迎来高光时辰。OceanBase 数据库打破数据库基准性能测试(TPC-C)环球纪录,成功登顶环球威望数据库评测机构 TPC(国际事务处置性能委员会)排行榜。

2021年,开源初次写入《中华人民共和国国民经济和社会开展第十四个五年规划和2035年远景指标纲要》。这为减速国产自研数据库技术迭代和生态构建提供了策略指引。国产开源数据库迎来了又一个百花竞逐、万紫千红的春天。

可以说,国产数据库虽无先发长处,但近年来却充沛体现出了其独有的开展后劲,在国际影响力上成功了极速优化,其中云数据库体现尤为杰出。

在Gartner 于日前颁布的“2022 云数据库控制系统魔力象限”中,被重复提及的中国云厂商有阿里云、腾讯云和华为云。

现状:机会清朗,国产品牌极速生长。

在非结构化数据激增和高并发计算需求的推进下,数据库行业正在进入以云数据库、散布式数据库为代表的新阶段。在此背景下,国产数据库也迎来了全体开展的黄金期。详细表如今:

1、市场占有率极速优化

受益于高人口基数与运行软件兴盛带来场景红利,国产数据库营垒日益弱小。依据中国信通院数据,2021年中国数据库市场规模为 309 亿元,占环球 5.4%。估量 2025 年中国数据库市场总规模将到达 688 亿元,2021-2025 年营收规模年复合增长率为 23.4%。

2、各路厂商纷繁入局

除了达梦、人大金仓等传统数据库厂商之外,云厂商、初创企业、跨界厂商也在发力国产数据库赛道。如前文提到的,像阿里、腾讯这样的云厂商占据云生态长处,借力互联网业务的极速开展,搭建自研云数据库平台抢占市场;再有,初创企业如PingCAP、巨杉等附丽于新兴数据库需求和新技术架构成功蓬勃开展;最后像中兴、浪潮这样的厂商虽然并非数据库专精,也在尝试跨界规划企业级数据库市场。

3、信创落地减速开展

国产数据库作为信创的关键环节,随国产化代替深化推进必将遭到更多关注。尤其是随着信创效果逐渐进入外围系统适配革新阶段,国产数据库市场的大幅优化是肯定结果。另外,十四五系列规划中提及数据库的相关政策合计19件,笼罩金融科技、默认制作等各行业畛域,为国产数据库运行翻新提供了政策依据。

4、资本青眼成新蓝海

进入开展慢车道的国产数据库成为投资新瘠田,全体开展前景被资本市场看好。依据观研报告网颁布的《中国数据库行业开展趋向钻研与未来投资剖析报告(2022-2029年)》显示,2021年我国数据库行业共出现投资85起,投资金额最高的为12月,当月出现投资事情9起,已披露投资金额达86.57亿元。

5、细分市场各有所长

国产数据库较为典型的两大细分市场是 。集中式数据库的市场介入者关键为传统数据库厂商,散布式数据库的玩家关键为云厂商和新兴厂商。两者的市场格式目前均呈诸侯割据、部落林立的局面,但随着行业开展的深化,市场份额必将走向集中。另外,值得关注的是,虽然相关型数据库照旧占据市场主体,但在非相关型数据库畛域,有一批初创企业深耕图数据库、时序数据库等新赛道,旗下产品在场景验证上扩展了原有的经常使用空间,在各自的细分畛域做出了亮眼体现。

国产开源数据库清点

在过去的一年中,国产数据库行业出现了诸多变动。随着信创效果继续落地,投融资此起彼伏,开源日趋成为数据库生态构建的关键力气,国产数据库行业也出现出欣欣向荣的姿态。在新旧交替的时期节点,咱们一同回忆一下近一年来体现抢眼的若干国产开源数据库。

TiDB 是由PingCAP 公司自主设计研发的、兼容 MySQL 协定的开源散布式 HTAP 数据库,允许本地和云部署两种方式。

成立于2年的PingCAP 公司自创 Google Spanner 及 F1 论文的成功,TiDB 在 Github 上开源,从仅有 SQL 层及 KV 层 的 beta 版本到往年正式颁布的 6.0 版本,一直围绕着为用户提供一栈式 OLTP、 OLAP、HTAP 处置打算的指标演进。2022 年,TiDB不只在产品树立上有多项打破,也取得了国际认可。

OceanBase是由蚂蚁金服、阿里巴巴自主研发的金融级散布式相关型数据库,于2021 年6月正式开源。

OceanBase 发端于 2010 年,运行于支付宝所有外围业务以及阿里巴巴淘宝业务。从 2017 年开局面向外部客户服务。2020 年 6 月 8日,蚂蚁个人将自研数据库产品 OceanBase 独立启动公司化运作。2021 年 6 月,OceanBase3.0 版本颁布并正式开源。2022 年,OceanBase在产品打磨、市场拓展和生态构建中均取得了不俗效果。

PolarDB是阿里云自研的云原生相关型数据库,驳回的是散布式共享存储架构。

2009年,阿里个人依据自身业务开展需求提进来IOE,并推出新产品TDDL(Taobao Distributed>

openGauss 是由华为自主开发的一款开源相关型数据库控制系统,具备多核高性能、全链路安保性、默认运维等企业级个性。

华为在2019年9月宣布将对其数据库产品开源,开源数据库的称号即openGauss。2020年6月,openGauss数据库源代码正式对外放开,为企业提供了更多的开源的数据库选用。openGauss以开源社区为中心为开发者提供学习交换的平台,一直优化openGauss的行业影响力和知名度。时至今天,其生态树立效果引人瞩目。

TDengine 是涛思数据专为物联网、车联网、工业互联网、 IT 运维等设计和优化的一款散布式、允许 SQL 的时序数据库,其外围代码包含集群配置所有开源。

2017年,涛思数据开局研发TDengine;2018年8月,TDengine首款产品真正交付用户经常使用;2019年7月12日,涛思数据正式宣布将TDengine的内核(存储和计算引擎)以及社区版100%开源;2020年

,三个月内成功两轮千万美元融资;2022年,达成“三面开花”:用户数量翻了一番、三款新产品颁布、并在 GitHub 上点亮 20,000 Star。

gStore 是一种原生基于图数据模型( Native Graph Model)的 RDF 数据控制系统,由邹磊传授指导的北京大学王选计算机所数据控制试验室( PKUMOD )研发。

gStore 系统源于2011年北京大学邹磊传授在VLDB宣布的论文:“gStore: Answering SPARQL Queries via Subgraph Matching”。其团队在坚持图数据控制畛域一直原始学术翻新的同时深耕图数据库系统,坚持开源gStore图数据库系统的继续更新。gStore目前提供一键装置的可下载版本、拆箱即用的云端系统和与多个国产自主可控的计算平台(鲲鹏、飞扬、海光、兆芯)兼容。

10月1日,面向大规模常识图谱运行的原生图数据库系统gStore 1.0版本正式上线颁布。

OpenMLDB 是由第四范式自主研发的开源机器学习数据库,提供消费级数据及特色开发全栈 FeatureOps 处置打算。

2021 年,OpenMLDB 的外围开发团队将第四范式闭源商业产品中的数据控制和特色工程的外围模块启动了形象、增强、以及减少了诸多社区友好化个性,启动了二次开发,颁布构成了当天的开源名目 OpenMLDB。OpenMLDB 脱胎于经过长达五年通常测验的商业化产品,并且在该畛域具备少量的阅历积淀和共同了解。如今,OpenMLDB 立足于开源放开的社区启动开展,希冀协助更多的企业低老本高品质成功人工默认转型。

未来趋向

关于2023年国产数据库的开展趋向,PingCAP副总裁刘松启动了预测。

HTAP 曾经成为越来越抢手的关键技术,关键数据库上游者都曾经提供了Serverless 的翻新版本,关键的云数据库厂商也都在提供HTAP才干,Serverless 由于提供了极致的扩张性和极低的门槛,会变成云数据库未来3-5年风向标。领有环球业务的TiDB和国产云数据库大厂,都在减速环球扩展,都在投资Serverless

为例,关键须要应答如下应战:其一,如何做成一个有扩展性的HTAP,能够应答准PB 级别的数据量;其二,如何处置TP和AP互不搅扰这个疑问,以防止AP 剖析影响到在线买卖系统;其三,如何保障数据新颖度,并做到数据访问凑近零提前;其四,如何让用户的经常使用老本较普通数据库更低;其五,如何经过默认优化器降低门槛;其六,如何处置HTAP数据库与用户现有数据库技术体系的集成疑问。

关于国产数据库的开展前景,刘松谈到,“从中国市场看,2023年是中国经济减速开展的一年, 数字化和国产化两个驱能源会加大它们的杠杆效应,从技术角度看,云数据库会减速开展,HTAP 也会变成更多企业用户的翻新选用,开源的影响力会继续扩展,数据库与AI的结合会十分有构想力 从行业角度看,互联网行业的复苏会推进数据库在新经济畛域的业务增长,金融,保险,新批发,制作业,公共服务都会有继续增长的国产数据库需求,中国数字原生企业的出海趋向也会减速,这也会带动国产数据库出海的速度和驳回。

结语

据 DB-Engines 数据显示,自2021年1月起,开源数据库的环球部署初次超越了商业数据库。放眼如今的国产数据库市场,咱们可以看到泛滥优质 相关技术运行一直走向深化 加之信创的行业笼罩面越来越广,如何在新一轮产业反派中拔得头筹, 发明一个放开的肥壮的 书写属于咱们自己的华彩篇章

国产开源数据库,战役在云原生时代 - 知乎 (zhihu.com)

2022年数据库行业钻研报告 国产数据库厂商百花齐放 - 报告精读 - 未来智库 (vzkoo.com)

2022年中国数据库排行榜年初清点 - 墨天轮 (modb.pro)

您可能还会对下面的文章感兴趣: