近期,俄(e)烏沖突持續焦灼,美歐也(ye)一直(zhi)沒閑著,除了直(zhi)接提供(gong)武器物資,制(zhi)裁(cai)大(da)棒一刻(ke)沒停(ting)下。3月3日(ri),烏克蘭(lan)副總(zong)理米哈(ha)伊洛·費多(duo)羅夫(fu)在社交媒體向(xiang)50多(duo)家美國(guo)科技(ji)(ji)公(gong)司發起(qi)呼(hu)(hu)吁(yu),用科技(ji)(ji)戰(zhan)逼退俄(e)羅斯(si)(si)的軍隊,呼(hu)(hu)吁(yu)這些企(qi)業(ye)(ye)斷(duan)供(gong)俄(e)羅斯(si)(si)。短短三小時內,甲骨文就第(di)一個宣(xuan)布,暫停(ting)俄(e)羅斯(si)(si)所(suo)有業(ye)(ye)務(wu)。緊隨(sui)其后,IBM、英特爾、谷歌、蘋果、微(wei)軟(ruan)、Facebook、亞馬遜、戴爾等20多(duo)家美國(guo)科技(ji)(ji)公(gong)司也(ye)宣(xuan)布對俄(e)羅斯(si)(si)進行(xing)制(zhi)裁(cai)。

數(shu)據(ju)庫是(shi)IT行(xing)業(ye)的(de)(de)核心環節,而(er)甲(jia)骨文(wen)(wen)是(shi)商(shang)業(ye)數(shu)據(ju)庫最有(you)代表性的(de)(de)科(ke)技巨(ju)頭。甲(jia)骨文(wen)(wen)與IBM、EMC公司合(he)作,形成(cheng)了一條完整的(de)(de)數(shu)據(ju)庫產業(ye)鏈,稱作“IOE”架(jia)構。可(ke)喜可(ke)賀的(de)(de)是(shi),我(wo)(wo)國(guo)早在10多年(nian)前就開始布局了“去IOE”化(hua)。2021上半年(nian)中國(guo)公有(you)云關系型數(shu)據(ju)庫規模6.7億(yi)美元,叱(chi)咤風云的(de)(de)甲(jia)骨文(wen)(wen),則僅占3.6%。中國(guo)企業(ye),有(you)了屬于自己的(de)(de)數(shu)據(ju)生態。但是(shi),數(shu)字經濟的(de)(de)不斷(duan)發展,我(wo)(wo)國(guo)自主的(de)(de)數(shu)據(ju)庫產業(ye)仍遠遠不夠(gou)。

本(ben)期的智能內(nei)參,我們(men)推(tui)薦(jian)招商證券的報告(gao)《數據(ju)庫(ku)深度復(fu)盤與展望》,七大維(wei)度全(quan)面梳(shu)理數據(ju)庫(ku)發展歷程,分析國內(nei)數據(ju)庫(ku)市(shi)場發展趨勢。

來源 招商證券

原標題:

《數據庫深度復盤與展望》

作者:劉玉萍

一、七大維度看數據庫發展歷程

回顧數據庫70年發展歷程,分布式、云計算、人工智能等創新技術和基礎設施的發展陸續為演化注入新活力。以下我們將從數據模型邏輯、技術架構、需求功能、部署方式、存儲介質、商業模式、數據庫治理模式等七大維度對(dui)數據庫發展脈(mo)絡進行(xing)詳細闡(chan)述,理清行(xing)業演化邏(luo)輯與發展趨勢(shi)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

數據庫發展歷程

數據模型的演化本質由底層數據規模、邏輯關系、類型等驅動,其路徑是:層次->網狀->關系->關系、非關系并行。 在當前關(guan)系、非關(guan)系并行(xing)時代,新型NewSQL與(yu)多模數據(ju)庫快速發(fa)展。傳統SQL受限于(yu)(yu)其(qi)拓展性,在大數據(ju)發(fa)展下逐(zhu)漸面臨(lin)瓶頸, 而(er)NewSQL提(ti)供了(le)與(yu)NoSQL相(xiang)同的可擴展性,而(er)且仍(reng)基(ji)(ji)于(yu)(yu)關(guan)系模型,保留(liu)了(le)極其(qi)成熟的SQL作為查詢(xun)語言,從而(er)保證了(le)數據(ju)的強(qiang)一致性;同時,基(ji)(ji)于(yu)(yu)分布式架構,對接多種(zhong)數據(ju)模型引擎,避免搭建多種(zhong)類數據(ju)庫的多模數據(ju)庫快速發(fa)展。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

數據庫模型發展路徑

數(shu)(shu)據(ju)(ju)(ju)庫(ku)前期的(de)演化史本(ben)質(zhi)上(shang)是(shi)關系(xi)型數(shu)(shu)據(ju)(ju)(ju)庫(ku)的(de)演化,關系(xi)型數(shu)(shu)據(ju)(ju)(ju)庫(ku)已統治市場超過(guo) 50年。關系(xi)型數(shu)(shu)據(ju)(ju)(ju)庫(ku)以二維表(biao)形式存(cun)儲實體和關系(xi),具有易(yi)(yi)理(li)解、易(yi)(yi)使(shi)用、易(yi)(yi)維護,自(zi)1970年誕(dan)生(sheng)以來,逐步成為(wei)業界的(de)霸主。時(shi)至今日,關系(xi)型數(shu)(shu)據(ju)(ju)(ju)庫(ku)不斷融(rong)入分(fen)(fen)布式、云原生(sheng)、AI等(deng)新興(xing)技術持續進化,仍是(shi)數(shu)(shu)據(ju)(ju)(ju)庫(ku)的(de)主流,據(ju)(ju)(ju)DB-Engines熱度排名(ming)(截至2022/02),前四(si)大數(shu)(shu)據(ju)(ju)(ju)庫(ku)Oracle、MySQL、Microsoft、PostgreSQL均為(wei)關系(xi)型數(shu)(shu)據(ju)(ju)(ju)庫(ku),且(qie)分(fen)(fen)數(shu)(shu)遙遙領先。

SQL是關(guan)(guan)系(xi)型數(shu)據庫(ku)的(de)(de)標準語(yu)(yu)言,相比C、Java、Python等編程語(yu)(yu)言,SQL貼合口語(yu)(yu)的(de)(de)設計(ji)使得其代碼復雜(za)度大大簡化、便于數(shu)據分析人(ren)員上手,同時嵌(qian)入(ru)式的(de)(de)設計(ji)也保證(zheng)了SQL可以被其他編程語(yu)(yu)言輕(qing)松調用,據TIOBE統(tong)計(ji),SQL在近(jin)20年穩(wen)居TOP10編程語(yu)(yu)言榜單。關(guan)(guan)系(xi)型數(shu)據庫(ku)的(de)(de)二維表數(shu)據存儲模式為關(guan)(guan)系(xi)型數(shu)據庫(ku)的(de)(de)流行(xing)普及提供(gong)了環境基礎;而SQL語(yu)(yu)言的(de)(de)流行(xing)也反哺了關(guan)(guan)系(xi)型數(shu)據庫(ku)的(de)(de)推廣,兩者相輔相成,共贏(ying)于數(shu)據庫(ku)市場(chang)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

DB-Engines流(liu)行(xing)數(shu)據(ju)庫排(pai)名(ming)前十

隨(sui)著互聯(lian)(lian)網業(ye)務規(gui)模(mo)快(kuai)(kuai)速增(zeng)長,擁有靈(ling)活拓展(zhan)與(yu)(yu)高(gao)讀寫(xie)并(bing)發能(neng)(neng)力(li)NoSQL數據(ju)(ju)庫得到快(kuai)(kuai)速發展(zhan)。由于傳統(tong)的關系(xi)型(xing)數據(ju)(ju)庫在(zai)保證(zheng)數據(ju)(ju)強一致與(yu)(yu)系(xi)統(tong)可用(yong)的前提(ti)下(xia),其水平擴展(zhan)能(neng)(neng)力(li)受(shou)到限制;非關系(xi)型(xing)數據(ju)(ju)庫NoSQL則是基于分布式存儲原理(li),放棄(qi)了(le)傳統(tong)的關系(xi)模(mo)型(xing),在(zai)一致性(xing)與(yu)(yu)可用(yong)性(xing)之間(jian)尋求平衡,從而保證(zheng)了(le)系(xi)統(tong)地(di)靈(ling)活拓展(zhan)與(yu)(yu)高(gao)讀寫(xie)并(bing)發能(neng)(neng)力(li)。隨(sui)著社交媒體等互聯(lian)(lian)網業(ye)務快(kuai)(kuai)速發展(zhan),數據(ju)(ju)量激增(zeng),傳統(tong)關系(xi)型(xing)數據(ju)(ju)庫性(xing)能(neng)(neng)逐漸(jian)達到瓶頸,因此,以保證(zheng)拓展(zhan)性(xing)與(yu)(yu)高(gao)并(bing)發性(xing)能(neng)(neng)為前提(ti)地(di)NoSQL數據(ju)(ju)庫得到快(kuai)(kuai)速發展(zhan)。

為了應對數據的海量增長并追求更低的擴容成本,數據庫由單機、集中式向分布式架構快速發展。隨(sui)著信息化水(shui)平快速提升(sheng),對數據(ju)庫(ku)的存儲、讀寫并(bing)發、擴(kuo)容要(yao)求更(geng)高(gao),集中式架(jia)構的“Scale Up”縱向擴(kuo)容機制面(mian)臨硬件性能瓶頸,因此“Scale Out”式的橫向擴(kuo)容分(fen)布式架(jia)構成(cheng)為新趨勢,通過(guo)網絡將物理分(fen)散(san)的數據(ju)庫(ku)單元(yuan)連接為邏輯上的統一整(zheng)體。從(cong)集中式到(dao)分(fen)布式的演進(jin)降低了對硬件性能的要(yao)求,使得企業數據(ju)庫(ku)拓展成(cheng)本大幅降低。

分布式架構(gou)由共(gong)享磁(ci)盤、共(gong)享內(nei)存(cun)(cun)(cun)架構(gou),逐步向純無(wu)共(gong)享架構(gou)發展,在無(wu)共(gong)享架構(gou)中,每(mei)個(ge)處理器(qi)私有內(nei)存(cun)(cun)(cun)和磁(ci)盤空間,利用(yong)網絡通(tong)(tong)信,“Scale Out”式橫向增加處理器(qi)和相應的(de)(de)內(nei)存(cun)(cun)(cun)、磁(ci)盤,從而避免事務對內(nei)存(cun)(cun)(cun)訪問和網絡帶寬(kuan)的(de)(de)競爭,提高處理性(xing)能。國(guo)產方面,無(wu)共(gong)享分布式架構(gou)已經趨于成熟(shu),如PingCAP的(de)(de)TiDB、華為的(de)(de)GaussDB、螞蟻的(de)(de)Oceanbase、達夢的(de)(de)達夢+、阿(a)里云的(de)(de)PolarDB、騰訊(xun)云TDSQL、南(nan)大通(tong)(tong)用(yong)的(de)(de)GBase、人大金倉(cang)的(de)(de)KingBase、中興通(tong)(tong)訊(xun)的(de)(de)Golden DB等分布式數據庫均為MPP無(wu)共(gong)享架構(gou)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

▲各架構對(dui)比

需求功能決定數據庫邏輯架構,邏輯架構決定訪問性能。為(wei)實現海量(liang)數據存儲、在線高并發,并同時支持OLTP和(he)OLAP的功能,HTAP應(ying)運而(er)生,按照具體(ti)架構可分為(wei)3類(lei):

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

▲HTAP不同(tong)架(jia)構(gou)

根據(ju)(ju)(ju)墨天輪排名(ming)(截至2022/02),目前(qian)國內前(qian)六大數(shu)據(ju)(ju)(ju)庫均為HTAP+分布(bu)式架構,包(bao)括(kuo)PingCAP的(de)TiDB、華(hua)為openGauss、螞(ma)蟻OceanBase、達夢(meng)的(de)達夢(meng)+、華(hua)為GaussDB、阿(a)里(li)PolarDB。其(qi)中(zhong)排名(ming)第一的(de)PingCAP基于Google的(de)Spanner模型和(he)Stanford的(de)Raft算法研發(fa)TiDB數(shu)據(ju)(ju)(ju)庫,借助底層(ceng)數(shu)據(ju)(ju)(ju)同步及行(xing)列透(tou)明轉(zhuan)換(huan)技(ji)術,將面向聯機交易(yi)的(de)行(xing)存引擎與面向實時(shi)分析的(de)列存引擎融合(he)改造為行(xing)列混合(he)數(shu)據(ju)(ju)(ju)架構。在(zai)HTAP技(ji)術浪潮中(zhong),TiDB數(shu)據(ju)(ju)(ju)庫憑借水平線性擴展(zhan)、強(qiang)一致分布(bu)式事務、故障自恢復的(de)金融級高(gao)可用、真正(zheng)跨數(shu)據(ju)(ju)(ju)中(zhong)心多活等(deng)核心特性拔(ba)得頭籌。

部署方式的演化上,數據庫上云成為重要發展趨勢。隨著云基礎設施的成熟和企業解放DBA運維難度的需求日漸迫切,將傳統數據庫直接部署在云端,由云廠商提供安裝和維護服務的云托管數據庫逐漸受到業內追捧。據Gartner預測:2023年云DBMS收入將占DBMS市場總收入的50%,75%的數據庫將部署在云端。在數據庫上云過程中,數據遷移是最大的痛點。針對企業面(mian)臨的(de)完整性(xing)、安(an)全性(xing)、一(yi)致性(xing)等(deng)(deng)難題(ti),市場催(cui)生了(le)安(an)暢網(wang)絡、數騰軟件等(deng)(deng)提供(gong)數據上云遷移的(de)第三(san)方公司。

據(ju)(ju)IDC統計,2021年(nian)H1中國關系型數(shu)據(ju)(ju)庫(ku)本地部(bu)署模式被(bei)Oracle、華為(wei)、Microsoft、IBM壟(long)斷,而(er)同期的(de)公(gong)有云(yun)部(bu)署市場由阿(a)里巴巴、騰(teng)訊(xun)、AWS和華為(wei)領(ling)銜。2020年(nian),阿(a)里云(yun)陸續推出Lindorm、PolarDB-X、ADB等云(yun)原生分布(bu)式數(shu)據(ju)(ju)庫(ku),是首家Gartner全球數(shu)據(ju)(ju)庫(ku)魔力(li)象限(xian)歸入(ru)領(ling)導者象限(xian)的(de)國內廠商(shang)。騰(teng)訊(xun)云(yun)研(yan)發(fa)TDSQL-C,積極擁(yong)抱開源,100%兼容MySQL 和 PostgreSQL,實(shi)現超百萬(wan)級QPS高吞吐,助力(li)中小企(qi)業,連續兩年(nian)增速全球前三(san)。華為(wei)云(yun)深(shen)耕金融行業信創,早在(zai)2015年(nian)就開始部(bu)署上線業界首個AI Native的(de)云(yun)原生數(shu)據(ju)(ju)庫(ku)GaussDB。

商業模式上,已逐漸成為數據庫產業的共識。2021年1月(yue),根據(ju)(ju)DB-Engines,全球數(shu)(shu)據(ju)(ju)庫(ku)開(kai)(kai)(kai)源(yuan)(yuan)(yuan)許可(ke)(ke)(ke)證(zheng)流行度(du)首次超過商業許可(ke)(ke)(ke)證(zheng),開(kai)(kai)(kai)源(yuan)(yuan)(yuan)數(shu)(shu)據(ju)(ju)庫(ku)逐漸成(cheng)為行業主流。截止2021年6月(yue),開(kai)(kai)(kai)源(yuan)(yuan)(yuan)與商業許可(ke)(ke)(ke)證(zheng)數(shu)(shu)量分別(bie)為198和185個,流行度(du)分別(bie)占(zhan)比51.4%和48.6%。開(kai)(kai)(kai)源(yuan)(yuan)(yuan)有助于(yu)擴(kuo)大(da)人(ren)才規模及上(shang)下游(you)生態影響力,通(tong)過運營開(kai)(kai)(kai)源(yuan)(yuan)(yuan)社(she)區快速(su)獲得反饋(kui)并加快產(chan)品開(kai)(kai)(kai)發、提升產(chan)品質量,同(tong)時反哺(bu)社(she)區開(kai)(kai)(kai)發者及獨(du)立軟件(jian)開(kai)(kai)(kai)發商(ISV)等生態伙伴,能夠達到(dao)多方共贏目的。據(ju)(ju)信通(tong)院(yuan)調查(cha):超八成(cheng)的企業認可(ke)(ke)(ke)開(kai)(kai)(kai)源(yuan)(yuan)(yuan),開(kai)(kai)(kai)源(yuan)(yuan)(yuan)主要(yao)應用在存儲(chu)、大(da)數(shu)(shu)據(ju)(ju)分析和數(shu)(shu)據(ju)(ju)庫(ku)領域。

從(cong)2014年起,巨杉SequoiaDB、PingCAP TiDB、百度Doris和HugeGraph、濤思數據Tdengine、歐拉NebulaGraph、華為(wei)openGauss、阿里PolarDB、螞蟻OceanBase等相(xiang)繼宣布開(kai)源(yuan),國內(nei)開(kai)源(yuan)大軍不斷壯大。

存儲介質分類演化:內存數據庫提升讀寫性能。早期數(shu)據庫將(jiang)大部(bu)分數(shu)據保存(cun)在磁盤上(shang),使用內(nei)(nei)存(cun)緩存(cun)磁盤內(nei)(nei)容作(zuo)為(wei)臨時存(cun)儲(chu),統(tong)稱磁盤數(shu)據庫;隨著電商(shang)、直播、新聞查詢等對(dui)(dui)讀寫性能要求(qiu)高的場景出現,業界對(dui)(dui)響應速度的要求(qiu)逐(zhu)漸提(ti)升,將(jiang)數(shu)據全部(bu)存(cun)儲(chu)在內(nei)(nei)存(cun)中、數(shu)據更新過程不受(shou)磁盤I/O限制的內(nei)(nei)存(cun)數(shu)據庫逐(zhu)漸成為(wei)主流。據Research and Market統(tong)計(ji),全球內(nei)(nei)存(cun)數(shu)據市場未來5年的CAGR為(wei)19%。

自1982年80286芯片推出以(yi)來,內存(cun)市場(chang)歷經(jing)40年的(de)(de)(de)發展(zhan),容量(liang)遵循摩爾定律翻倍,價格下降超過百(bai)萬倍,數據(ju)大規(gui)模存(cun)儲在內存(cun)中(zhong)成為(wei)可能(neng)。國際市場(chang)上(shang),Pivotal支持的(de)(de)(de)Redis和(he)SAP的(de)(de)(de)HANA領銜鍵值對、關系(xi)型內存(cun)數據(ju)庫;國內市場(chang)上(shang) , 快 立 方 的(de)(de)(de) Qcubic 和(he) 科 藍 軟 件 的(de)(de)(de)Goldilocks已經(jing)應用(yong)在運營商、金融、交通等行業。

治理模式分類演化:AI助力數據庫自治。以(yi)Oracle的Autonomous Database為(wei)例(li),自治(zhi)(zhi)驅動自動針(zhen)對特定負載配置(zhi)調優、按需擴展提供高可用(yong)數據庫;自治(zhi)(zhi)修復自動檢測和防范(fan)系統(tong)故障、用(yong)戶錯誤,在故障發生時自動切換備(bei)用(yong)數據庫,確保數據零丟失;自治(zhi)(zhi)安(an)(an)全(quan)自動保護(hu)敏感和受監管數據,及(ji)時修補數據庫安(an)(an)全(quan)漏洞,有效防范(fan)未經授權的訪問(wen)。

數(shu)(shu)據(ju)(ju)(ju)安全是數(shu)(shu)據(ju)(ju)(ju)庫(ku)建設的(de)(de)(de)重(zhong)要(yao)(yao)前提,自(zi)(zi)動(dong)檢(jian)測、防范系(xi)統故障、運維保護和(he)修(xiu)補安全漏(lou)洞(dong)對數(shu)(shu)據(ju)(ju)(ju)庫(ku)而言至關重(zhong)要(yao)(yao);隨(sui)著信息化的(de)(de)(de)發(fa)展(zhan),應用系(xi)統和(he)數(shu)(shu)據(ju)(ju)(ju)規模井噴式增長,數(shu)(shu)據(ju)(ju)(ju)庫(ku)的(de)(de)(de)負(fu)載(zai)調優壓(ya)力增大。因此,擺(bai)脫對DBA的(de)(de)(de)經驗(yan)決策依賴,基(ji)于人工智能自(zi)(zi)動(dong)執行安全、備份(fen)、打補丁和(he)其他需(xu)要(yao)(yao)大量人工重(zhong)復勞作(zuo)(zuo)、從(cong)根(gen)本(ben)上(shang)徹(che)底消除人為(wei)差錯、減輕DBA工作(zuo)(zuo)壓(ya)力的(de)(de)(de)自(zi)(zi)治數(shu)(shu)據(ju)(ju)(ju)庫(ku)成為(wei)歷史的(de)(de)(de)必然選擇(ze)。目(mu)前自(zi)(zi)治數(shu)(shu)據(ju)(ju)(ju)庫(ku)仍停(ting)留在事后判斷階段,展(zhan)望未來,提前預(yu)判數(shu)(shu)據(ju)(ju)(ju)規模增長趨勢和(he)數(shu)(shu)據(ju)(ju)(ju)庫(ku)負(fu)載(zai)狀況,事前主(zhu)動(dong)調優是自(zi)(zi)治數(shu)(shu)據(ju)(ju)(ju)庫(ku)的(de)(de)(de)發(fa)展(zhan)新方向。

二、三大增量需求,國內數據庫突飛猛進

根據(ju)信通(tong)院數據(ju),2020年(nian)中(zhong)國數據(ju)庫市(shi)場(chang)規模(mo)為(wei)35億美元(yuan)(約(yue)合240.9億元(yuan)人民幣),占全(quan)球總規模(mo)的(de)(de)5.2%。預計到2025年(nian),全(quan)球數據(ju)庫市(shi)場(chang)規模(mo)將(jiang)達到798億美元(yuan)。中(zhong)國的(de)(de)IT總支(zhi)出將(jiang)占全(quan)球12.3%。預計中(zhong)國數據(ju)庫市(shi)場(chang)在(zai)(zai)全(quan)球的(de)(de)占比將(jiang)在(zai)(zai)2025年(nian)接近中(zhong)國IT總支(zhi)出在(zai)(zai)全(quan)球的(de)(de)占比,市(shi)場(chang)總規模(mo)將(jiang)達到688億元(yuan),CAGR為(wei)23.4%。

金融、電信(xin)、政務、制造、互聯網五個行業(ye)為數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)庫(ku)(ku)行業(ye)下游主要需求領(ling)(ling)域,大數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)應(ying)用快(kuai)速(su)發展(zhan)為數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)庫(ku)(ku)提供(gong)增(zeng)長(chang)(chang)動力(li)。根據(ju)(ju)(ju)(ju)(ju)信(xin)通院統計,其合(he)計市場份額高達(da)80%以上,2020年整體采購額超過192億元。此外(wai),根據(ju)(ju)(ju)(ju)(ju)賽迪(di)顧問,2020年國內大數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)市場結構(gou)數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju),其中互聯網、政府、金融、電信(xin)、工(gong)業(ye)位列前五,占比分(fen)別(bie)為48%、14%、12%、9%、5%,合(he)計約88%,大數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)應(ying)用與數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)庫(ku)(ku)需求結構(gou)基本(ben)吻合(he),預計隨著大數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)應(ying)用領(ling)(ling)域拓(tuo)展(zhan)與規模持(chi)續(xu)增(zeng)長(chang)(chang),將(jiang)為數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)庫(ku)(ku)行業(ye)規模增(zeng)長(chang)(chang)提供(gong)充(chong)足動力(li)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

國內數據(ju)庫規模預計將快速增長

去年(nian)各領域“十(shi)四五”規(gui)劃陸(lu)續發布(bu),數(shu)(shu)據(ju)(ju)(ju)庫建設與應(ying)用在信(xin)息技術、金融(rong)、交通物流、農(nong)業等眾多領域被(bei)(bei)多次提(ti)及,其(qi)中數(shu)(shu)據(ju)(ju)(ju)庫標準化攻(gong)關的(de)重要性首次被(bei)(bei)提(ti)升到前所(suo)未有的(de)高度。隨(sui)著(zhu)數(shu)(shu)據(ju)(ju)(ju)庫頂層設計不斷加(jia)碼,十(shi)四五期(qi)間,國產數(shu)(shu)據(ju)(ju)(ju)庫研發將步入快車(che)道(dao),國產數(shu)(shu)據(ju)(ju)(ju)庫競爭實力將顯(xian)著(zhu)增強,行業有望進入加(jia)速發展期(qi)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

強化國產(chan)數據庫建設在“十四五”規劃中被重點提及

未來(lai)數(shu)據(ju)庫市場增量需求主要來(lai)自于以(yi)下三方面(mian):

1、國產化進程逐步加速;

2、傳統集中式數據庫向分布式架構升級;

3、非關系型數據庫應用場景不斷豐富,得到快速發展。

以Oracle、Microsoft、SAP、IBM為(wei)代表的海外廠商,一直以來,因(yin)其產(chan)(chan)(chan)(chan)品(pin)具(ju)有更(geng)好的性(xing)(xing)能、穩定性(xing)(xing)、安全性(xing)(xing)、與海外ERP、CRM等更(geng)好地(di)兼容性(xing)(xing)等優(you)勢,在(zai)企業核心(xin)OLTP業務場(chang)景一直占據(ju)主(zhu)導地(di)位。近(jin)些年,隨著國產(chan)(chan)(chan)(chan)數(shu)據(ju)庫(ku)產(chan)(chan)(chan)(chan)品(pin)功能、性(xing)(xing)能水平(ping)不斷增強,其產(chan)(chan)(chan)(chan)品(pin)水平(ping)已經(jing)(jing)逐(zhu)步趨近(jin)于海外廠商,根(gen)據(ju)IDC,在(zai)傳(chuan)統關系型數(shu)據(ju)庫(ku)領(ling)域(yu),Oracle、Microsoft、SAP、IBM合計份額從2019年66.8%下(xia)降至2021H1的48.5%,首次降至半數(shu)以下(xia),顯示出國產(chan)(chan)(chan)(chan)數(shu)據(ju)庫(ku)技術(shu)正趨于成熟,在(zai)海外廠商為(wei)主(zhu)導的核心(xin)OLTP應用場(chang)景,已經(jing)(jing)逐(zhu)步具(ju)備(bei)運營(ying)能力,國產(chan)(chan)(chan)(chan)化進(jin)程持續(xu)加速(su)。

根據信通院統計,目前我國金融行業海外Oracle與IBM DB2占比約74%,占據主導,基于MySQL與PostgreSQL二次開發的國產數據庫合計占比約為19%,國產化仍有廣闊空間。其中,我們通過對金融行業國產化數據庫建設案例梳理發現,國產數據庫已經從邊緣系統逐步實現核心系統國產化,顯示出國產數據庫產品功能、性能水平不斷增強。預(yu)計隨著(zhu)行業信創逐步落地,對(dui)國產(chan)數據庫需(xu)求將(jiang)進(jin)一步提速(su)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

傳統部署關系型數據庫海外廠商份額不斷下降

隨著數據類型、規模的指數級增長,傳統的終端計算場景已經難以應對 數據存儲處理的工作量與復雜度。云計算(suan)通(tong)過存(cun)算(suan)分離、資(zi)源(yuan)彈性動態(tai)分配、邊緣節點計算(suan)打破了傳統(tong)計算(suan)場景(jing)(jing)的瓶頸,實現(xian)了當前數據(ju)處理(li)的需(xu)求,云計算(suan)場景(jing)(jing)的需(xu)求推動了分布式數據(ju)庫的應用(yong)發展:通(tong)過資(zi)源(yuan)池(chi)化管理(li)實現(xian)物(wu)理(li)或(huo)邏輯(ji)層(ceng)的相互(hu)隔離與資(zi)源(yuan)的自由伸縮,

1)具備彈性擴張(zhang)、HTAP事務能力、多(duo)租戶管理(li)能力、高可用性,與云計算場景需(xu)求相匹配。

2)對多(duo)種訪問接口和數據類(lei)型(xing)的(de)兼容,可以實現對存(cun)儲與(yu)不同物(wu)理(li)服(fu)務器(qi)、不同格式的(de)數據進行(xing)結構與(yu)算法的(de)優化,突破服(fu)務器(qi)類(lei)型(xing)的(de)限制,為(wei)上層不同類(lei)型(xing)的(de)應用(yong)提供多(duo)模(mo)式的(de)數據服(fu)務。

目(mu)前,互聯網(wang)、金融(rong)、電(dian)信等(deng)行業分布(bu)(bu)式(shi)(shi)(shi)(shi)升級進展較快,以(yi)金融(rong)和電(dian)信行業為例,其核心(xin)(xin)業務(wu)(wu)數(shu)(shu)(shu)據(ju)(ju)類(lei)型均(jun)為關系(xi)(xi)(xi)型數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku),此類(lei)集中(zhong)式(shi)(shi)(shi)(shi)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)所面臨的(de)業務(wu)(wu)體量(liang)將呈現(xian)(xian)爆發性增長。由(you)于(yu)單(dan)一硬件(jian)能(neng)力(li)增長有(you)限,所以(yi)無(wu)法(fa)依靠縱向升級硬件(jian)擴展存(cun)量(liang)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)能(neng)力(li)上(shang)限。而分布(bu)(bu)式(shi)(shi)(shi)(shi)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)采用多種模式(shi)(shi)(shi)(shi)實(shi)現(xian)(xian)數(shu)(shu)(shu)據(ju)(ju)的(de)分散(san)存(cun)儲(chu),將壓(ya)力(li)分散(san)到不同服(fu)務(wu)(wu)器上(shang),并不斷通過增加(jia)存(cun)儲(chu)或(huo)計算節(jie)點來實(shi)現(xian)(xian)彈性升級,克服(fu)了集中(zhong)式(shi)(shi)(shi)(shi)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)的(de)諸多缺(que)點,業界已(yi)有(you)分布(bu)(bu)式(shi)(shi)(shi)(shi)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)在股(gu)份(fen)制(zhi)銀行、城(cheng)商(shang)行、二三線城(cheng)市運營商(shang)等(deng)實(shi)現(xian)(xian)了核心(xin)(xin)業務(wu)(wu)系(xi)(xi)(xi)統(tong)的(de)改造落(luo)地(di),同時,去年12月(yue),騰訊分布(bu)(bu)式(shi)(shi)(shi)(shi)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)TDSQL落(luo)地(di)東吳證券(quan)核心(xin)(xin)交易系(xi)(xi)(xi)統(tong),也標(biao)志(zhi)著分布(bu)(bu)式(shi)(shi)(shi)(shi)數(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)在券(quan)商(shang)核心(xin)(xin)系(xi)(xi)(xi)統(tong)領域取得突破。

墨(mo)天輪國產數據流行度(du)排(pai)行(截至2022/02),前(qian)十大熱門數據庫(ku)均(jun)為分(fen)布式(shi)架構(gou),其應用(yong)場景涵蓋各行業,顯示出(chu)國產分(fen)布式(shi)數據庫(ku)已經趨于成熟(shu),正(zheng)成為各行業數據庫(ku)建設重要選擇。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

墨天(tian)輪(lun)前十大熱門數(shu)(shu)據(ju)庫均(jun)為分布式數(shu)(shu)據(ju)庫

隨著工業互聯網、互聯網創新型業務、車聯網等應用的快速發展,非關系型數據庫應用將加速落地。我國非關系型數據庫快速發展,正逐步進入世界前列。我國非(fei)關系型數(shu)據(ju)庫(ku)(ku)主(zhu)要以基于(yu)開源(yuan)數(shu)據(ju)庫(ku)(ku)如Redis、InfluxDB、CouchDB等產品進行(xing)二次開發為(wei)主(zhu),根(gen)據(ju)DB-Engines 2022年(nian)2月排名,國內浙江智(zhi)臾和阿里云(yun)TSDB,分別位列(lie)時序數(shu)據(ju)庫(ku)(ku)第11、21位;圖數(shu)據(ju)庫(ku)(ku)方面,歐若(ruo)數(shu)網(wang)Nebula Graph、百度智(zhi)能云(yun)開源(yuan)產品HugeGraph、華為(wei)云(yun)GraphBase分別位列(lie)15、26、32位,顯(xian)示出國產NoSQL數(shu)據(ju)庫(ku)(ku)正逐步趨近(jin)于(yu)世(shi)界前(qian)列(lie)。

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

NoSQL數據庫在制造、政府、金融等領域(yu)逐(zhu)步落地

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

國內主流數據庫廠商

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

互聯網廠商

甲骨文斷供俄羅斯!中國數據庫能否一戰?數據庫產業深度報告 | 智東西內參

部分初創廠商

智東西認為,此次俄烏(wu)沖突,美歐試圖將(jiang) IT 基(ji)(ji)礎設施“武器(qi)化”,快速打(da)擊俄羅斯的(de)(de)(de)生產和生活秩序,這充分表明在大國(guo)競爭中將(jiang) IT 基(ji)(ji)礎設施建立(li)在所謂全球化的(de)(de)(de)根基(ji)(ji)上是不可靠(kao)的(de)(de)(de),大國(guo)的(de)(de)(de) IT 架構(gou)必須(xu)堅持獨(du)立(li)自主的(de)(de)(de)發展道路。所以,不僅僅是芯片(pian)、數據庫,我們要在科技(ji)領域的(de)(de)(de)各個環節(jie),將(jiang)核(he)心(xin)技(ji)術牢牢抓在自己手(shou)中。