
智東西(公眾號:zhidxcom)
作者 |? 徐豫
編輯 |? 心緣
智東西(xi)10月(yue)25日報(bao)道,在(zai)10月(yue)23日舉行的(de)(de)OceanBase 2024年度發(fa)布會上,OceanBase數據庫(ku)OceanBase 4.2.5 LTS、OceanBase 4.3.3正式(shi)發(fa)布,OceanBase 4.4開啟內測(ce),OceanBase云數據庫(ku)即日起免費(fei)提供365天的(de)(de)試用期。而OceanBase首批分布式(shi)數據庫(ku)今年已(yi)通(tong)過(guo)中(zhong)國信息安全(quan)測(ce)評(ping)中(zhong)心的(de)(de)“安全(quan)可(ke)靠測(ce)評(ping)”。
基于單機分布式一體化架構和AI技術,OceanBase數(shu)(shu)據(ju)庫大幅優(you)化了(le)可擴展(zhan)性、實(shi)時分析(xi)、消除數(shu)(shu)據(ju)孤(gu)島、跨(kua)云(yun)部署、多模態、向量搜索、容災等(deng)方面的性能(neng)。
同時,有了(le)專(zhuan)有云和公有云服務“雙引(yin)擎”加持,今年OceanBase的客戶數(shu)成功(gong)突破2000家(jia),行業解(jie)決方案伙伴增速超100%,熱門解(jie)決方案落地增速超50%,核心經銷(xiao)商(shang)伙伴業績占比(bi)超60%。
一、新版數據庫正式對外開放,強化實時數據處理水平
OceanBase CEO楊冰正式宣布(bu)推(tui)出(chu)OceanBase 4.2.5 LTS版(ban)本(ben)和OceanBase 4.3.3首個GA版(ban)本(ben)。
OceanBase 4.2.5 LTS版本相較(jiao)(jiao)于此(ci)前的(de)4.2.1 LTS版本TP性能(neng)提升(sheng)了26%,小規格4C TP性能(neng)則提升(sheng)了37%,系(xi)統(tong)的(de)處理能(neng)力得到較(jiao)(jiao)大提升(sheng)。
同時,其融合了OBKV-HBase和OBKV-Redis兩(liang)個不同模態的(de)(de)數據庫,可以兼(jian)顧HBase的(de)(de)大(da)規模數據存儲和處理(li)優勢,以及Redis的(de)(de)高速緩存和實(shi)時讀寫(xie)能力。
此外(wai),據OceanBase CTO楊傳輝透露,該版本還(huan)可兼容甲骨文的數(shu)據庫(ku),用戶托(tuo)管(guan)在(zai)甲骨文數(shu)據庫(ku)5.7版本的數(shu)據,可以不改代碼平滑(hua)遷(qian)移至(zhi)OceanBase 4.2.5 LTS版本的數(shu)據庫(ku)。
與(yu)4.3.0版本(ben)相比,OceanBase 4.3.3版本(ben)TPC-H 1T提升了(le)64%,TPC-DS 1T提升了(le)36%,寬表性能(neng)ClickBench hot-run提升了(le)49%,還新增了(le)向量檢索能(neng)力。
楊傳輝稱,該(gai)(gai)版(ban)本(ben)是面(mian)向實(shi)時AP場(chang)景的(de)(de)(de)首個公開版(ban)本(ben),兼容特定的(de)(de)(de)數據(ju)類型,支持快速導(dao)入導(dao)出(chu),并且針(zhen)對特定場(chang)景預(yu)設了AP參數模板,免去了用戶重(zhong)新補充(chong)參數的(de)(de)(de)功夫。據(ju)楊冰透露,過去一年(nian)已有大(da)約60個客戶試用該(gai)(gai)系列的(de)(de)(de)小版(ban)本(ben),并給出(chu)了不(bu)錯的(de)(de)(de)使(shi)用反(fan)饋。
二、采取單機分布式一體化架構,兼具性能和成本優勢
對于數據庫而(er)言,其采(cai)用(yong)(yong)集中式架(jia)構(gou)(gou)通常會(hui)在兼容性(xing)(xing)、易用(yong)(yong)性(xing)(xing)、單機性(xing)(xing)能上(shang)較為(wei)突出,而(er)選擇分布式架(jia)構(gou)(gou)則更多是(shi)在擴展性(xing)(xing)、可用(yong)(yong)性(xing)(xing)和成本上(shang)占優勢(shi)。
OceanBase的(de)數據庫則依靠的(de)是“單機(ji)分布(bu)式(shi)(shi)一體化(hua)(hua)”架構(gou)(gou),既(ji)考慮到分布(bu)式(shi)(shi)架構(gou)(gou)的(de)擴展性,又具(ju)備集(ji)中式(shi)(shi)的(de)功能和單機(ji)性能,還(huan)能同(tong)時處理結構(gou)(gou)化(hua)(hua)和非結構(gou)(gou)化(hua)(hua)數據。
楊傳輝解(jie)釋(shi)道,這是因(yin)為OceanBase希望能(neng)用(yong)一(yi)個數(shu)據(ju)庫,去(qu)解(jie)決至少80%的(de)數(shu)據(ju)問題,使數(shu)據(ju)庫變得普惠和通用(yong)。
從OceanBase多個實(shi)際客(ke)戶(hu)案(an)例中可以(yi)看到,企業用戶(hu)選擇單機分布式(shi)一體化架構后,等同(tong)于(yu)只(zhi)花費一個系統的錢,能獲得兩份甚至多分復合收(shou)益。
例(li)如,山(shan)東移動此前用(yong)(yong)的(de)是甲骨文數據庫(ku),基礎設施基于傳(chuan)統(tong)“IOE”架(jia)構,擴展(zhan)能力受限,也難以應對高峰(feng)期流量(liang)和復雜查詢場景。其轉用(yong)(yong)OceanBase的(de)數據庫(ku)后(hou),計費系(xi)統(tong)效率(lv)提升(sheng)了近30%,整(zheng)體成本降(jiang)低了9成。
同(tong)時,通過跨多數據(ju)中(zhong)心分布式(shi)集群部(bu)署,山東移動(dong)的數據(ju)庫能達到機房級別(bie)的容災效果。
三、AI Agent的數據底座,可理解并執行復雜語義
OceanBase將其一體(ti)化數(shu)據(ju)庫視作AI時代的數(shu)據(ju)底(di)座,旨(zhi)在(zai)讓(rang)AI技術(shu)像數(shu)據(ju)庫一樣通(tong)用。目前(qian),AI技術(shu)已滲透該公司數(shu)據(ju)庫的開發、運維、診斷等環節(jie)。
如(ru)果用(yong)不(bu)同(tong)的(de)數據庫(ku)處理不(bu)同(tong)類(lei)型的(de)數據,這通常存在研發成(cheng)本(ben)高、傳(chuan)輸(shu)過程復(fu)(fu)雜、查詢(xun)路徑繁瑣等弊端。楊傳(chuan)輝稱,在通用(yong)數據庫(ku)中集成(cheng)向量插件后,OceanBase的(de)所有底層能力都可以直接(jie)復(fu)(fu)用(yong)。
除此之外,OceanBase一體化數(shu)據庫還融入了LangChain、Llamaalndex、DB-GPT等主流(liu)AI技術棧。
現場楊傳輝用ANN Benchmarks基準(zhun)測(ce)試驗(yan)證OceanBase一體化數據(ju)庫的向(xiang)量性能。從測(ce)試結果來看,其向(xiang)量引擎(qing)在準(zhun)確率、速(su)度等多維(wei)度上超過(guo)業界頭部水(shui)平。
在(zai)C端應用方面(mian),OceanBase與(yu)螞(ma)蟻集團的生態建(jian)立了緊密結(jie)合(he)。支(zhi)小寶、螞(ma)小財、支(zhi)付寶百寶箱Agent,以及包(bao)括AI健康管家在(zai)內的3個螞(ma)蟻集團AI管家,它(ta)們(men)的數(shu)據底座(zuo)都用的是OceanBase一(yi)體化數(shu)據庫和(he)架(jia)構。
其中,支付寶(bao)百(bai)寶(bao)箱Agent是一個搭(da)載(zai)了AI能力的(de)小程序。該Agent可以(yi)讀懂(dong)復雜語(yu)義(yi),為用戶檢索、篩(shai)選、推薦吃(chi)喝玩(wan)樂的(de)店鋪。
楊冰稱(cheng),此類Agent背后需要涉及復(fu)雜(za)的(de)語義交互,過去通常依賴大量地(di)理位置、向量的(de)存(cun)儲來(lai)實(shi)現這一(yi)(yi)功能,產(chan)品開發周(zhou)期也長。而(er)得益于(yu)OceanBase一(yi)(yi)體(ti)化數據庫(ku)和架構(gou),該平臺僅(jin)由(you)兩名開發者耗時一(yi)(yi)周(zhou)的(de)時間,便實(shi)現了從(cong)構(gou)思(si)到產(chan)品的(de)落地(di)。
▲在支付寶百寶箱(xiang)Agent的聊天框中輸入“推薦距離兩公里以(yi)內(nei),人(ren)均(jun)消費25元以(yi)下,評價(jia)4.5分以(yi)上,不用排隊的奶茶店”
四、公有云和專有云成為商業化雙引擎,超6成客戶為千億級規模
除了(le)OceanBase一體(ti)化數據庫(ku)和架(jia)構,該公司的多(duo)云服務(wu)也實(shi)現了(le)全新升級。
OceanBase上新Free Trial入口,即開發者可(ke)以在一年內免費試用OceanBase云(yun)數據庫,也能自由選擇所需的云(yun)服務(wu)商(shang)。此外,OceanBase云(yun)數據庫不(bu)久后將(jiang)在阿里(li)云(yun)精選市(shi)場中開放接入。
而(er)OceanBase 4.4實驗室版本正式開啟(qi)內測,主推存算分離和共享存儲(chu)架(jia)構。
迄今為止(zhi),主(zhu)流計算機的(de)資源利用(yong)(yong)率大部分情況下只(zhi)有(you)個位數。OceanBase創始人兼(jian)首(shou)席(xi)科學家陽振(zhen)坤建議,若想給客戶帶(dai)來“用(yong)(yong)一(yi)份(fen)硬件的(de)錢買到了(le)兩份(fen)硬件”的(de)使用(yong)(yong)體(ti)驗,公有(you)云、專(zhuan)有(you)云、行業云等多云服務一(yi)方(fang)面(mian)可(ke)以通過資源池化和復(fu)用(yong)(yong)來降低成本,另一(yi)方(fang)面(mian)可(ke)以通過動(dong)態伸(shen)縮和按需使用(yong)(yong)提升效率。
據(ju)楊(yang)傳輝透露,OceanBase云數據(ju)庫已經在公有云上(shang)實現基(ji)于對(dui)象存儲的存算分離(li),并且(qie)用(yong)起來“性(xing)價比高”。
經(jing)過4年的商業(ye)化摸索,OceanBase今(jin)年客(ke)戶數(shu)突破2000家,連續4年增速超100%,并且(qie)中小客(ke)戶占比相較于去(qu)年進(jin)一步擴大至80%。
當前,該公(gong)司形成了“雙引(yin)擎”的商(shang)(shang)業發展(zhan)模(mo)式,主(zhu)要增長動力(li)來(lai)自(zi)專(zhuan)有(you)云服務。從2022年(nian)到(dao)2024年(nian),其專(zhuan)有(you)云客戶數(shu)增速達到(dao)50%,包括(kuo)中國南(nan)方航空等航空公(gong)司,北京、西安等多地地鐵運營商(shang)(shang),匯豐(feng)銀行(xing)、交通銀行(xing)等金融單位。
而同期其公有云客戶數(shu)增(zeng)(zeng)速(su)為130%,成(cheng)為OceanBase的第二增(zeng)(zeng)長(chang)引擎。其客戶集中于零售、智能制造(zao)、互(hu)聯(lian)網金融行(xing)業,包括小米、科(ke)大訊(xun)飛、Vivo等(deng)高增(zeng)(zeng)長(chang)公司和行(xing)業獨角(jiao)獸(shou)。
楊(yang)冰稱,超(chao)(chao)千億(yi)交易規模的支付企業(ye)和超(chao)(chao)千億(yi)規模的消費(fei)電(dian)子(zi)企業(ye)均超(chao)(chao)6成(cheng)在使用(yong)OceanBase公有云服務。
兩(liang)年(nian)(nian)(nian)前,OceanBase曾在當時的年(nian)(nian)(nian)度發布(bu)會上宣布(bu)了(le)其“珊瑚計(ji)劃(hua)(hua)”,旨在構建(jian)一個以合(he)作伙(huo)伴為中心的商(shang)業生態模式。該計(ji)劃(hua)(hua)的核心目(mu)標是在未來3年(nian)(nian)(nian)內與60家核心經(jing)銷商(shang)達成合(he)作,并(bing)且合(he)作伙(huo)伴的收入占比(bi)達到60%以上。
從今年的戰(zhan)果(guo)來(lai)看,該公司超(chao)前完成了這一(yi)目標(biao)。現在OceanBase累計(ji)有(you)超(chao)150家核心經銷商,簽(qian)約占(zhan)比達70%,業績占(zhan)比超(chao)過6成。未來(lai)該公司將持續下(xia)沉(chen)二(er)線、三線、四線城(cheng)市,并(bing)計(ji)劃(hua)在出海市場中尋求新的增長(chang)動力。
五、無論是金融還是出行產品,都需要一個國產的、更安全的數據庫
OceanBase的(de)生態合作(zuo)伙伴(ban)覆(fu)蓋了(le)金融、政務、交通(tong)、能源、科技、公共(gong)服務等多個(ge)領(ling)域。在《共(gong)話(hua)云和AI時(shi)代的(de)數據(ju)庫(ku)》的(de)圓桌論壇上,部分生態合作(zuo)伙伴(ban)分享了(le)他們對于OceanBase新版數據(ju)庫(ku)的(de)第一感受。
據IDC中國副總(zong)裁兼首席(xi)分析師武(wu)連峰透露,雖然全球已有17%的(de)企(qi)業把生(sheng)(sheng)成式AI技術(shu)應用到企(qi)業生(sheng)(sheng)產的(de)過程中,但實際(ji)上只(zhi)有11%左(zuo)右的(de)企(qi)業真正(zheng)落(luo)地了“DateBase for AI”,或者“AI for DateBase”,主要是因為準(zhun)確率達不到95%的(de)標準(zhun)。
中國(guo)人保財險科技運(yun)營(ying)部(bu)副總(zong)經理張帆稱,單庫(ku)(ku)40個TB的(de)(de)(de)數據(ju)處理是基(ji)操,數據(ju)庫(ku)(ku)的(de)(de)(de)安全性和(he)穩定性也愈(yu)發重(zhong)要(yao),因此保險行業未來更需要(yao)一(yi)個國(guo)產化的(de)(de)(de)、多模的(de)(de)(de)、支持多云的(de)(de)(de)、可(ke)靠的(de)(de)(de)、具(ju)有AI能力的(de)(de)(de)數據(ju)庫(ku)(ku)產品。
T3出行數(shu)據庫負責(ze)人高(gao)建豐認為,數(shu)字(zi)化出行的(de)調(diao)度(du)過(guo)程需(xu)要大(da)量實時數(shu)據來支撐。因此(ci),一個實時分析能力強,并(bing)且可(ke)以(yi)節省人力、物力、研發資源,低(di)成本(ben)可(ke)用(yong)的(de)數(shu)據庫產品,在他(ta)看來是(shi)一種更好的(de)技術解決方案(an)。
中國聯合航空(kong)有限公司信息中心總(zong)經理(li)馮振(zhen)宇則將數據庫和AI的(de)關系,比作“好馬配好鞍”。在(zai)他看(kan)來,OceanBase數據庫的(de)新(xin)版本、新(xin)產(chan)品可以將原有的(de)系統原封不動地集成(cheng)到新(xin)的(de)平臺下,能夠把現有的(de)資(zi)產(chan)盤活,變(bian)成(cheng)真正的(de)數字(zi)資(zi)產(chan),已(yi)經稱得上(shang)是“好馬”。
同時,OceanBase結合(he)AI技術,為其架構(gou)推出全新(xin)的向量(liang)搜索能力。馮振宇認為,這不僅拓寬了圖片等數據資產的范圍,也使AI初具“馬鞍”的雛形。
六、AI時代的新風口,“讓數據好用,把數據用好”
錢(qian)衛寧是華東師范大學(xue)數(shu)據學(xue)院(yuan)院(yuan)長和(he)CCF數(shu)據庫(ku)專委會常委。此次OceanBase 2024年度發布(bu)會上,他也受邀分享了自己在(zai)數(shu)據庫(ku)領域,從學(xue)生(sheng)身份(fen)(fen)轉變到導(dao)師身份(fen)(fen)這一過程中的(de)觀(guan)察。
他(ta)認為AI行(xing)業中(zhong)的(de)核心(xin)變化是數(shu)據(ju)智能的(de)變化。從(cong)某種程度上(shang)來說(shuo),“互聯(lian)網企(qi)業是最(zui)早的(de)AI企(qi)業,”錢衛寧解釋道(dao),人(ren)們很早就(jiu)開始嘗試把手頭上(shang)的(de)事情交給(gei)機器去做,這也意味著人(ren)們逐步建(jian)立起(qi)對底層數(shu)據(ju)庫的(de)信任。
隨著互(hu)聯(lian)網行(xing)業(ye)不斷重構各行(xing)各業(ye),該行(xing)業(ye)內逐步(bu)孵化(hua)出了數(shu)字化(hua)這一概(gai)念(nian)。數(shu)據(ju)可視作一種“新能源”,如何在新的AI時代中將其(qi)真(zhen)正大(da)眾化(hua),將其(qi)變得“唾手(shou)可得”。在錢衛寧看來,這是對數(shu)據(ju)庫廠商的關鍵考驗。
目前,基本上每個(ge)大型企業(ye)都(dou)部署了專用(yong)(yong)的(de)數(shu)據(ju)庫。然(ran)而,同時在(zai)(zai)線使用(yong)(yong)數(shu)據(ju)庫的(de)用(yong)(yong)戶在(zai)(zai)數(shu)量和(he)(he)使用(yong)(yong)方(fang)式上都(dou)愈發不(bu)可(ke)控,原本單機形式的(de)數(shu)據(ju)庫已經不(bu)足(zu)以滿足(zu)用(yong)(yong)戶需求(qiu),也因此催生了分布式數(shu)據(ju)技(ji)術和(he)(he)分布式數(shu)據(ju)庫,讓企業(ye)能夠以更低的(de)成本來(lai)管理好(hao)數(shu)據(ju)。
分布并(bing)行(xing)數(shu)(shu)據(ju)庫(ku)、云原(yuan)生數(shu)(shu)據(ju)庫(ku)和開(kai)源數(shu)(shu)據(ju)庫(ku)是(shi)未(wei)來數(shu)(shu)據(ju)庫(ku)的(de)三(san)大衍生方向。錢衛(wei)寧稱,“現在(zai)是(shi)中國數(shu)(shu)據(ju)庫(ku)最好的(de)時代”,而類似于OceanBase的(de)做法,去集成(cheng)、協同不(bu)同垂直(zhi)領域的(de)數(shu)(shu)據(ju)庫(ku),則是(shi)新的(de)機(ji)遇。
結語:OceanBase獨立分拆后的首次年度發布,商業化成果是其最大的底氣
從(cong)(cong)V1.0版本走到V4.3版本,從(cong)(cong)分布式到一(yi)體(ti)化(hua),從(cong)(cong)TP到HTAP再到SQL+NoSQL,OceanBase數(shu)據庫和架(jia)構持續朝著一(yi)體(ti)化(hua)的(de)方向升級迭代。最新的(de)V4.3版本則基于(yu)一(yi)體(ti)化(hua)產品,推(tui)出(chu)了(le)全新的(de)向量(liang)能力,實現SQL+AI的(de)深度融合。
目(mu)前,OceanBase的業(ye)務不僅覆(fu)蓋(gai)了頭部政(zheng)企、行業(ye)獨(du)角獸,也兼顧了中小客(ke)戶(hu)。其公有云服務已觸及(ji)全球范圍內(nei)100多(duo)個可用區,并且兼容(rong)多(duo)家(jia)主流公有云基礎(chu)設(she)施(shi)。
OceanBase今年3月才從螞蟻集團中(zhong)(zhong)分拆出來,成為一家獨立運營的(de)公司,這也意味著其(qi)背負(fu)了更大的(de)財務壓力。從此(ci)次(ci)年度(du)發布會中(zhong)(zhong)可以看到,距離螞蟻集團組織(zhi)架構改革已過去(qu)將近半年的(de)時間(jian),OceanBase不僅持續迭代升(sheng)級其(qi)開源數據庫,還構建了在海內外(wai)市(shi)場的(de)商(shang)業(ye)競爭優勢。