智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智(zhi)東西(xi)7月4日報道,今(jin)日下午(wu),騰(teng)訊云發布AI原生(AI Native)向量(liang)數(shu)據庫(ku)Tencent Cloud VectorDB。該(gai)數(shu)據庫(ku)能夠(gou)被廣泛應用于(yu)大模型的訓練、推理和知識庫(ku)補充等場(chang)景,是國(guo)內首(shou)個從接(jie)入層、計算層、到(dao)存(cun)儲層提供全生命周(zhou)期AI化的向量(liang)數(shu)據庫(ku),將于(yu)8月正(zheng)式登陸騰(teng)訊云。

向(xiang)(xiang)(xiang)量(liang)數(shu)(shu)據(ju)庫專門用于存儲和(he)查詢向(xiang)(xiang)(xiang)量(liang)數(shu)(shu)據(ju)。如(ru)果把大模(mo)型(xing)比作人的(de)大腦,那(nei)么向(xiang)(xiang)(xiang)量(liang)數(shu)(shu)據(ju)庫就如(ru)同(tong)海馬體,能(neng)夠為大模(mo)型(xing)提(ti)供(gong)長期記(ji)憶。向(xiang)(xiang)(xiang)量(liang)數(shu)(shu)據(ju)庫可以(yi)突破時間和(he)空間上的(de)限制,助力企業廣泛(fan)挖掘數(shu)(shu)據(ju)價值(zhi)。據(ju)悉,騰訊(xun)云向(xiang)(xiang)(xiang)量(liang)數(shu)(shu)據(ju)庫最高(gao)支持10億級向(xiang)(xiang)(xiang)量(liang)檢索規(gui)模(mo),延(yan)遲(chi)控制在毫秒級,相比傳統單機(ji)插件式數(shu)(shu)據(ju)庫檢索規(gui)模(mo)提(ti)升(sheng)10倍,同(tong)時具備百萬(wan)級每秒查詢(QPS)的(de)峰值(zhi)能(neng)力。

一、騰訊云定義AI原生向量數據庫,加速企業在大模型時代的AI化進程

騰訊云(yun)數據庫(ku)副(fu)總經理羅(luo)云(yun)談(tan)道,向(xiang)量數據庫(ku)是企業(ye)數據和大(da)模(mo)型之間的橋梁,能夠彌補大(da)模(mo)型在時間和空間上的限制。

向量數據(ju)庫(ku)能夠解(jie)決大(da)模型預訓練成本(ben)高(gao)、沒有(you)“長期記憶”、知識更新不足、提示詞工(gong)程復雜等問(wen)題,加速大(da)模型落(luo)地(di)行業場景。

企業拿到非結構(gou)化數(shu)據后,通過神經網絡進(jin)行向量(liang)化,進(jin)而存(cun)儲(chu)到向量(liang)數(shu)據庫中,進(jin)行存(cun)儲(chu)和查詢,這樣可以極(ji)大地提(ti)升效率和降(jiang)低成本。

羅云認為,AI原生時代(dai)已經到來,“向(xiang)量數據(ju)庫+大模型+數據(ju)”,三者(zhe)將(jiang)產生“飛輪效應(ying)”,共同助力企業步入AI原生時代(dai)。

在AI原生時代,數(shu)據(ju)的使(shi)用范式如(ru)下(xia)圖所(suo)示,比如(ru)處理大段PDF文(wen)件,會(hui)先經過文(wen)本分(fen)割,把文(wen)字(zi)分(fen)解成(cheng)(cheng)小段文(wen)字(zi),然(ran)后計(ji)算層會(hui)將這些文(wen)字(zi)通(tong)過向量(liang)化(embedding)算法變成(cheng)(cheng)浮點數(shu)數(shu)組(zu),再調用向量(liang)數(shu)據(ju)接口,將數(shu)據(ju)存放到(dao)存儲(chu)層數(shu)據(ju)庫。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

用(yong)自(zi)然語言提出問(wen)題后(hou),應用(yong)開發者后(hou)臺會計算“問(wen)題”向量(liang)(liang),進行基(ji)于向量(liang)(liang)的(de)知識檢(jian)索(suo),找到(dao)最相關的(de)20個片段,整(zheng)理后(hou)推(tui)給一個大模型,讓大模型幫它(ta)得出最終的(de)答案。可以看到(dao),客戶的(de)數據加(jia)工流程非(fei)常復雜,要(yao)解決分段、embedding、二(er)次embedding等問(wen)題。

對此,騰訊云重(zhong)新定義(yi)了AI原生(sheng)的(de)開發范(fan)式(shi),提(ti)供了接入層、計算層、存儲(chu)層的(de)全(quan)面AI化解決方案,讓用(yong)戶(hu)在使用(yong)向(xiang)量數據庫的(de)全(quan)生(sheng)命周期都(dou)能(neng)應用(yong)到AI能(neng)力。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

在接入層,騰訊(xun)云向量(liang)數據庫支(zhi)持(chi)自然語言文(wen)本的(de)輸入,同時采用“標(biao)量(liang)+向量(liang)”的(de)查(cha)詢方式,支(zhi)持(chi)全內存(cun)索引,最高支(zhi)持(chi)每秒百萬的(de)查(cha)詢量(liang)(QPS)。

計算層在(zai)數據庫(ku)內部提(ti)供分割、embedding、精排、聚合(he)等(deng)AI計算的(de)算子(zi),簡化客戶使用數據的(de)成本。AI原生開(kai)發范式可實現全量數據AI計算,一站式解決企業在(zai)搭建私(si)域(yu)知(zhi)識(shi)庫(ku)時的(de)文(wen)本切分、embedding等(deng)難題。

在存(cun)儲層(ceng),騰訊云向量數據庫支持數據智(zhi)能存(cun)儲分布(bu),助力企業存(cun)儲成本降低50%。騰訊云內部按照AI方式進行預訓練,產生一些數據和算法,能夠更好幫(bang)助客戶動(dong)態構建索(suo)引。

騰訊(xun)云向量數據庫有助于加速企業在大模型時代的AI化進程(cheng)。

統(tong)計(ji)顯示,將騰(teng)訊云(yun)向量(liang)數(shu)(shu)據庫(ku)用(yong)于大模型(xing)預訓練數(shu)(shu)據的(de)分類、去重和清(qing)洗(xi)相(xiang)比(bi)傳統(tong)方式,可以(yi)實(shi)現10倍效率的(de)提升。如(ru)果將向量(liang)數(shu)(shu)據庫(ku)作(zuo)為外部知(zhi)識庫(ku)用(yong)于模型(xing)推理,則可以(yi)將成(cheng)本(ben)降低(di)2-4個數(shu)(shu)量(liang)級。企業原先接入(ru)一個大模型(xing)需要(yao)花(hua)1個月左右時間(jian)(jian),使用(yong)騰(teng)訊云(yun)向量(liang)數(shu)(shu)據庫(ku)后,3天時間(jian)(jian)即(ji)可完成(cheng),極大降低(di)了(le)企業的(de)接入(ru)成(cheng)本(ben)。

二、多年存儲引擎和AI算法積淀,助力數據接入效率提升10倍

上述成績源自騰訊云多(duo)年積累的(de)存儲(chu)引擎(qing)和AI算法。此前騰訊云向量數(shu)據庫的(de)向量化能力曾多(duo)次獲(huo)得權(quan)威(wei)機(ji)構認可(ke),2021年曾登頂(ding)MS MARCO榜單(dan)第一(yi)、相關成果(guo)已發表于NLP頂(ding)會ACL。

騰訊(xun)云向(xiang)量(liang)數(shu)據庫(ku)基于騰訊(xun)集團每(mei)日處理千億次檢索的分布式向(xiang)量(liang)數(shu)據庫(ku)引(yin)擎Olama。該(gai)引(yin)擎已經廣泛應用于大語言模型(xing)、推薦搜(sou)索廣告系(xi)統、音視頻和圖片審核以及去重等領域。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

Olama從2019年開始在PCG業務團(tuan)隊技術孵化,如今(jin)已面向(xiang)騰訊(xun)全部業務,覆(fu)蓋騰訊(xun)6個BG、接入騰訊(xun)視頻、QQ瀏(liu)覽器、QQ音(yin)樂等30多款國(guo)民級產品,日均搜索(suo)請(qing)求超千億,調用(yong)成功率(lv)達100%,搜索(suo)成功率(lv)達99.995%。

當前Olama能夠(gou)支持的(de)單索引行數(shu)達(da)到10億行,單實例QPS達(da)100萬(wan),全網P99響應時延小于(yu)20ms。經過騰訊(xun)內部(bu)海量場景(jing)的(de)實踐,使用(yong)騰訊(xun)云(yun)向量數(shu)據庫(ku),數(shu)據接入(ru)AI的(de)效率比(bi)傳(chuan)統方案(an)提升10倍,運行穩定(ding)性高達(da)99.99%。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

騰(teng)訊云向量數據庫能有(you)效助力產(chan)品提升(sheng)(sheng)運營(ying)效率。使用騰(teng)訊云向量數據庫后(hou),QQ音(yin)樂人(ren)(ren)均(jun)聽(ting)歌(ge)時(shi)長提升(sheng)(sheng)3.2%、騰(teng)訊視(shi)頻有(you)效曝光人(ren)(ren)均(jun)時(shi)長提升(sheng)(sheng)1.74%、QQ瀏覽器成本降低37.9%。

騰訊PCG大數據平臺部搜索推薦Senior Tech Lead鄭偉分享了騰訊內部應用騰訊云向量數據庫的三個案例。?

游戲知幾是騰訊自研的游戲智能AI產品機玩家(jia)互動運營解決方案,應用在(zai)超過200款游戲上。它相當于是一個(ge)游戲智能客(ke)服應用,能夠對玩家(jia)的個(ge)性(xing)化問(wen)題(ti)給(gei)出(chu)答案。

在游戲領域,可以(yi)先把所有游戲問(wen)(wen)(wen)題(ti)和(he)答(da)(da)案建成標(biao)準(zhun)問(wen)(wen)(wen)答(da)(da)庫(ku),然后(hou)(hou)通過深度學習技術把問(wen)(wen)(wen)答(da)(da)庫(ku)變成一個個向量,存(cun)儲到(dao)Olama引擎,當(dang)用戶(hu)輸入問(wen)(wen)(wen)題(ti),也(ye)把這(zhe)個問(wen)(wen)(wen)題(ti)變成向量,再將該向量存(cun)儲到(dao)Olama引擎的(de)數(shu)據(ju)庫(ku)里做檢(jian)索,檢(jian)索后(hou)(hou)就可以(yi)得到(dao)標(biao)準(zhun)的(de)問(wen)(wen)(wen)題(ti)和(he)答(da)(da)案,然后(hou)(hou)把標(biao)準(zhun)問(wen)(wen)(wen)題(ti)做一層排(pai)序,將分(fen)數(shu)最(zui)高的(de)問(wen)(wen)(wen)題(ti)推薦給用戶(hu)。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

第二個案(an)例是QQ瀏覽(lan)器信(xin)息(xi)流推(tui)(tui)薦(jian)。這些(xie)推(tui)(tui)薦(jian)業務(wu)大量使用騰訊云數(shu)據庫Olama引擎(qing)。用戶(hu)在推(tui)(tui)薦(jian)系統里看(kan)到(dao)的新(xin)聞、視頻(pin),以及(ji)帶(dai)推(tui)(tui)薦(jian)的物(wu)品推(tui)(tui)薦(jian)池(chi),都(dou)輸(shu)入(ru)到(dao)大模(mo)(mo)型(xing)層,大模(mo)(mo)型(xing)有三大類(DSSM模(mo)(mo)型(xing)、圖(tu)數(shu)據庫、序列(lie)模(mo)(mo)型(xing)),通過一(yi)個個序列(lie)大模(mo)(mo)型(xing),將(jiang)帶(dai)推(tui)(tui)薦(jian)的物(wu)品推(tui)(tui)薦(jian)詞變成(cheng)(cheng)一(yi)個個向(xiang)量,放到(dao)Olama引擎(qing)里。當(dang)用戶(hu)來到(dao)推(tui)(tui)薦(jian)系統,就可以根據用戶(hu)過去看(kan)過哪些(xie)新(xin)聞和(he)(he)視頻(pin),將(jiang)用戶(hu)相關行為變成(cheng)(cheng)向(xiang)量,到(dao)數(shu)據庫進行檢(jian)(jian)索,把檢(jian)(jian)索結果合并,推(tui)(tui)薦(jian)出(chu)最(zui)終感興趣的新(xin)聞和(he)(he)視頻(pin)。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

另一個(ge)案例(li)是騰訊視(shi)(shi)頻(pin)(pin)視(shi)(shi)頻(pin)(pin)關(guan)系中臺。Olama引(yin)擎能(neng)用(yong)(yong)在視(shi)(shi)頻(pin)(pin)判重和音(yin)(yin)頻(pin)(pin)判重。具體做法是把一個(ge)個(ge)視(shi)(shi)頻(pin)(pin)庫里的視(shi)(shi)頻(pin)(pin)變(bian)成(cheng)圖(tu)片幀、音(yin)(yin)頻(pin)(pin)抽出(chu)成(cheng)音(yin)(yin)頻(pin)(pin)幀,或者把音(yin)(yin)頻(pin)(pin)通過轉(zhuan)化(hua)成(cheng)文本(ben)的方(fang)式,通過深度學習技術,變(bian)成(cheng)音(yin)(yin)頻(pin)(pin)向(xiang)量(liang)和文本(ben)向(xiang)量(liang)。當(dang)用(yong)(yong)戶輸(shu)入視(shi)(shi)頻(pin)(pin)時(shi),就能(neng)將視(shi)(shi)頻(pin)(pin)向(xiang)量(liang)、音(yin)(yin)頻(pin)(pin)向(xiang)量(liang)、文本(ben)向(xiang)量(liang)進行召回聚合,然后(hou)輸(shu)出(chu)結果,告(gao)訴用(yong)(yong)戶視(shi)(shi)頻(pin)(pin)的相似(si)關(guan)系。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

結語:助攻大模型普及,AI原生向量數據庫將成企業數據處理標配

在大模型(xing)熱(re)潮的催化下,向量數(shu)(shu)(shu)據(ju)(ju)庫(ku)進入飛速發展期。據(ju)(ju)東(dong)北證券預測,到2030年,全(quan)球向量數(shu)(shu)(shu)據(ju)(ju)庫(ku)市場規(gui)模有望達到500億美元,國內向量數(shu)(shu)(shu)據(ju)(ju)庫(ku)市場規(gui)模有望超(chao)過600億人民幣。

向量數(shu)據(ju)庫(ku)能夠幫(bang)助(zhu)企業更高效、便捷(jie)地使用(yong)大(da)(da)(da)模型(xing),將數(shu)據(ju)的價值釋放到(dao)最大(da)(da)(da)。隨著(zhu)大(da)(da)(da)模型(xing)的不斷發展和普(pu)及,AI原生向量數(shu)據(ju)庫(ku)將成為企業數(shu)據(ju)處理的標配(pei)。而(er)騰訊(xun)云向量數(shu)據(ju)庫(ku)希(xi)望走(zou)在AI原生時(shi)代的前排。