智東西(公眾號:zhidxcom
作者?| 智東西編輯部

智東(dong)西12月6日(ri)報(bao)道(dao),為期(qi)兩天的2024中國生(sheng)成式(shi)AI大會(上海站(zhan))今日(ri)圓滿收官。

兩天內,51位產學研投嘉賓代表密集輸出干貨爆棚,大會報名咨詢人數超4000人,超過1200位觀眾到場參會。其中,在主會場進行的大模型峰會、AI Infra峰會的線上觀看人次更是超過104萬。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

現場參會觀眾們的熱情十分高漲,主會場、分會場座無虛席,展覽區附近的產業交流也十分活躍,15家企業的(de)諸多新產(chan)品新技術都引起了廣泛關注和討(tao)論。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

▲大會展區

此次大會以“智能躍進 創造無限”為(wei)主題(ti),51位產(chan)(chan)學研(yan)投(tou)嘉賓代表基于前(qian)瞻性視角解(jie)構和把脈生成式AI的技術產(chan)(chan)品創(chuang)新、商業落地解(jie)法、未來趨勢走向與前(qian)沿研(yan)究焦(jiao)點。

今天的AI Infra峰會上,上海交通(tong)(tong)大(da)學副教授、無(wu)問芯(xin)穹(qiong)聯合創始人(ren)兼首席科學家戴國浩(hao)認為,業界更(geng)應該關注單位算(suan)力(li)如何實(shi)現更(geng)高效(xiao)的(de)token吞吐,大(da)模型實(shi)際可用算(suan)力(li)不僅取(qu)決于芯(xin)片理論(lun)算(suan)力(li),還可通(tong)(tong)過(guo)(guo)軟硬協同優化提高算(suan)力(li)利用效(xiao)率,通(tong)(tong)過(guo)(guo)多元異構適配放(fang)大(da)整體算(suan)力(li)規模。

北電(dian)數(shu)智智算(suan)云(yun)負(fu)責(ze)(ze)人郭文(wen),GMI Cloud亞太區總(zong)裁King.Cui,阿里(li)云(yun)智算(suan)集(ji)群(qun)(qun)產品(pin)解決方案負(fu)責(ze)(ze)人叢培巖,中(zhong)昊芯英芯片軟件(jian)棧負(fu)責(ze)(ze)人朱國梁,光(guang)羽芯辰創始人兼(jian)董事長周(zhou)強分(fen)別(bie)對全棧AI工廠、AI企業(ye)出海如何(he)補齊算(suan)力短(duan)板、高性能智算(suan)集(ji)群(qun)(qun)、國產TPU芯片“No CUDA”軟件(jian)棧、通向個(ge)人大(da)模型之路(lu)幾個(ge)主題進行了(le)分(fen)享。

楓清科技(ji)(ji)創(chuang)始(shi)人兼(jian)CEO高(gao)雪峰,聲網生成式(shi)AI產品負責人毛玉杰(jie),騰訊(xun)云向(xiang)(xiang)量數(shu)據(ju)庫(ku)技(ji)(ji)術負責人謝宇,Jina AI聯合創(chuang)始(shi)人兼(jian)首(shou)席(xi)技(ji)(ji)術官(guan)王(wang)楠,Zilliz合伙人、研發VP欒(luan)小(xiao)凡(fan),英飛流(liu)創(chuang)始(shi)人兼(jian)CEO張穎峰,Alluxio首(shou)席(xi)架構(gou)師傅正佳分別(bie)針對(dui)“從(cong)數(shu)據(ju)到知識:AI重塑百行千業的基(ji)石”、“生成式(shi)AI驅(qu)動(dong)實時互動(dong)的技(ji)(ji)術變革(ge)與(yu)體驗革(ge)新(xin)”、“TencentVDB向(xiang)(xiang)量數(shu)據(ju)庫(ku)”、“RAG范式(shi)下AI Infra的機(ji)遇和挑戰”、“RAG雖強,但向(xiang)(xiang)量數(shu)據(ju)庫(ku)絕非萬(wan)靈藥”、“新(xin)一代企業級多模態RAG引擎”、“高(gao)性(xing)能AI數(shu)據(ju)底座(zuo)”帶來了精彩演(yan)講。

下午場的圓桌討論聚焦“大模型行至深水區,AI Infra的新變化與新機會”,由德聯資本執行董事劉景媛主持(chi),Alluxio首席架構(gou)師傅正佳(jia),Zilliz合伙人(ren)、研發(fa)VP欒小凡(fan),英飛流創始人(ren)兼CEO張穎峰三位嘉賓給出了(le)自(zi)己的真知灼見(jian)。

大(da)(da)會首日,17位嘉賓暢談大(da)(da)語言模型(xing)、多模態大(da)(da)模型(xing)、具身智能、AI原(yuan)生應用(yong)、音樂生成(cheng)、3D AIGC、AI智能體的(de)行業應用(yong)、垂類行業大(da)(da)模型(xing)等前沿議(yi)題(ti)。()

除了大會(hui)(hui)(hui)首日主(zhu)會(hui)(hui)(hui)場進行的(de)(de)大模型峰(feng)會(hui)(hui)(hui),以及今天(tian)主(zhu)會(hui)(hui)(hui)場的(de)(de)AI Infra峰(feng)會(hui)(hui)(hui),大會(hui)(hui)(hui)分會(hui)(hui)(hui)場也(ye)在這兩天(tian)分別(bie)組織了端(duan)側生(sheng)成(cheng)式AI技(ji)(ji)術研(yan)討(tao)會(hui)(hui)(hui)、AI視頻生(sheng)成(cheng)技(ji)(ji)術研(yan)討(tao)會(hui)(hui)(hui)與具身(shen)智能技(ji)(ji)術研(yan)討(tao)會(hui)(hui)(hui),17位青年(nian)學(xue)者(zhe)和技(ji)(ji)術專家(jia)帶來(lai)了報(bao)告分享(xiang),后續將會(hui)(hui)(hui)上架這三場收費制研(yan)討(tao)會(hui)(hui)(hui)的(de)(de)回放。

一、從智算集群到原生加速技術棧,聚焦產業落地痛點突破大模型算力瓶頸

AI的發展(zhan)帶來了巨(ju)大(da)的數據、算力以及能(neng)源(yuan)挑戰(zhan),作為支撐大(da)模(mo)型運行以及生成式AI應用開(kai)發的關(guan)鍵(jian),AI Infra也(ye)走到了臺前,發展(zhan)勢頭強勁(jing)。

如(ru)何打(da)造優質(zhi)的(de)智(zhi)算中心,如(ru)何實現AI從芯(xin)片到應(ying)用端全產業鏈的(de)高效協同(tong)?多位嘉賓給出了(le)自己(ji)的(de)深入見解。

1、上海交通大學副教授、無問芯穹聯合創始人兼首席科學家戴國浩

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

Scaling Law之(zhi)下(xia),數(shu)據成為(wei)制(zhi)約AI繼續發展的(de)因素之(zhi)一。以(yi)GPT-o1為(wei)代(dai)表的(de)推理模型可以(yi)突破(po)數(shu)據瓶頸,但計算范(fan)式(shi)的(de)轉變使算力(li)需求(qiu)呈指數(shu)級(ji)增長(chang),可能(neng)導致(zhi)硬件系統能(neng)耗開銷(xiao)供不應求(qiu),對行(xing)業的(de)可持續發展構成挑戰。

對(dui)此(ci),戴國(guo)浩教授指出(chu),當下業(ye)界更(geng)應該關注(zhu)單(dan)位算力(li)(li)如何實(shi)現更(geng)高(gao)效的token吞吐(tu),讓大(da)模型(xing)的實(shi)際可(ke)用算力(li)(li)不僅(jin)取決于芯片(pian)理(li)論算力(li)(li),還可(ke)通過軟硬協(xie)(xie)同(tong)優化提(ti)(ti)高(gao)算力(li)(li)利用效率(lv),并(bing)通過多元(yuan)異構適配放大(da)整體算力(li)(li)規模。他分享(xiang)了其研究團隊(dui)在軟硬協(xie)(xie)同(tong)、多元(yuan)異構與端側智能方面的研究進展與落地成(cheng)(cheng)果,這(zhe)些成(cheng)(cheng)果能助(zhu)力(li)(li)行業(ye)提(ti)(ti)升面向大(da)模型(xing)場(chang)景的token吞吐(tu)效率(lv)。

2、北電數智郭文:以AI工廠填補國產算力供給側與需求側的產業鏈斷層

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

“產業(ye)要發(fa)展,創新不能只是停留在技術層(ceng)面(mian)(mian)(mian),更要從流程、系統和組織進行全面(mian)(mian)(mian)的創新。”北(bei)電數智(zhi)智(zhi)算云負(fu)責人(ren)郭(guo)文(wen)分享了從算力、算法(fa)、數據與生(sheng)(sheng)態方面(mian)(mian)(mian)全面(mian)(mian)(mian)構(gou)建人(ren)工智(zhi)能時代(dai)AI生(sheng)(sheng)產線(xian)的實踐思考(kao)。

郭文稱,當(dang)下國產(chan)芯片落地人(ren)工智能產(chan)業(ye)的最大問題是,算力(li)供給側(ce)(ce)與需求側(ce)(ce)之間存在(zai)產(chan)業(ye)鏈斷(duan)層。為此,北電數智推出首個“國產(chan)算力(li)PoC平臺(tai)”,以(yi)北京數字經濟算力(li)中(zhong)(zhong)(zhong)心為載體打造具備全(quan)棧能力(li)的AI工廠,全(quan)線適配與拉通場景、模型(xing)到芯片層面,推動智算中(zhong)(zhong)(zhong)心從成(cheng)本中(zhong)(zhong)(zhong)心轉化(hua)為推動地區發展新質生產(chan)力(li)中(zhong)(zhong)(zhong)心。

3、GMI Clould King.Cui:高穩定GPU集群成AI企業全球化布局關鍵

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

中(zhong)國AI出海(hai)加速,算力(li)作(zuo)為其中(zhong)的(de)核心生(sheng)產資(zi)料正發揮重要作(zuo)用。高穩(wen)定性的(de)GPU集(ji)群能(neng)降本增效,幫助企業在AI全球(qiu)化浪(lang)潮中(zhong)取勝(sheng)。

GMI Cloud亞太區總(zong)裁(cai)King.Cui提(ti)到,為(wei)確保GPU集群的(de)高穩定性,他們使(shi)用(yong)了(le)具備主動檢(jian)測功能(neng)的(de)自研云集群引擎,實現計算、存(cun)儲和網絡資源的(de)高效調配。

GMI Cloud是(shi)NVIDIA Top10 NCP,交付前會(hui)進行嚴格的(de)驗(yan)證流程。GMI Cloud與IDC協(xie)作(zuo),提供備件和維修,擁有更短的(de)交付時間,確保停機時間最小化(hua)。

4、阿里云叢培巖:靈駿智算集群不僅要實現穩定性和極致性能,更要在不同維度支持規模的極致擴展

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

阿里云智算集(ji)群產品解決方案負責人叢培(pei)巖預(yu)測(ce),未來模型性能還會隨(sui)參數,數據(ju)集(ji)和算力的增(zeng)長(chang)(chang)繼續(xu)提升,Scaling Law仍有增(zeng)長(chang)(chang)空(kong)間,AI智算集(ji)群的設計范式轉向要以GPU為核心。

阿里云(yun)推出(chu)支持(chi)超(chao)大規模(mo)(mo)分布式訓練的靈駿智(zhi)算集群(qun),可達(da)到(dao)10萬(wan)卡(ka)擴展規模(mo)(mo),千(qian)卡(ka)規模(mo)(mo)線性加速比達(da)到(dao)96%;阿里云(yun)自研(yan)磐(pan)久(jiu)服務器(qi)采用CPU和GPU分離,實現(xian)單(dan)機(ji)提升至16顆GPU;網絡架構(gou)HPN7.0最大規模(mo)(mo)可連(lian)接10萬(wan)顆GPU。

智(zhi)算集群(qun)穩定(ding)性至關重要,阿里云3千卡規模(mo)智(zhi)算集群(qun),在一個月內穩定(ding)訓練時(shi)長占(zhan)比達99%。

5、光羽芯辰周強:解決“大模型不懂你”問題,個人大模型迎來機遇

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

作為與通用(yong)大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)、行業(ye)大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)、企業(ye)大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)并行發(fa)展(zhan)(zhan)的一大(da)(da)(da)分(fen)支,個人(ren)大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)也進入了快速(su)發(fa)展(zhan)(zhan)期。光羽(yu)芯辰創始人(ren)兼董事(shi)長周強稱(cheng),個人(ren)大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)解(jie)決的是(shi)“大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)不懂你”的問題,隨著手機、PC、可穿戴、XR等端側設備廠商All in AI,個人(ren)大(da)(da)(da)模(mo)型(xing)(xing)(xing)(xing)之路將越(yue)走(zou)越(yue)寬。

他提到,個(ge)人大模型(xing)也稱為端(duan)側(ce)大模型(xing),期待解決(jue)端(duan)側(ce)智能體在性(xing)能、功耗和成(cheng)本(ben)方(fang)面的痛點,讓真正(zheng)的AI手機走進生(sheng)活。端(duan)側(ce)AI具備(bei)及(ji)時性(xing)、可靠性(xing)、成(cheng)本(ben)低、隱私保護和定制化五大優勢(shi)。目前,構(gou)建端(duan)側(ce)大模型(xing)的核心(xin)是解決(jue)存儲(chu)帶寬和容(rong)量雙重問題。

6、中昊芯英朱國梁:國產TPU芯片“No CUDA”軟件棧的構建實踐

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

中昊芯英(ying)芯片軟(ruan)件棧(zhan)負責人朱國梁(liang)介紹了(le)他們在為國產TPU芯片構建“No CUDA”軟(ruan)件棧(zhan)的實踐經驗(yan)。

中昊芯英剎那芯片采(cai)用VLIW指(zhi)令集架構,面(mian)對龐大的CUDA生態(tai),他們逐(zhu)一解決(jue)了庫(ku)、并行(xing)計算與編程方面(mian)的問(wen)題,全自研用戶態(tai)和內核(he)態(tai)驅動(dong),實現了芯片的高(gao)效(xiao)管(guan)理。

為做(zuo)好生態兼容,中(zhong)昊芯(xin)英底層(ceng)軟件棧兼容PyTorch以及(ji)所有主流(liu)訓推框架,目前(qian),中(zhong)昊芯(xin)英可提供(gong)定(ding)制的端(duan)到(dao)端(duan)的云(yun)智算解(jie)決方案,并支(zhi)持(chi)國產操作系(xi)統。

二、從企業智能體、向量數據庫到RAG,AI Infra基礎軟件涌現諸多新挑戰

下午場,多(duo)位嘉賓(bin)進(jin)一步分享了(le)AI Infra領域關于智能(neng)體開發管(guan)理平(ping)臺、實時語音、向量數據庫、向量模型、RAG技術(shu)、數據編(bian)排等方面的行(xing)業(ye)觀察(cha)和深(shen)入見解。諸多(duo)新平(ping)臺、新產品、新技術(shu)走(zou)向前臺,賦能(neng)產業(ye)。

1、楓清科技高雪峰:從數據到知識,跨越生成式AI與決策智能間的鴻溝

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

楓(feng)清科(ke)技創始(shi)人兼CEO高雪(xue)峰談道(dao),要將(jiang)生成式(shi)AI真正(zheng)應用到企(qi)業決策場景(jing)中,彌合其與決策智(zhi)能之間鴻(hong)溝的技術突破(po)點,就是在推(tui)理框架側融合符號邏輯(ji)推(tui)理。

企業智能(neng)化(hua)(hua)落(luo)地(di)需要面臨(lin)數(shu)據孤島、數(shu)據整合、知識(shi)校驗、數(shu)據實(shi)時效等(deng)技術挑(tiao)戰。楓清科(ke)技可以為企業提供(gong)知識(shi)引(yin)擎與大模型雙輪驅動的(de)新一代智能(neng)體平臺,通(tong)過構(gou)建全鏈路優化(hua)(hua)體系,幫助(zhu)企業提升數(shu)據質量,將企業本地(di)數(shu)據知識(shi)化(hua)(hua),并融合大模型沉(chen)淀的(de)泛化(hua)(hua)能(neng)力(li),在知識(shi)網絡之上進(jin)行符(fu)號邏輯(ji)推理,實(shi)現(xian)可解釋的(de)智能(neng),進(jin)而使AI在多個場景下能(neng)夠實(shi)現(xian)精準、透明的(de)決策支持(chi),推動企業智能(neng)化(hua)(hua)轉型的(de)順利實(shi)施。

2、聲網毛玉杰:生成式AI+實時互動,讓人機交互變成真正的心靈交互

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

聲網生成(cheng)式AI產品負責人(ren)毛(mao)玉(yu)杰(jie)講述了生成(cheng)式AI出現(xian)后(hou)實時互動(RTE,Real-Time Engagement)技術和體驗(yan)的變遷。

毛(mao)玉杰介紹,2014年至今十年,RTE從服務(wu)質(zhi)量(liang)走向體(ti)驗質(zhi)量(liang);2025年開始,在生(sheng)成式AI發展的背景(jing)下(xia),RTE向AI RTE變革,開始注(zhu)重跨模(mo)態體(ti)驗質(zhi)量(liang),做多模(mo)態交互、跨模(mo)態轉(zhuan)換,為人和模(mo)型(xing)而設計,給大模(mo)型(xing)廠商提(ti)供眼睛、耳朵(duo)和聲音能力。

毛(mao)玉杰(jie)說,目前人(ren)機對話已經達到“聽得懂(dong)”的(de)狀(zhuang)態,期待(dai)下一(yi)步實現“聽得心(xin)”——讓人(ren)機交互變成真正的(de)心(xin)靈交互。

3、騰訊云謝宇:向量數據庫助力企業挖掘更大數據價值

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

AI時代(dai),向量(liang)數(shu)據(ju)庫(ku)(VDB)脫穎(ying)而出(chu),成(cheng)為(wei)連接(jie)結構(gou)化與非結構(gou)化數(shu)據(ju)的(de)樞(shu)紐。然而,當VDB被運用(yong)于RAG場景時,多款(kuan)開源RAG架構(gou)出(chu)現了(le)召回(hui)率低的(de)問題(ti)。

騰訊(xun)云向量數(shu)據庫技術(shu)負責(ze)人謝(xie)宇介紹,為解決上述挑戰,騰訊(xun)首先提升了(le)復雜文(wen)檔的(de)識(shi)別效果,并對數(shu)據處理(li)、Embedding、檢索、總結等其(qi)他(ta)環節(jie)進行(xing)優化,最終實現(xian)了(le)90%以上的(de)召(zhao)回率。

騰(teng)訊自研向量檢索引擎OLAMA已(yi)上線5年,日均處(chu)理(li)8500億次檢索請求。未(wei)來,他們還將在性能、成本、業務效果(guo)、容災率等方(fang)面(mian)發力,持續提升(sheng)產品表現。

4、Jina AI王楠:長文本大模型、RAG長期共存,長窗口向量模型面臨兩大挑戰

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

大(da)模型(xing)存(cun)在幻覺(jue)、無法保證私有數據安(an)全、推理成(cheng)本(ben)高(gao)三大(da)問題,Jina AI聯合創始(shi)人兼首席技術官王楠認為,RAG正是通過(guo)縮小大(da)模型(xing)生成(cheng)范(fan)圍,保證檢索準確(que)性(xing)、實現結果可溯源,所(suo)以長本(ben)文大(da)模型(xing)不會取(qu)代RAG,二者將長期共存(cun)。

短窗(chuang)口(kou)(kou)會導致上下文背景信息丟失(shi),因此(ci)RAG需(xu)要(yao)長窗(chuang)口(kou)(kou)向(xiang)量模型支持。但(dan)長窗(chuang)口(kou)(kou)向(xiang)量模型面臨兩(liang)大挑戰,一是(shi)(shi)推(tui)理成本(ben)和內存消(xiao)耗會隨窗(chuang)口(kou)(kou)長度(du)呈平方線性增長,共享GPU是(shi)(shi)解決思路之一;二是(shi)(shi)長窗(chuang)口(kou)(kou)使模型無法完整表示細顆粒度(du)語(yu)義,解法是(shi)(shi)增加向(xiang)量維度(du)和多向(xiang)量表示。

5、Zilliz欒小凡:向量數據庫落地面臨成本及擴展性挑戰,RAG轉為Graph RAG

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

Zilliz合(he)伙(huo)人、研發(fa)VP欒小凡分享了向量數(shu)據庫目前面臨的挑(tiao)戰以及(ji)相應解決方(fang)案(an)。

欒小凡稱,2025年(nian)新生成(cheng)的(de)數據中,將會有80%以上是(shi)非結(jie)構化數據。在這一數據壓力下,向量數據庫(ku)的(de)落地(di)面臨(lin)著(zhu)成(cheng)本(ben)以及擴展(zhan)性等方面的(de)種(zhong)種(zhong)挑(tiao)戰。而(er)目前的(de)RAG存在搜索質量難、處(chu)理長尾查詢能(neng)力差、結(jie)果難以解釋和控制、向量存儲成(cheng)本(ben)高等問題。

據此,欒小(xiao)凡及其團隊提出了兩(liang)個解決思(si)路:一是混合查(cha)詢,在單個系統(tong)內支持(chi)密集嵌入、稀疏嵌入和詞匯搜索;二是Graph RAG,將(jiang)知識圖譜和向量檢索結合起來(lai)。

6、英飛流張穎峰:多模態RAG新范式

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

英飛(fei)流創始人兼CEO張穎(ying)峰認為,RAG作(zuo)為LLM時代(dai)的數據庫,目前(qian)面臨著三大挑戰——多模態文檔處理(li)、檢索、語(yu)義(yi)鴻溝。

針對第一(yi)個問題(ti),英飛流訓(xun)練了深度(du)文(wen)檔(dang)理解模(mo)(mo)型,能(neng)對復雜文(wen)檔(dang)中(zhong)的(de)多模(mo)(mo)態內容(rong)進行(xing)分類(lei)處(chu)理。而在檢索(suo)這一(yi)RAG“最后一(yi)公里”的(de)問題(ti)上,英飛流使用三路召回(hui)方(fang)(fang)案,并增(zeng)加張量索(suo)引進行(xing)重排(pai)序,這一(yi)方(fang)(fang)案在多模(mo)(mo)態RAG上展(zhan)現出明顯優(you)勢(shi)。

最后,針對檢索過程(cheng)中的語義鴻溝,英飛流使用(yong)GraphRAG抽取知(zhi)識圖譜,并與原數據進行聯(lian)合檢索,提升檢索質量(liang)。

7、Alluxio傅正佳:零改造、無侵入策略,打造高性能AI數據底座

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

Alluxio首席(xi)架構師傅正(zheng)佳談到了(le)提升大規模(mo)模(mo)型訓練(lian)效(xiao)率(lv)(lv)的兩大挑戰:一是(shi)數據規模(mo)不斷增長、類(lei)型更多元化,因此(ci)處理數據需要提升算力(li)有(you)效(xiao)利(li)用(yong)率(lv)(lv);二是(shi)當數據喂(wei)到訓練(lian)平臺上,數據IO訪問瓶頸會(hui)導(dao)致算力(li)處于低利(li)用(yong)率(lv)(lv)狀態。

這一(yi)背(bei)景下,Alluxio提供了統一(yi)的數(shu)據視圖、豐富協(xie)議轉化、高(gao)性能數(shu)據訪問,以打造(zao)整體數(shu)據服務。其方案通過零改(gai)造(zao)、無(wu)侵入策略,可以使算法工程師仍按原有方式工作,無(wu)需(xu)改(gai)變已有腳本,并且客(ke)戶已經有的大量存量數(shu)據不需(xu)要(yao)進行(xing)私有化協(xie)議改(gai)造(zao)。

三、AI 2.0時代,大模型行至深水區,AI Infra迎來變革

在圓桌論壇環節(jie),幾位嘉賓分享(xiang)了對(dui)于“大(da)模型行至深水區,AI Infra的新變化與新機會”這一主(zhu)題的行業(ye)洞察,以(yi)及(ji)各自公司的產品和技(ji)術是如何解決AI應用中(zhong)的核心痛點的。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

作為主(zhu)持人的(de)德聯資本(ben)執行董(dong)事劉景媛提(ti)到,兩年前,ChatGPT將(jiang)生成式(shi)AI推到臺前,迎來AI 2.0時代,Scaling Law和數據量(liang)的(de)大規模(mo)增長給AI Infra帶來了非常大的(de)增量(liang)機會(hui)。兩年后的(de)今天大模(mo)型(xing)行至深水區(qu),AI Infra在幫助大模(mo)型(xing)及相關產品的(de)落(luo)地的(de)過程中,產品邊界和功(gong)能需求逐漸明晰。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

▲劉景媛

對于Infra這類研(yan)發周(zhou)期長、工程復雜(za)程度高的(de)軟件產品(pin),開源社區或許(xu)可(ke)以貢獻一些能量(liang),使產品(pin)迭代及技術選(xuan)型更貼合實際需(xu)求,同時提升項目本身的(de)關注(zhu)度和影(ying)響力。

另外,“go global”也(ye)幾乎成為Infra軟件(jian)的(de)(de)必選(xuan)項(xiang),一方(fang)面(mian)有商業的(de)(de)考量,另外中國(guo)工程師的(de)(de)勤奮和工程攻堅能力(li)全(quan)球有目(mu)共(gong)睹。值得關注的(de)(de)是(shi),在資源有限的(de)(de)情況(kuang)下也(ye)要做(zuo)好取舍(無論是(shi)功能方(fang)面(mian)還(huan)是(shi)業務模式方(fang)面(mian))。

Zilliz作為(wei)向量數據庫企業,其產品可(ke)以處理大體量非結構(gou)化數據,挖掘數據價(jia)值(zhi)。對AI 2.0時代的(de)需(xu)求變化,Zilliz合伙人、研發VP欒小凡認(ren)為(wei),AI技(ji)術在去年被高估、今年被低估,往(wang)后看AI落地還需(xu)要(yao)等一(yi)個(ge)機會,這(zhe)也是整個(ge)范式的(de)發展機會。

談到(dao)開源(yuan),欒小(xiao)凡(fan)感慨道,Zilliz目(mu)前正處于最(zui)具挑戰的階段,一方(fang)面要讓產品滿足客戶(hu)需(xu)求,另一方(fang)面要讓產品變(bian)現。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

▲欒小凡

當下,AI Infra公司出(chu)海(hai)(hai)已經(jing)成(cheng)為必(bi)答題(ti)。欒小(xiao)凡認為出(chu)海(hai)(hai)的(de)前提條(tiao)件就是產品(pin)要(yao)(yao)有先發優勢,在擴(kuo)展性、功能(neng)等方面碾壓競品(pin)。產品(pin)定制方面,欒小(xiao)凡的(de)觀點是Zilliz幾乎不做定制。原因在于其所處的(de)賽道已經(jing)足夠大(da),沒有必(bi)要(yao)(yao)執著于將自己打造成(cheng)大(da)而全的(de)平(ping)臺。

AI時代,數(shu)據(ju)(ju)量的暴增對存儲(chu)提出(chu)巨大挑戰(zhan)。Alluxio首席架構師(shi)傅正(zheng)佳介紹,他們通(tong)過分(fen)布式數(shu)據(ju)(ju)編排(pai)軟件系(xi)統,高效連接存儲(chu)與計算。Alluxio很(hen)早(zao)就注意到(dao)存算分(fen)離的趨勢,并在(zai)數(shu)據(ju)(ju)遠(yuan)程訪問環節(jie)重點(dian)發(fa)力,回應了AI存儲(chu)挑戰(zhan)。

Alluxio的(de)(de)存儲系統兼具開(kai)閉(bi)源(yuan)(yuan)版本,傅正佳認為(wei)開(kai)源(yuan)(yuan)幫助他(ta)們保持了(le)與技術前(qian)沿(yan)的(de)(de)同(tong)步,也打出(chu)了(le)知名度(du),但他(ta)們也面臨著商(shang)業化和(he)部(bu)分(fen)開(kai)源(yuan)(yuan)用(yong)戶(hu)貢獻(xian)程度(du)低的(de)(de)問題。Alluxio目前(qian)正積極出(chu)海,傅正佳分(fen)享,海內外團(tuan)隊的(de)(de)優勢互補與產品的(de)(de)本地化是其中的(de)(de)關鍵。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

▲傅正佳

英飛(fei)流創始人(ren)兼CEO張(zhang)穎(ying)峰稱,RAG用起(qi)來很容易,但做(zuo)好非常困(kun)難。公(gong)司(si)能做(zuo)成RAG的核心在于,把做(zuo)系統的人(ren)和做(zuo)AI的人(ren)融(rong)合在了一起(qi)去做(zuo)產品。

談及開(kai)源,張穎(ying)峰說,開(kai)源是商(shang)業(ye)化(hua)的一種策略,而不是為了開(kai)源而開(kai)源;為了出海必須開(kai)源,但創(chuang)業(ye)第一天(tian)就(jiu)要想明白產品企(qi)業(ye)版和開(kai)發者版之間的區(qu)別。

2024中國生成式AI大會上海站圓滿收官,第二日AI Infra峰會演講精華一文看盡

▲張穎峰

目前(qian)英飛流的(de)Infra產品還沒(mei)有進入商(shang)業(ye)化階段,結合(he)過(guo)往創業(ye)經歷,張穎(ying)峰稱,商(shang)業(ye)化過(guo)程中,創始人必須對每個產品的(de)特性(xing)和定制化的(de)邊界有非(fei)常清(qing)晰的(de)認識。

結語:生成式AI產業化落地加速,上中下游全產業鏈呼喚合作共贏

過(guo)去一(yi)(yi)年,生成(cheng)式AI的發(fa)展度過(guo)了波(bo)瀾壯闊的一(yi)(yi)年,整(zheng)個產(chan)業鏈成(cheng)為全球創新、投資和(he)應用(yong)最活躍(yue)的領(ling)域之一(yi)(yi),每位參(can)與(yu)者都在與(yu)時間賽跑。

Sora掀起視頻生成熱(re)潮(chao),多模(mo)態(tai)世界模(mo)型(xing)(xing)的研究熱(re)度(du)漸(jian)起。更具革命性的推理模(mo)型(xing)(xing)o1悄然(ran)出世,基(ji)座大語言模(mo)型(xing)(xing)不(bu)再持續狂飆,不(bu)僅價格戰(zhan)、營銷(xiao)戰(zhan)硝煙燃起,融(rong)資熱(re)度(du)降溫,Scaling Law是(shi)否撞墻更是(shi)在年底(di)引發熱(re)議。

行業賦能(neng)(neng)持續進行,包括(kuo)智能(neng)(neng)體在(zai)內的(de)應用層的(de)興起仍然(ran)備受期待(dai)。同時,大模(mo)型向邊端下沉的(de)趨勢日趨明顯,AI手機、AI PC等AI硬(ying)件紛紛站上風口。不止AI硬(ying)件,大模(mo)型驅動下的(de)具身智能(neng)(neng)更是熱(re)度空前,人(ren)形機器人(ren)正(zheng)開啟星辰大海(hai)。

作為智能產業的長期觀(guan)察者,我們期待見證(zheng)并記(ji)錄中國(guo)生成式AI浪潮之變,并將持續(xu)邀請這股浪潮中的生力軍們,分(fen)享(xiang)他們最(zui)新的技術進展(zhan)與商業化(hua)探索。

隨著今(jin)日(ri)為期兩(liang)天的2024中(zhong)國(guo)生成(cheng)式AI大會(上(shang)海站)圓滿收官。2025年(nian)線(xian)(xian)下大會也將正式啟動(dong),除了1月14日(ri)的全球自動(dong)駕駛峰會,圍繞AI芯(xin)片、生成(cheng)式AI等領(ling)域的線(xian)(xian)下大會也已規劃(hua)上(shang)了,敬請(qing)期待。