
智東西(公眾號:zhidxcom)
作者 | GenAICon 2025
4月1日(ri)-2日(ri),一場(chang)全場(chang)干貨(huo)爆棚的生成(cheng)式AI盛(sheng)會(hui),在北(bei)京圓滿舉行。
開(kai)年以來,DeepSeek的(de)異軍突(tu)起,改寫了中(zhong)西大(da)模(mo)型(xing)競爭敘事。生成(cheng)式AI似乎猛然沖進(jin)一個(ge)全新(xin)征程中(zhong),中(zhong)國企業更是(shi)斗志昂(ang)揚地踴躍(yue)創新(xin),不僅領(ling)銜AI開(kai)源盛(sheng)世,還(huan)掀起了新(xin)一輪模(mo)型(xing)部(bu)署與AI應用研發熱潮,在(zai)這千載難逢(feng)的(de)歷(li)史機遇期全速沖鋒。
為此,我們發(fa)起了一場聚焦前沿技(ji)術與產業趨勢的春日AI聚會(hui)——2025中(zhong)國生成式AI大會(hui)(北京站)。
大會以(yi)“大拐點 新征程”為主題,兩天(tian)之內,超過50位產學(xue)研嘉賓(bin)密集輸出(chu)高濃度(du)、高質量(liang)的(de)干貨信息,深度(du)解構DeepSeek引發的(de)變(bian)革狂(kuang)潮,全面展示覆蓋深度(du)推理模(mo)型(xing)、多(duo)模(mo)態模(mo)型(xing)與世界(jie)模(mo)型(xing)、AI Infra(AI基礎設施)、AIGC應用、Agents(智(zhi)能(neng)(neng)體)、具身智(zhi)能(neng)(neng)等領(ling)域(yu)的(de)生成式AI最新進展。
▲中國(guo)生成式AI大(da)會(hui)主會(hui)場開幕(mu)式、GenAI應用論壇、大(da)模型峰會(hui)、分會(hui)場技術研討會(hui)、展區人流密集
本屆(jie)大(da)會(hui)主(zhu)(zhu)會(hui)場(chang)(chang)舉辦(ban)(ban)開幕式、GenAI應(ying)用論壇、大(da)模(mo)型(xing)峰會(hui),分會(hui)場(chang)(chang)舉辦(ban)(ban)3場(chang)(chang)以DeepSeek R1與(yu)推(tui)理、AI智能體、具身智能大(da)模(mo)型(xing)為(wei)主(zhu)(zhu)題(ti)的(de)技術研(yan)討會(hui),期間既有(you)同頻共(gong)振,又有(you)激烈觀(guan)點交鋒,現場(chang)(chang)參會(hui)觀(guan)眾超過1500人。
展(zhan)區(qu)亦(yi)是(shi)人頭攢動,從早(zao)到晚(wan)充(chong)斥著熱(re)切(qie)的交流聲,Alluxio、Zenlayer、DriveNets、澳(ao)鵬數據、晴數智慧、中昊(hao)芯英(ying)、GMI Cloud、焱融科(ke)(ke)(ke)技(ji)(ji)、英(ying)博數科(ke)(ke)(ke)、華為云、研惠(hui)通(tong)、新(xin)晧誠科(ke)(ke)(ke)技(ji)(ji)、楓清科(ke)(ke)(ke)技(ji)(ji)、科(ke)(ke)(ke)華數據、首都在(zai)線(xian)、清智圖(tu)靈(ling)等16家(jia)企(qi)業帶來最新(xin)技(ji)(ji)術產品(pin)展(zhan)示。
這已經是智一(yi)科技旗下智猩猩、智東(dong)西共同發起中國生成(cheng)式AI大(da)會的第四屆,也是AI青年學者密度最(zui)高的一(yi)屆。自(zi)2023年以來,大(da)會累(lei)計(ji)吸引了數千人(ren)線下參會,線上觀看人(ren)次更是超過1000萬,成(cheng)為國內AI領域最(zui)具影(ying)響力的產業峰會之一(yi)。
?▲聯想集團Game of AI科普視(shi)頻在大會展(zhan)播:聯想工廠制(zhi)(zhi)造(zao)控制(zhi)(zhi)塔MCT2.0,生成式(shi)AI在制(zhi)(zhi)造(zao)業首次落(luo)地
智一科技聯合創始人、CEO龔倫常在致辭環節宣布:今年,中國生成式AI大會正式升級為“智領未來”北京人工智能系列品牌活動之一。
“智領未(wei)來”是(shi)北(bei)(bei)京市(shi)科委、中(zhong)關村管委會(hui)打造的(de)(de)北(bei)(bei)京市(shi)人工智能(neng)領域(yu)的(de)(de)活動(dong)品(pin)牌。此外,同樣作(zuo)為“智領未(wei)來”北(bei)(bei)京人工智能(neng)系(xi)列品(pin)牌活動(dong)之一(yi)的(de)(de)中(zhong)國(guo)AI算力峰會(hui)將于今年6月在北(bei)(bei)京舉辦。
龔倫常還(huan)預告(gao)了(le)將(jiang)(jiang)于今(jin)年舉(ju)辦(ban)的(de)多個主題(ti)會(hui)(hui)議:4月底,中國汽(qi)車智(zhi)能化創新峰會(hui)(hui)將(jiang)(jiang)在(zai)上海車展期間同步舉(ju)辦(ban);9月,全球(qiu)AI芯片峰會(hui)(hui)將(jiang)(jiang)在(zai)上海舉(ju)辦(ban);11月,中國具身(shen)智(zhi)能機器人(ren)大會(hui)(hui)將(jiang)(jiang)在(zai)深(shen)圳舉(ju)辦(ban)。歡迎感興趣的(de)朋友們關注(zhu)。
▲智一科技聯合(he)創始人、CEO龔倫常致辭(ci)
一、開幕式:突破大模型預訓練瓶頸,為AI應用爆發掃清障礙
進入(ru)2025年,AI領域涌現哪些新關(guan)鍵詞(ci)?慢思(si)考推理技(ji)術如何緩解(jie)大模型(xing)預訓(xun)練瓶頸?怎樣讓(rang)機器人(ren)操(cao)作交互像跳舞一樣絲滑?Agents(智能體)落(luo)地企業需攻(gong)克哪些挑(tiao)戰?國產算力怎么(me)解(jie)鎖萬卡集群(qun)難(nan)關(guan)?
在大會(hui)首(shou)日開幕式上,產學研(yan)嘉(jia)賓圍(wei)繞深度推理(li)模型、具身(shen)智(zhi)能機器人、AI智(zhi)能體、AI算力基礎設施(shi)、AI應用,分享了對最新(xin)技術思路與推動(dong)落地的觀察(cha)與思考。
1、人大趙鑫:慢思考推理技術如何緩解大模型預訓練瓶頸?
中國(guo)人民(min)大(da)學高瓴(ling)人工智能學院(yuan)教(jiao)授趙鑫(xin)談(tan)道,大(da)模(mo)型(xing)本(ben)質上是一個條件概(gai)率生成(cheng)模(mo)型(xing),思(si)維鏈(lian)會提升預測正確的可(ke)能性。
當前訓練模型(xing)性能增長會出現(xian)邊(bian)際(ji)效益遞(di)減,其中數據(ju)和算力是探索擴展法則的(de)主(zhu)要(yao)限制(zhi),這(zhe)也是為何當下需要(yao)慢思考推(tui)理(li)技術。
慢思考推理技術的(de)(de)(de)基(ji)(ji)(ji)本(ben)思路是“搜索+學習”的(de)(de)(de)結(jie)合,具體來看,包括基(ji)(ji)(ji)于(yu)(yu)多次采樣(yang)的(de)(de)(de)方法(fa)、基(ji)(ji)(ji)于(yu)(yu)樹搜索的(de)(de)(de)方法(fa)、基(ji)(ji)(ji)于(yu)(yu)SFT(監督微調)的(de)(de)(de)方法(fa)、基(ji)(ji)(ji)于(yu)(yu)RL(強化學習)的(de)(de)(de)方法(fa)。
趙鑫教授團隊在慢思考技術方面進行了大量研究。在RL技術領(ling)域,找(zhao)到可驗證的訓(xun)練數(shu)據非常(chang)重要,團隊系(xi)統探索(suo)了類R1模型(xing)的復現方法。
推(tui)理模(mo)型(xing)本質上可以認為(wei)是(shi)一個具(ju)備逐步推(tui)理/動作規劃(hua)的(de)(de)“大腦”,未(wei)來推(tui)理模(mo)型(xing)可能會(hui)深刻(ke)影響現有智能體的(de)(de)設(she)計模(mo)式(shi)。
▲中國人民大學高瓴人工(gong)智能學院教授趙鑫
2、清華許華哲:如何讓機器人的操作交互像跳舞一樣“絲滑”?
清華大學交叉學院助理教授、博導、星海圖聯合創始人許華哲談道,當前機器人做跳舞、跑步、扭秧歌這類事已經很嫻熟了,有大量數(shu)據支撐,但在操作交互方(fang)面數(shu)據十分匱乏,還有很長的路要走。
解(jie)決(jue)數(shu)據難題(ti),讓機器人有觸(chu)覺(jue)是非常(chang)關鍵的,這樣(yang)數(shu)據才能更豐(feng)富,團隊設(she)計了仿真手套,可以讓機器人同步人手的操作。
有了(le)數(shu)(shu)據(ju)(ju)還不夠,數(shu)(shu)據(ju)(ju)量(liang)也非常關鍵,為此,團隊通(tong)過DemoGen的(de)方(fang)(fang)式(shi)豐富數(shu)(shu)據(ju)(ju)量(liang),借此機(ji)器人的(de)泛化能力可以(yi)得(de)到(dao)進一步提(ti)升。相比(bi)傳統方(fang)(fang)式(shi),通(tong)過DemoGen的(de)方(fang)(fang)式(shi)獲得(de)數(shu)(shu)據(ju)(ju)的(de)速度快了(le)上萬倍。
未來讓(rang)機器人能夠泛化地去做(zuo)更多(duo)的柔性操作,是團隊努力(li)的方(fang)向(xiang)。
▲清(qing)華大學交叉學院助(zhu)理(li)教授(shou)、博導、星海圖聯合創始人許華哲
3、PINE AI李博杰:AI原生團隊是組織形態的一場重大變革
PINE AI聯合創始人(ren)、首席科學(xue)家(jia)李博杰認為,AI Agent在(zai)爆火的同(tong)時,也(ye)面臨著企業知識孤島、GUI使用困難、缺少獨立測(ce)試環境(jing)、無法長時間運行等問(wen)題。
要(yao)打(da)造AI原(yuan)生團隊(dui),讓AI真正成(cheng)為(wei)“數(shu)字員(yuan)(yuan)工”,需要(yao)為(wei)Agent打(da)造類(lei)似開(kai)源社區的溝通文化,實現開(kai)放透明的信息(xi)共(gong)享,并配備AI友(you)好的團隊(dui)協作工具接(jie)口、完(wan)善的測(ce)試環境與測(ce)試用例,同時讓每個員(yuan)(yuan)工都擁有AI助理。
從(cong)技(ji)術層面(mian)來(lai)(lai)看,未來(lai)(lai)Agent還(huan)需(xu)要在明晰需(xu)求、主動溝通(tong)、主動協作、長期記(ji)憶、自我反思回溯(su)與高(gao)精度內部知識庫搜索等方面(mian)實(shi)現(xian)突破,才(cai)能真正實(shi)現(xian)從(cong)工具到團(tuan)隊成員的轉變。
▲PINE AI聯合創始人、首席科學家李博杰(jie)
4、壁仞科技丁云帆:64卡4TB顯存訓練滿血DeepSeek-V3,異構混訓逐步邁向萬卡集群
DeepSeek引爆了大模(mo)型落地元年。壁(bi)仞(ren)科技AI軟件(jian)首席架(jia)構師丁(ding)云帆認為,大模(mo)型落地需(xu)要(yao)工程(cheng)和(he)算法的協同創新,數據是燃料,算法是引擎(qing),算力是加(jia)速器。
壁仞(ren)(ren)科(ke)技目前有萬卡集(ji)群(qun)整(zheng)體解決(jue)方案和(he)智(zhi)算生態,希(xi)望通過(guo)軟(ruan)硬(ying)協同&算法(fa)與工程協同,系統性地破解大模型算力難(nan)題:硬(ying)件集(ji)群(qun)算力方面(mian),壁仞(ren)(ren)科(ke)技自(zi)主原創(chuang)了GPU芯片架(jia)構,引(yin)領(ling)Chiplet技術趨勢;軟(ruan)件有效算力方面(mian),有大模型訓(xun)推(tui)一(yi)體平臺,業界首次(ci)實(shi)現大模型訓(xun)練(lian)自(zi)動(dong)彈性擴縮容。業界首創(chuang)三級異步checkpoint,千(qian)卡集(ji)群(qun)千(qian)億參數(shu)可以實(shi)現自(zi)動(dong)斷(duan)點續(xu)訓(xun)小于(yu)5分鐘,大幅(fu)提升(sheng)集(ji)群(qun)穩定性。
大規模(mo)分布(bu)式優化(hua)方面(mian),壁仞(ren)科技(ji)針(zhen)對國(guo)產GPU高效適配(pei)DeepSeek進行了一系(xi)列技(ji)術優化(hua)創新(xin),64卡4096GB顯存即可(ke)支(zhi)持DeepSeek-V3滿血版(ban)高效全參訓練(lian),而其(qi)他已公布(bu)方案至(zhi)少需要256卡。
此外異(yi)構(gou)聚合算力方(fang)面,壁仞(ren)科技自主原創了(le)異(yi)構(gou)GPU協同訓練方(fang)案HGCT,支持4種及(ji)以(yi)上異(yi)構(gou)GPU協同訓練同一(yi)個大(da)模型(xing),解決了(le)異(yi)構(gou)混訓的(de)關鍵技術挑(tiao)戰,已(yi)實現數(shu)千卡(ka)(ka)規模混訓,下一(yi)步將突破萬(wan)卡(ka)(ka)混訓。
▲壁仞(ren)科技AI軟(ruan)件首席(xi)架(jia)構師丁云帆
5、英諾天使基金王晟:AI應用爆發,需要新終端設備的出現
英諾天使基(ji)金合伙人王(wang)晟談道,2023年(nian)是(shi)(shi)大(da)語言(yan)模(mo)(mo)型(xing)的(de)爆發期(qi),2024年(nian)則轉向多模(mo)(mo)態技(ji)術,但2024年(nian)被寄(ji)予厚望的(de)“AI應用元年(nian)”并未(wei)如期(qi)而至,主要原因是(shi)(shi)缺乏新(xin)終端設(she)備(bei)和新(xin)場(chang)景(jing)定義,當前既有(you)設(she)備(bei)的(de)場(chang)景(jing)需求(qiu)已(yi)接近飽和。
▲英諾天使基金合伙人王(wang)晟(sheng)
未來,AI應用的爆發可能需要于新終端設備、新計算能力的出現。能夠(gou)提(ti)供情緒價值的AI玩具(ju)和陪(pei)伴類(lei)產品也擁有(you)巨大(da)的潛力,因為(wei)(wei)人類(lei)為(wei)(wei)情緒價值買(mai)單(dan)的意愿非常強(qiang)烈。
此外,AI公司的發展方向正從工具提供轉(zhuan)向智能代理,未(wei)來會成為“造(zao)人(ren)”的公司,讓AI能夠承擔更(geng)復(fu)雜的任務,甚至取代人(ren)類(lei)從事(shi)多種職業。2025年,AI領(ling)域的關(guan)鍵詞包括應(ying)用、AI硬件、具身智能和世界模型,這些(xie)方向將定義未(wei)來的技術和市(shi)場格局。
二、高端對話:中國AGI新征程全速起航,全產業鏈迎巨大發展機會
以《DeepSeek開(kai)啟大模型下半場 中國AGI新(xin)征程(cheng)全(quan)速起(qi)航》為主題的高端對話,由智(zhi)一(yi)科(ke)(ke)技聯合(he)創(chuang)(chuang)始人(ren)(ren)、智(zhi)車(che)芯產(chan)媒矩陣總編(bian)輯(ji)張國仁主持,彩(cai)云科(ke)(ke)技創(chuang)(chuang)始人(ren)(ren)兼CEO袁(yuan)行遠,GMI Cloud創(chuang)(chuang)始人(ren)(ren)兼CEO Alex Yeh,PINE AI聯合(he)創(chuang)(chuang)始人(ren)(ren)、首席科(ke)(ke)學家李博杰,智(zhi)澄AI創(chuang)(chuang)始人(ren)(ren)及CEO胡魯輝,四位嘉賓分別(bie)作為AI應(ying)用、算力云、Agent、具(ju)身智(zhi)能企業(ye)代(dai)表(biao)進行分享。
智一科技聯合(he)創始人、智車芯產媒矩(ju)陣總編輯張國(guo)仁(ren)談道,今年春節以來,從DeepSeek、人形(xing)機器人到(dao)通用Agent產品Manus,中(zhong)(zhong)國(guo)團隊(dui)不斷造出現象級AI產品,2025年AI發(fa)展似乎進入了“中(zhong)(zhong)國(guo)時(shi)刻(ke)”,隨著中(zhong)(zhong)國(guo)AGI新征程全速起航,中(zhong)(zhong)國(guo)市場、中(zhong)(zhong)國(guo)公司在全球AI格局扮(ban)演的角(jiao)色和發(fa)展特(te)征都備受關注。
▲智(zhi)一科(ke)技聯合創始人、智(zhi)車芯(xin)產媒矩(ju)陣總編(bian)輯張國(guo)仁
1、DeepSeek顯著提升成本效益
PINE AI聯合創始人、首席科學家李博杰認為,DeepSeek-R1揭示了大模(mo)型訓練的真實成(cheng)本,讓(rang)世界了解到只要方法得當,便能訓練出(chu)優秀的模(mo)型。
GMI Cloud創(chuang)始人兼(jian)CEO Alex Yeh談(tan)道,DeepSeek的開源模型(xing)顯著(zhu)降低(di)了企(qi)業的部署成本,使企(qi)業能夠以低(di)成本快(kuai)速(su)構建應用。
彩(cai)云科技(ji)創(chuang)始人兼CEO袁行(xing)遠(yuan)更是用事實說話,提到彩(cai)云科技(ji)旗下產品在(zai)切換到DeepSeek后,成(cheng)本降低了(le)90%,毛利率轉正(zheng)。
▲彩云科(ke)技創始人兼CEO袁(yuan)行遠(yuan)
2、中國開源活躍度高,年輕人展現出后發優勢
談(tan)及中(zhong)美AI發展的差異(yi),Alex Yeh觀察(cha)到,中(zhong)國(guo)在開源社(she)區的活(huo)躍度和快速落地(di)能力(li)顯著優于(yu)美國(guo),這也意味著中(zhong)國(guo)在AI應用爆發上會有巨大的機會。
▲GMI Cloud創(chuang)始人兼CEO Alex Yeh
彩云科技旗(qi)下的(de)產品(pin)正在(zai)出(chu)海。袁行遠分享(xiang)說,海外用戶(hu)對數據、隱私等問題的(de)關注度(du)較高(gao),與國(guo)內(nei)用戶(hu)區別(bie)明顯(xian)。他認為中(zhong)國(guo)有(you)望通過(guo)大量高(gao)質量的(de)人(ren)才儲備,在(zai)中(zhong)美(mei)AI對決中(zhong)取勝(sheng)。
在李博(bo)杰看來(lai),AI行業領(ling)域知識獲取更便捷,對經(jing)驗的(de)要求相對較少,使許多年輕的(de)中國企業和研究者能展現出后發優勢。
3、做基礎模型還是AI應用?
針對做基(ji)礎(chu)模型(xing)還是AI應(ying)用的(de)選擇問(wen)題,Alex Yeh認為大(da)廠(chang)偏重(zhong)基(ji)礎(chu)模型(xing)的(de)訓(xun)練,而中小企業則應(ying)專注于快速落地(di)和應(ying)用開(kai)發。
AI訓練需要消耗海量的(de)數(shu)據與(yu)算力。智(zhi)澄(cheng)AI創(chuang)始人及CEO胡(hu)魯輝相信(xin),未來的(de)創(chuang)新將圍繞如何更高(gao)效地(di)利用數(shu)據和(he)算力展(zhan)開,創(chuang)業公司(si)在未來十年也仍(reng)將有巨大的(de)發展(zhan)空間。
▲智(zhi)澄AI創(chuang)始人及CEO胡魯輝(hui)
彩云科技既(ji)做(zuo)AI基礎研究,又開(kai)發(fa)了彩云天氣、彩云小夢等AI應(ying)用(yong)。在袁行遠看來(lai),在AI應(ying)用(yong)落地的過程中(zhong),高(gao)性(xing)能底層(ceng)模型(xing)已如“電(dian)力”般(ban)廣泛可(ke)及,行業重點(dian)逐漸從基礎算法轉變(bian)為對應(ying)用(yong)細(xi)節(jie)的極致追求。以天氣預報(bao)為例,通用(yong)AI模型(xing)無(wu)法敏銳地識(shi)別云圖中(zhong)的細(xi)微變(bian)化(hua)和噪音,需要(yao)運用(yong)大量的一線行業知識(shi)才能完(wan)美(mei)勝任。
4、未來兩年是垂直領域Agent的關鍵突破口
PINE AI正在打造能(neng)聽、能(neng)看、能(neng)說、能(neng)操作(zuo)電(dian)腦(nao)的(de)通用(yong)AI Agent,未來希望(wang)成為數字員工和個(ge)人助(zhu)理。
李(li)博杰說,Agent的形態正在變化,決策(ce)能(neng)力(li)、通(tong)用(yong)性不斷增強,未來兩年是(shi)垂直領域Agent的關(guan)鍵突破口,企業需要在這一階段(duan)積累(lei)品(pin)牌(pai)聲譽與網絡效(xiao)應,為(wei)2027年左右(you)通(tong)用(yong)Agent爆發做好準備。
▲PINE AI聯合創始人、首席(xi)科(ke)學(xue)家李博(bo)杰
除了完成單一任務之外(wai),通用Agent的價值(zhi)還在(zai)于并行完成大量重(zhong)復性工作,為生產(chan)、生活節省(sheng)時間(jian),提供便(bian)利。在(zai)李博杰看來,這類(lei)Agent有望在(zai)2025年初步落地(di),產(chan)生價值(zhi)。
5、具身智能可能在五年內實現
胡魯輝談道,大模(mo)型(xing)可能只是(shi)AI發展的一個階(jie)段(duan)性成果(guo),AI發展正從(cong)生成式(shi)AI邁向物(wu)理智(zhi)能,最終實現通用人工智(zhi)能(AGI)。
李博杰也認(ren)為,具身(shen)智(zhi)能很有(you)可(ke)能是AI到達甚至超(chao)過(guo)AGI的(de)(de)路徑。具身(shen)智(zhi)能在與現實(shi)世界交互的(de)(de)過(guo)程中(zhong),獲(huo)得(de)大(da)量知識(shi)與數據,助力模型(xing)能力持續(xu)提(ti)升。
Alex Yeh預測具身智能(neng)將(jiang)在未(wei)來(lai)五年內實現,特別是(shi)在工(gong)業領(ling)域的應用。
他提到多模態數據(ju)的整合將推(tui)動AI向更高(gao)維度發展,為(wei)AGI的實現提供(gong)新(xin)的路徑。AI目前還缺少物理數據(ju),通(tong)過(guo)VR、AR等技術收集,并結合虛(xu)擬場景訓練,可加速具身智能的發展。
針對近(jin)期(qi)資本退出人形機器(qi)人公司的(de)爭(zheng)議,胡(hu)魯輝相信行業共識能夠(gou)推動科技發(fa)展(zhan)、人類進(jin)步,堅持(chi)長期(qi)主(zhu)義很重要,亞馬遜、微軟等大公司的(de)成(cheng)功(gong)都(dou)源于長期(qi)堅持(chi)。因此,投資應注重長期(qi)價(jia)值。
三、GenAI應用論壇:從生活到企業,如何用AI掀起生產效率變革?
伴隨著前沿(yan)模型快速(su)迭代(dai)突破,AI應用迎來前所未有的繁榮期,快速(su)將AI技術轉化成能夠解決消費級(ji)、生產級(ji)問題,帶來實際(ji)價值(zhi)的賦能工具(ju)。
在大會(hui)首日GenAI應用論壇上(shang),AI平臺、視頻(pin)生(sheng)成(cheng)、智算(suan)云(yun)、AI PPT、AI搜索(suo)、AI動漫(man)、端側芯(xin)片領域的嘉賓代表各(ge)抒己見,剖析產業問(wen)題,暢談落地思路,分享他們在真實(shi)應用場景中的實(shi)踐經驗和對未來趨勢的研判。
1、楓清科技高雪峰:單一模型無法解決生產級問題,AI落地產業有三要素
楓清(qing)科技(ji)Fabarta創始人兼CEO高雪峰認為,單一產(chan)(chan)品、技(ji)術或模型難以(yi)解決復(fu)雜的(de)生產(chan)(chan)級問題,只有將各類AI技(ji)術落地在企業(ye)、產(chan)(chan)業(ye)之中,帶(dai)來(lai)真正(zheng)的(de)高價(jia)值場景,融合為生態系(xi)統,才能讓AI技(ji)術更富有生命力(li)、更繁榮。
AI技(ji)術在(zai)產業中落地,有(you)三個關(guan)鍵要(yao)素:知識引擎、行業大模型(xing)、智能(neng)體(ti)平臺。要(yao)把生成式AI技(ji)術應用到產業端,最(zui)需要(yao)實現決策智能(neng)。
楓清科技采取了(le)以數(shu)據為中心的(de)AI平臺(tai)(tai)架(jia)構落(luo)地(di)的(de)范式,還推(tui)(tui)出知識引擎和行(xing)業大模型雙輪(lun)驅動(dong)的(de)智能體平臺(tai)(tai),幫助(zhu)企業實(shi)現多場景價值落(luo)地(di)。該平臺(tai)(tai)通過多模態數(shu)據存儲和計算,智能化構建(jian)企業知識庫,支持精準推(tui)(tui)理(li)和復雜推(tui)(tui)理(li)能力。
▲楓清科技Fabarta創始人兼CEO高雪峰
2、愛詩科技孫偉哲:視頻模型需兼顧趣味與速度,幫每個人成為生活的導演
愛詩科技是全球最早訓練(lian)視頻生成大模(mo)型的(de)(de)團隊(dui)之(zhi)一,正以高頻的(de)(de)技術研發節奏,進行底層模(mo)型的(de)(de)迭代(dai)。愛詩科技企服負(fu)責人(ren)孫偉哲(zhe)分享說,針對短視頻時代(dai)用(yong)戶(hu)習(xi)慣的(de)(de)特點,打造(zao)視頻生成模(mo)型需要兼顧趣(qu)味與(yu)速(su)度(du),前者(zhe)能促(cu)進用(yong)戶(hu)的(de)(de)關(guan)注(zhu)與(yu)傳播(bo),而(er)后(hou)者(zhe)則是提(ti)升用(yong)戶(hu)體驗的(de)(de)關(guan)鍵。
語言曾經是(shi)傳遞信息(xi)(xi)的最(zui)好介質,但目前我(wo)們接受的大(da)部分(fen)信息(xi)(xi)都(dou)來自于視頻(pin)。全球視頻(pin)創(chuang)作(zuo)需(xu)求(qiu)已大(da)量(liang)涌現(xian),日(ri)均視頻(pin)播放量(liang)達800億次,企業也(ye)需(xu)要通過(guo)(guo)AI技(ji)術實現(xian)視頻(pin)內容(rong)生(sheng)產的降本增效(xiao)。愛詩科技(ji)希望通過(guo)(guo)視頻(pin)生(sheng)成技(ji)術,實現(xian)創(chuang)作(zuo)平權,幫助每(mei)個(ge)人成為生(sheng)活的導演。
愛(ai)詩科技的(de)(de)PixVerse是全球最早實現(xian)千萬(wan)級MAU的(de)(de)視(shi)頻生成產品,并同步發(fa)力B端業(ye)務,利用(yong)視(shi)頻生成技術(shu),為企業(ye)客戶在數字營(ying)銷、信(xin)息流廣(guang)告(gao)、短(duan)劇創作(zuo)與出海(hai)、游(you)戲設計與開(kai)發(fa)等領域提(ti)供助(zhu)力,并提(ti)供了持(chi)續、精準的(de)(de)運營(ying)服務。
▲愛(ai)詩科技企(qi)服負責人孫偉哲
3、GMI Cloud King Cui:推理服務成AI出海關鍵支撐,及時彈性擴容是核心性能
GMI Cloud亞太(tai)區總裁King Cui談道,基(ji)礎模型(xing)能力提升和開源生態(tai)的豐富,為AI應用爆發提供(gong)了核心必要條(tiao)件,這背(bei)后,為中國(guo)AI產品出海(hai)提供(gong)關鍵(jian)支(zhi)撐的就是推理算力。
AI應(ying)用(yong)往往會出現用(yong)戶(hu)規(gui)模和訪問量短(duan)期暴漲等現象,因此提供及時性(xing)、擴展(zhan)性(xing)、穩(wen)定性(xing)的(de)推理服務至關重要。
GMI Cloud的(de)目(mu)標是打造(zao)更(geng)高性能的(de)GPU推理云服務,支持全球(qiu)范圍自(zi)動(dong)擴(kuo)縮容、一鍵部署(shu)推理模型、搭載自(zi)動(dong)容錯機(ji)制等。
▲GMI Cloud亞太區總裁King Cui
4、像素綻放PixelBloom蒲世林:AI帶來的效率革新符合發展趨勢,需理性擁抱
像素綻放PixelBloom(AiPPT.com)聯合創始人(ren)蒲世(shi)林談道,隨著(zhu)(zhu)底層(ceng)算力和(he)模(mo)型層(ceng)成本的顯著(zhu)(zhu)下降,AI應用(yong)層(ceng)迎來全(quan)面爆發的機(ji)遇。
像素綻放PixelBloom在AI PPT領域,通過(guo)ToC、To Partner ToC、ToB三種商業化路徑,既直接服(fu)務消費者,也與頭部企業合作提(ti)升辦公(gong)效率;同時還開放API能力,與聯想、釘釘等硬(ying)件和軟件廠商深度集成(cheng),構建開放生(sheng)態,覆蓋辦公(gong)人群(qun)。
在進(jin)軍海外市場時,AiPPT.com注重做好本土化(hua),提(ti)供多語言版本和本地化(hua)模板,滿足(zu)不同國家的市場需求(qiu),還通過(guo)孵化(hua)和并購(gou)來擴展產品矩(ju)陣。
在(zai)蒲(pu)世(shi)林看來(lai),AI技(ji)術(shu)帶(dai)來(lai)的(de)效(xiao)率革新符(fu)合人類發展趨勢(shi),企業需理性(xing)擁抱(bao)AI,不低(di)估(gu)但也(ye)別期待過高,通過實(shi)際應用探索能力邊界,以抓住未來(lai)十年的(de)AI紅(hong)利。
▲像素綻放PixelBloom(AiPPT.com)聯合(he)創始(shi)人蒲世林
5、博查AI翁柔瑩:AI比人類更需要搜索引擎
博查AI搜(sou)索(suo)聯合創始(shi)人兼CTO翁柔瑩認(ren)為,AI時代(dai),用戶(hu)的(de)搜(sou)索(suo)習慣(guan)已(yi)由(you)“關鍵詞搜(sou)索(suo)”轉變(bian)為“自然語言對話”,內容(rong)(rong)的(de)生產(chan)、流動、消費(fei)也在(zai)發生變(bian)化,在(zai)AI為用戶(hu)整(zheng)理、總結(jie)信(xin)息的(de)過(guo)程中,內容(rong)(rong)的(de)消費(fei)主體已(yi)經變(bian)成了(le)AI。
AI大模型的(de)訓練數據存在滯后性,必須(xu)通過聯網搜索來獲(huo)取最新的(de)內(nei)容,才能為用戶(hu)提(ti)供更好的(de)信(xin)息服務,從這(zhe)一(yi)角(jiao)度(du)來看,AI比人(ren)類(lei)更需(xu)要搜索引擎。
為AI打(da)造的搜(sou)(sou)(sou)索(suo)引(yin)(yin)擎與(yu)傳統搜(sou)(sou)(sou)索(suo)引(yin)(yin)擎在架(jia)構(gou)(gou)上有相似之處,依(yi)舊需要實(shi)時獲(huo)取高質(zhi)量信息(xi)。博(bo)查(cha)采用(yong)多模態混合搜(sou)(sou)(sou)索(suo)和語義排序(xu)技(ji)術(shu),能突(tu)破傳統搜(sou)(sou)(sou)索(suo)引(yin)(yin)擎的技(ji)術(shu)瓶頸(jing),滿(man)足大模型(xing)對于(yu)高質(zhi)量世(shi)界知(zhi)(zhi)識的需求,還打(da)造了全球首個(ge)多Agent架(jia)構(gou)(gou)的智能體搜(sou)(sou)(sou)索(suo),為AI提(ti)供專業領域知(zhi)(zhi)識。
▲博查AI搜索聯合創(chuang)始人兼(jian)CTO翁(weng)柔瑩
6、中文在線周立強:AI降低動漫短劇門檻,制作成本降低50%
中(zhong)文在線(xian)AI動漫部總經理周立強談道(dao),中(zhong)國(guo)AIGC應(ying)用(yong)市場正(zheng)在加速發展,預計2024年至2028年年均(jun)復合增長率將(jiang)超(chao)過30%。作為勞動密集型行業,動漫領域正(zheng)受到AIGC相關工具的(de)深(shen)刻影(ying)響。
傳統動漫(man)短劇(ju)制(zhi)作通常包含原(yuan)文理(li)解、劇(ju)本(ben)改寫等11個環節,而AI已(yi)將(jiang)流程壓(ya)縮(suo)至設定理(li)解、生圖合成(cheng)(cheng)、后期處(chu)理(li)等5個步驟。AI動漫(man)短劇(ju)的優勢在于具(ju)備跨國傳播(bo)能力(li)、支持工(gong)業化(hua)量產,且制(zhi)作成(cheng)(cheng)本(ben)顯著(zhu)下降——單部作品的制(zhi)作周期可縮(suo)短70%,成(cheng)(cheng)本(ben)降低(di)約50%。
周立強指出,AI動漫短劇(ju)已(yi)逐(zhu)步(bu)突破單一流(liu)量(liang)變(bian)現階段(duan)。預計未(wei)來三(san)年(nian),掌握AIGC全鏈路能力的團隊有望占(zhan)據全球短劇(ju)市場30%以上(shang)的份額。
▲中文在線AI動漫部(bu)總經理周立強
7、光羽芯辰周強:端側AI的發展促使手機架構變革,可能孕育出新的大型公司
光羽芯辰創(chuang)始(shi)人兼董(dong)事長周強談道,過去幾年,AI經歷了從(cong)低(di)谷到高峰的(de)(de)周期,AI創(chuang)新的(de)(de)核心在于實(shi)用性,只(zhi)有當技術可用且有價值時,市場關注度才會提升。
早(zao)期AI應(ying)用(yong)多局限于云(yun)端(duan)(duan),而端(duan)(duan)側AI的(de)(de)興起使AI能(neng)夠深入生(sheng)(sheng)產生(sheng)(sheng)活各領域,比如應(ying)用(yong)到(dao)工(gong)廠的(de)(de)機器人上,顯著提升(sheng)生(sheng)(sheng)產力(li)。大(da)模型的(de)(de)出現(xian)增強了AI能(neng)力(li),但也暴露了硬件性(xing)能(neng)不足的(de)(de)問題。
端側(ce)(ce)AI需要新的(de)技術架構(gou)以降低功耗(hao)、提(ti)升性能和帶寬(kuan)。以手機為(wei)例,隨著AI未來的(de)發展趨(qu)勢,智能手機將(jiang)進(jin)化為(wei)AI手機,將(jiang)集成(cheng)更多(duo)端側(ce)(ce)數據(ju),成(cheng)為(wei)所有(you)智能終(zhong)端的(de)中(zhong)心(xin),光(guang)羽芯辰的(de)端側(ce)(ce)芯片以及創新的(de)解決方案和架構(gou)將(jiang)極大的(de)助力(li)這一變革。
▲光羽(yu)芯辰創始人(ren)兼董事長周(zhou)強
8、Zilliz郭人通:對于Agent構建,我們如何有效支持海量數據檢索,挖掘隱藏于長尾的高價值信息?
Zilliz關注(zhu)如何有效檢索海量數據(ju),發掘隱藏于長(chang)尾的(de)高價值信息。在(zai)OpenAI發布Deep Research功能之后,Zilliz也嘗(chang)試了復(fu)刻。
據Zilliz合伙(huo)人、產品(pin)總監(jian)郭人通分(fen)享(xiang),對于(yu)Deep Research這類Agent系統,在(zai)數據基礎設施層(ceng)面需要(yao)在(zai)數據建模、部(bu)署、緩存、多租、冷(leng)熱數據處理等方(fang)面做好優化,聚焦(jiao)信(xin)(xin)息檢索質量(liang),提(ti)高(gao)單位(wei)成(cheng)本可(ke)支撐(cheng)的(de)檢索迭代輪次,以保證 Agent 對問題的(de)理解(jie)度以及(ji)對信(xin)(xin)息的(de)挖(wa)掘深(shen)度。Zilliz目(mu)前(qian)已(yi)提(ti)供系統性解(jie)決方(fang)案。
對于提(ti)高查詢(xun)質量,目前(qian)有一系列經過生產驗證的方法,包括查詢(xun)改寫,如多查詢(xun)條(tiao)件生成、查詢(xun)拆解、意圖識(shi)別等,這有助于突破傳統RAG技術(shu)的搜索局限性(xing)。此(ci)外,帶正(zheng)負樣本的查詢(xun)增強(qiang)、多模態(tai)搜索也能有效提(ti)升搜索質量。
目前,許多(duo)企(qi)業(ye)已切入垂直Agent方向,海量領域數據(ju)也引(yin)發數據(ju)Infra的(de)變革,基于S3構建的(de)數據(ju)Infra正逐漸獲得更多(duo)企(qi)業(ye)用(yong)戶的(de)選用(yong)。今年下半年,Zilliz將(jiang)推出面(mian)向AI應用(yong)的(de)數據(ju)湖解(jie)決方案,從五月開始(shi),Zilliz會面(mian)向業(ye)界進行介(jie)紹,敬請關注(zhu)。
▲Zilliz合(he)伙人、產品總監郭人通
四、大模型峰會:判趨勢,剖解法,全面直擊算法、算力、數據挑戰
大會第二(er)天舉行(xing)的大模(mo)(mo)型(xing)峰會,更(geng)加聚焦于大模(mo)(mo)型(xing)產(chan)業鏈(lian)底層(ceng)技術(shu),從(cong)模(mo)(mo)型(xing)、中間件、云服務、知識圖(tu)譜、存儲、網絡(luo)、芯片(pian)、數據平臺等(deng)多維(wei)度切入,探(tan)討突破大模(mo)(mo)型(xing)算法、算力(li)、數據關(guan)鍵瓶頸的可行(xing)路徑。
現場,焱融科技首次發布了KV Cache在推理場景性能優化數據。實(shi)測數據顯示:在長上下文(wen)場景(jing)中,使用YRCloudFile KVCache可實(shi)現高達13倍的TTFT性能提升,延時(shi)縮短超4倍。
1、上交大戴國浩:全面直擊云邊端不同場景推理需求挑戰,半分離式方案下周開源
上海(hai)交通大學(xue)副(fu)教授、無問芯穹聯合(he)創始人(ren)戴國浩談道,真正能模仿人(ren)類智力的(de)模型往(wang)往(wang)是(shi)推理(li)(li)需求,但現有云側和端(duan)側很(hen)難滿足模型推理(li)(li)需求。
云(yun)側有PD融合式、PD分(fen)(fen)離式兩種技(ji)術(shu)路線(xian),其中,PD融合式的技(ji)術(shu)路線(xian)將計算和(he)存儲(chu)進行融合的好(hao)處是內存利用率更高(gao)、無需傳遞KV cache,但缺(que)點是不同任務間干擾(rao)大;PD分(fen)(fen)離式技(ji)術(shu)路線(xian),將計算和(he)存儲(chu)資源(yuan)分(fen)(fen)離的好(hao)處是計算單元容易(yi)隔離、抗干擾(rao),但存儲(chu)冗余和(he)不均(jun)衡會(hui)帶來額外開銷。
因此,無問芯穹取長補短打造半分(fen)離式(shi)方案Semi-PD,實現計算分(fen)離存(cun)儲融合,Semi-PD將于一周(zhou)后(hou)開(kai)源整體代碼,月(yue)底(di)開(kai)源整個集群代碼,Semi-PD在一體機和分(fen)布式(shi)集群推理等(deng)場景下將帶來顯著性能提升。
其端(duan)側思(si)路是通過輕(qing)量(liang)化(hua)方式讓終端(duan)負載(zai)變小,SpecEE技術(shu)引入機器學習(xi)、模(mo)型自(zi)適應等,可以判斷是否(fou)在(zai)級(ji)聯(lian)結(jie)(jie)構當前層輸(shu)出了正確結(jie)(jie)果。該技術(shu)能(neng)無感兼容任何端(duan)側輕(qing)量(liang)化(hua)方案,整套(tao)代(dai)碼(ma)將在(zai)本月開源。
▲上海交通(tong)大(da)學副教授、無問芯穹聯合創始人戴國浩(hao)
2、智澄AI胡魯輝:人形機器人“不好用”,與大模型數據挑戰有差別
智澄AI創始人兼CEO胡魯輝認(ren)為,機器人將是未來AI生態(tai)中的重要組成部分,物理智能有望成為AI的下一波浪潮(chao),實現更(geng)廣泛(fan)(fan)的通用(yong)人工智能。目(mu)前人形(xing)機器人泛(fan)(fan)化能力(li)較差,直(zhi)接(jie)導(dao)致成本(ben)高昂(ang),歸根結底(di)就是“不好用(yong)”。
與大模型(xing)一樣,物(wu)理智能面臨著數(shu)據(ju)、模型(xing)、環境、算(suan)力等(deng)方(fang)面的挑戰,但(dan)挑戰的內核(he)有所區別。物(wu)理智能可(ke)用的數(shu)據(ju)量更少,需要在“機器(qi)人(ren)訓(xun)練(lian)場”中采集(ji)數(shu)據(ju),機器(qi)人(ren)端側算(suan)力限制也對模型(xing)能效提(ti)出了要求。
智澄AI從(cong)世界模型的研(yan)發與人形(xing)機器人本體(ti)的打造兩個角度切入,打造的TR4機器人能以視(shi)覺+力度感知的方案實現物體(ti)抓握,無需依賴觸(chu)覺。
▲智澄(cheng)AI創始(shi)人兼CEO胡魯輝
3、焱融科技張文濤:高性能全閃存儲在訓練與推理中如何破解AI算力瓶頸?
焱(yan)融科(ke)技(ji)(ji)CTO張文濤分享(xiang)說,針對大(da)模型訓練和推理的(de)存儲(chu)解決方案,焱(yan)融科(ke)技(ji)(ji)通過Multi-Channel技(ji)(ji)術聚合(he)多個(ge)網卡(ka)、帶寬等,提供高性能(neng)內核私有客戶(hu)端,能(neng)夠滿足高性能(neng)元數據訪問需求,為企業提供高效、靈(ling)活的(de)存儲(chu)支持。
焱融(rong)科技在數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)管(guan)理(li)方面,采取(qu)智(zhi)能分層和數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)加載功能來優化(hua)管(guan)理(li)流(liu)程。此(ci)外,焱融(rong)科技順勢推出的DataInsight數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)編排管(guan)理(li)平臺,幫助(zhu)企(qi)業(ye)解決其應用(yong)AI大模型中的海量(liang)歷史(shi)業(ye)務數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)管(guan)理(li)難題;支(zhi)持(chi)多維度組(zu)合查詢,實現百(bai)億級數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)秒級檢索。通過自(zi)(zi)研DataFlow技術(shu),用(yong)戶(hu)可自(zi)(zi)定義數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)流(liu)動(dong)策(ce)略(lve),確(que)保(bao)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)按(an)需、快速嵌入業(ye)務流(liu)程。平臺還具備(bei)增量(liang)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)自(zi)(zi)動(dong)感(gan)知能力,保(bao)障用(yong)戶(hu)從知識庫(ku)平臺訪(fang)問時獲取(qu)最新(xin)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju),進一步(bu)提(ti)升數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)流(liu)動(dong)效率。
在(zai)運維方面(mian),焱融科技通(tong)過(guo)提供目錄(lu)集來做好多(duo)租戶管理(li)和隔離,并設置了(le)彈性數據(ju)網絡,使一(yi)套存儲能夠(gou)支持多(duo)種網絡平面(mian),并幫助(zhu)管理(li)員簡化(hua)基礎設施建(jian)設。
其(qi)產品性能(neng)出色(se),依托于分布(bu)式元數(shu)(shu)據集群能(neng)夠(gou)支(zhi)撐千億(yi)級海量文件,能(neng)夠(gou)支(zhi)持(chi)高(gao)速(su)無損網絡及(ji)多(duo)種(zhong)接口,還(huan)適配多(duo)個國產化(hua)平臺(tai)。在本屆大會上,焱融(rong)科技還(huan)首(shou)次發布(bu)了KV Cache在推理場景(jing)性能(neng)優化(hua)數(shu)(shu)據。
實測數據顯示:在長上下文場景中,使用YRCloudFile KVCache可實現高達13倍的TTFT性能提升。在TTFT≤2秒的嚴苛約束下,其支持的并發數提升達8倍,且在高并發負載中延遲可降低4倍以上。張文濤談到YRCloudFile KVCache可構建PB級KVCache緩(huan)(huan)存層,有效突(tu)破(po)GPU顯存限制,顯著提升緩(huan)(huan)存命(ming)中(zhong)率(lv)與推理上下(xia)文長度。
▲焱融科技(ji)CTO張文濤
4、Zenlayer陳秀忠:token洪流下算力網絡三大趨勢,實時交互、分布式推理、高效IDC
Zenlayer行業拓展(zhan)總監陳(chen)秀忠談道,token是大(da)模(mo)型世界的(de)基礎單位(wei),過去8個月,token使得整個網(wang)絡(luo)世界流量增(zeng)長(chang),達(da)到移動互聯網(wang)時代(dai)的(de)3~4倍(bei)。
token的整個生(sheng)命(ming)周期包括(kuo)AI工(gong)廠生(sheng)產,再經網絡傳輸(shu)給(gei)用(yong)戶,其在(zai)生(sheng)產過(guo)程(cheng)需要大量(liang)算力和電力,在(zai)傳輸(shu)和消費環(huan)節需要靠近(jin)用(yong)戶的推理(li)節點實現即時交互(hu)。
在token洪流下,未來的(de)(de)三個演進趨(qu)勢包括實時交互的(de)(de)全球網(wang)(wang)絡(luo)、分布(bu)式(shi)推(tui)理的(de)(de)易用模型服務、高(gao)效的(de)(de)IDC。基于此(ci),Zenlayer構建(jian)了(le)覆(fu)蓋(gai)全球的(de)(de)專線網(wang)(wang)絡(luo)、覆(fu)蓋(gai)亞太地區的(de)(de)AI機(ji)房、在現有邊(bian)緣節點推(tui)出模型服務等(deng)。
▲Zenlayer行業拓展總監陳秀忠(zhong)
5、清程極智師天麾:如何打造國產模型與國產算力間的橋梁?
清程極智聯合創始人、產(chan)(chan)品(pin)副總(zong)裁師天(tian)麾分享說,在DeepSeek、QwQ等國產(chan)(chan)推理模型(xing)爆火之后,大模型(xing)私有化部(bu)署(shu)需求大幅度增加。在國外算力獲(huo)取困(kun)難(nan)、國產(chan)(chan)顯(xian)卡軟件生態不完善(shan)的背景(jing)下(xia),打造連接國產(chan)(chan)模型(xing)與國產(chan)(chan)算力的橋梁(liang)尤(you)為迫切。
清(qing)程極(ji)智已聯合清(qing)華(hua)大(da)(da)學開源了赤兔推理引(yin)擎,支持在非Hopper架構設備(如早(zao)期(qi)大(da)(da)部分(fen)(fen)英偉達GPU和(he)大(da)(da)部分(fen)(fen)國產(chan)芯片)上原生運行FP8模型(xing),打破(po)硬件綁定,提升(sheng)算力使用效率,并能(neng)有效保留模型(xing)原有精度。
目前清程極智(zhi)基于赤(chi)兔引擎(qing)推出(chu)多款(kuan)大(da)模型私有(you)化部署(shu)(shu)方案,可(ke)根據不同場景需(xu)求提(ti)供(gong)針對(dui)性(xing)解(jie)決方案,結合企業業務,提(ti)供(gong)從私有(you)化部署(shu)(shu)到智(zhi)能體開發的一站式服(fu)務。
▲清程極智聯合創始人、產(chan)品副總裁(cai)師天麾
6、首都在線張振宇:以全棧國產化為特色,助攻生成式AI規模化落地
首都(dou)在(zai)線集團智(zhi)算產(chan)品總(zong)經理張(zhang)振(zhen)宇(yu)談道,隨著DeepSeek爆火,AI大模型(xing)國產(chan)化趨勢正在(zai)加速,推理市(shi)場將迎來(lai)大規模增長(chang)。首都(dou)在(zai)線后(hou)續也會更聚焦于推理算力(li)的布局。
此前首(shou)都在線智算云已成(cheng)功應用(yong)于多(duo)(duo)個生(sheng)成(cheng)式AI場(chang)景,如自(zi)然語言處理、圖像(xiang)生(sheng)成(cheng)、視頻生(sheng)成(cheng)等(deng),公司今(jin)年將持(chi)續優(you)化(hua)“一(yi)云多(duo)(duo)模、一(yi)云多(duo)(duo)芯、一(yi)云多(duo)(duo)池”的(de)戰略布局(ju),去構建(jian)高度靈(ling)活的(de)AI服務平臺(tai)(tai),我們的(de)平臺(tai)(tai)不(bu)斷(duan)拓展支持(chi)的(de)模型種類,為用(yong)戶提(ti)供(gong)更豐富的(de)選擇(ze),滿足不(bu)同場(chang)景需求。
首都在線Maas云平臺通過(guo)構建(jian)云端協同(tong)調優體系,以算力效能(neng)優化為(wei)(wei)基礎、模型(xing)即服務(MaaS)平臺為(wei)(wei)核心,為(wei)(wei)AI開發者及算力伙(huo)伴帶來創新性升級(ji),形成了(le)閉環式(shi)技(ji)術解決方案,不僅有效提(ti)升了(le)GPU利用(yong)率,降低(di)了(le)訓(xun)練成本(ben),能(neng)夠為(wei)(wei)客戶(hu)提(ti)供更(geng)加高效、靈活、低(di)成本(ben)的算力服務,還為(wei)(wei)大模型(xing)從實驗室走向產業(ye)化提(ti)供了(le)關鍵技(ji)術支撐。
▲首都(dou)在(zai)線集團智算(suan)產品總經理張振宇
7、海致科技李思宇:以圖為核心,打通大模型與多模態行業知識
海致科技技術(shu)總監(jian)(jian)李思宇談道(dao),大(da)模型實際項目落地(di)的Prompt提(ti)示詞工程,RAG檢索召回增強、Agent Function/Tool Call、SFT監(jian)(jian)督微(wei)調(diao)訓練四種基本(ben)方法(fa),其(qi)關鍵(jian)是讓大(da)模型結合多模態行業知識。
針對此,海致科(ke)技的思路是統(tong)一(yi)知(zhi)識(shi)與(yu)數據(ju)認知(zhi),其解(jie)決方案以圖為核(he)心,結合工具(ju)將標量(liang)數據(ju)和向量(liang)數據(ju)打通形成有機整體。
通過將大模(mo)型(xing)與(yu)知識圖譜(pu)融合,海(hai)致(zhi)科(ke)技形成了基(ji)礎(chu)模(mo)型(xing)層(ceng)、語義知識層(ceng)、邏(luo)輯圖譜(pu)層(ceng)、智能(neng)體應(ying)用層(ceng),可(ke)基(ji)于基(ji)礎(chu)模(mo)型(xing)、元(yuan)數據知識體系,在應(ying)用層(ceng)之上構建智能(neng)體、工作流。
實際落地中,其解決方案接入警情(qing)案件(jian)等五情(qing)數(shu)據,可融合跨不(bu)(bu)同事件(jian)、不(bu)(bu)同情(qing)報數(shu)據,形成(cheng)完整(zheng)事件(jian)對象(xiang)關系(xi)圖(tu)再以此進行信息(xi)挖(wa)掘,實現匯(hui)聚非結構(gou)化和結構(gou)化數(shu)據的整(zheng)體圖(tu)譜(pu)。
▲海(hai)致科(ke)技(ji)技(ji)術(shu)總監李(li)思宇
8、中昊芯英朱國梁:Scaling Law延續下的AI芯片軟件棧重構
中昊芯英(ying)軟件研(yan)發負責人朱國梁介紹,目(mu)前,Scaling Law正(zheng)沿著測試時計算、強(qiang)化(hua)學習(xi)與預訓(xun)練三條路徑延續。需(xu)要(yao)不斷重構AI芯片軟件棧來滿(man)足(zu)新的算力挑戰。
對大部分廠商而言,超大Batch-Size依舊是優先事項(xiang),下一個Transformer級別的架構尚未出現。
目前(qian)在推理方向優化(hua),探索方向包括(kuo)KV緩存卸載、PD分離、稀疏注意(yi)力和(he)MoE通信優化(hua)等。
強化(hua)學習(xi)方面,隨著強化(hua)學習(xi)兩階段訓練(lian)的范式形成,訓練(lian)和推理協同調度需求不斷增長。
預訓(xun)(xun)練方面,需要(yao)在(zai)訓(xun)(xun)練通信特征(zheng)、訓(xun)(xun)練通算重疊與訓(xun)(xun)練容錯(cuo)等方面對(dui)現有軟件棧做出修改。
▲中昊(hao)芯英軟(ruan)件研發負責(ze)人朱國梁
9、澳鵬董成:大模型愈往垂類應用端發力,對數據質量要求愈高
澳(ao)(ao)鵬(peng)Appen中(zhong)國及韓國區(qu)副(fu)總(zong)裁董成(cheng)通過澳(ao)(ao)鵬(peng)在各領域大(da)模型(xing)部署中(zhong)數據訓練的(de)最佳實踐,重(zhong)點(dian)分享了對大(da)模型(xing)應用(yong)趨(qu)勢(shi)的(de)觀察。以AI Agent為(wei)代表,未(wei)來(lai),大(da)模型(xing)必定應用(yong)到(dao)具體(ti)的(de)垂(chui)直領域中(zhong),比如金融、醫療、代碼、音樂、文學等。
這一趨勢對數(shu)據(ju)的高質量、專(zhuan)業度、多(duo)垂類(lei)提(ti)出了越來越高的要求(qiu)。對此,澳(ao)鵬提(ti)供(gong)了多(duo)種AI輔助的前沿數(shu)據(ju)采標工具和方案,包括文(wen)本(ben)對話、多(duo)模(mo)態交互、思維鏈推理工具等。
董成(cheng)認為,AI大模(mo)(mo)型行業(ye)(ye)正(zheng)經歷(li)顯著變(bian)(bian)化,Llama和DeepSeek等開(kai)源模(mo)(mo)型在性能上逐漸趕(gan)上甚至超過(guo)閉(bi)源模(mo)(mo)型,一些(xie)企業(ye)(ye)也從(cong)閉(bi)源向著開(kai)源方向轉(zhuan)變(bian)(bian)。同時,大模(mo)(mo)型企業(ye)(ye)的研發越來越關(guan)注復雜任務(wu)方向,從(cong)最初的簡單對話向模(mo)(mo)型推理、垂直領域(yu)應(ying)用(yong)、多模(mo)(mo)態等方向發展。
▲澳鵬Appen中國及韓國區副總裁董成
10、云軸科技王為:AI實踐應用分四級,基礎設施構建面臨四大挑戰
云(yun)軸科(ke)技CTO王(wang)為(wei)解(jie)讀了當前AI基礎(chu)設施構建面臨(lin)的挑戰,包括(kuo)模型尺寸增(zeng)加、上(shang)下文窗口增(zeng)加、全模態(tai)支持、多品牌算力支持等。
類比自動駕駛(shi),AI實踐可對應作(zuo)為(wei)工具、作(zuo)為(wei)參(can)考(kao)建(jian)(jian)議、主導到端到端實踐的(de)L1~L4級別。云軸科技已(yi)在(zai)AI輔助售(shou)后(hou)、代碼(ma)、文檔等方面有所應用。其中(zhong)AI輔助售(shou)后(hou)、代碼(ma)輔助處(chu)于參(can)考(kao)建(jian)(jian)議階段,輔助文檔為(wei)主導階段,這背后(hou)凸顯出(chu)諸多基礎設施的(de)構建(jian)(jian)難題(ti)。
AI賦(fu)能(neng)(neng)企(qi)業內部的技術(shu)架構需要穩(wen)固(gu)的智算底(di)座(zuo)、模(mo)型層,以(yi)及包含易用開發、性能(neng)(neng)評測等(deng)工具(ju)的運營(ying)與應用層。模(mo)型層的資源(yuan)管理員主要關注底(di)層資源(yuan)使(shi)用情況,開發者只需直接導入模(mo)型做(zuo)精調、推(tui)理等(deng)賦(fu)能(neng)(neng)業務。
▲云(yun)軸科技CTO王為(wei)
11、Alluxio湯文軍:AI時代,高性能分布式緩存如何實現極致I/O優化?
Alluxio解(jie)決方(fang)案(an)架構(gou)師(shi)湯文軍分享說,企業在(zai)搭建和優化(hua)(hua)AI高(gao)性能(neng)數據訪問平臺(tai)時,面臨著數據方(fang)面的業務壓力、GPU稀缺昂貴且利用率不高(gao)、數據解(jie)決方(fang)案(an)復雜等問題。針(zhen)對這(zhe)些問題,Alluxio推出(chu)了去中(zhong)心化(hua)(hua)的Alluxio Enterprise AI產品方(fang)案(an)。
具體(ti)來(lai)看,針對ML/AI GPU訓練對I/O提出的諸多要求,Alluxio使(shi)用(yong)一(yi)致性哈希在worker節點上緩存數據與元數據,這顯(xian)著減少了I/O RPC長度,減少單(dan)點故障并降低(di)了Master節點性能瓶頸(jing);優(you)(you)化性能時,使(shi)用(yong)零(ling)拷貝優(you)(you)化、并行與隨機讀(du)優(you)(you)化,解決了讀(du)放大問(wen)題。
最終,Alluxio實(shi)現了(le)高性能、低延遲、高可用(yong)、容(rong)量線性擴展等(deng)(deng)(deng)優化效(xiao)果,這套方案可應用(yong)于(yu)數據預處理、模型訓練、部署、推(tui)理等(deng)(deng)(deng)環節,已在眾多場景實(shi)際落地(di),帶來GPU利用(yong)率、運(yun)維成本等(deng)(deng)(deng)方面的顯著(zhu)收(shou)益。
▲Alluxio解決(jue)方(fang)案架(jia)構(gou)師湯文(wen)軍
澎峰(feng)科技創始人&CEO張(zhang)先(xian)軼(yi)分(fen)享說(shuo),用戶在AI算(suan)力部(bu)(bu)署上的策略通(tong)常從單(dan)機部(bu)(bu)署開(kai)始,例如使(shi)用一體(ti)機。隨著需求的增長,用戶會逐步擴展到私有化部(bu)(bu)署,通(tong)過MaaS平(ping)臺納管更多(duo)硬件設備(bei),并分(fen)批建(jian)設算(suan)力資源(yuan),還(huan)可以將現有服(fu)務(wu)器(qi)納入管理,形成(cheng)一種類(lei)似擴容(rong)的方(fang)案(an)。
為了(le)進一步(bu)提升算力利用率和數據(ju)隱私(si)安全性,用戶可(ke)以借助國產智算中心的(de)(de)(de)模型(xing)的(de)(de)(de)專線模式進行混合部署。這種模式不(bu)僅能提高計算中心的(de)(de)(de)資源利用率,還能在保障數據(ju)隱私(si)的(de)(de)(de)同時,支持(chi)更多應用場(chang)景。從商(shang)業模式上看(kan),專線部署采用ToB性質的(de)(de)(de)計費(fei)方式。未來,用戶可(ke)以在此基礎上進行私(si)有(you)模型(xing)的(de)(de)(de)微調部署,支持(chi)更多應用的(de)(de)(de)開發與擴展。
▲澎峰科技創始人(ren)&CEO張(zhang)先軼(yi)
五、圓桌討論:DeepSeek給AI Infra帶來新機會,國產軟硬件發展正當時
圓(yuan)桌(zhuo)討論(lun)環(huan)節以《DeepSeek給AI Infra帶來的啟示與機會(hui)》 為(wei)主題,由(you)騰訊云專有(you)云及智算首席(xi)架構師方天戟主持,回顧了過(guo)去兩個月AI從(cong)業者(zhe)們圍(wei)繞DeepSeek、具身智能(neng)等展(zhan)開(kai)的一系列技術攻關(guan),北京智源人工智能(neng)研(yan)究院(yuan)AI框架研(yan)究負責人敖玉龍、澎峰科技創始人兼(jian)CEO張先軼、沐冰數(shu)據(ju)CTO邸澤(ze)民、云軸科技CTO王為(wei)分(fen)享了對最新產業趨勢的觀察與思考(kao)。
1、DeepSeek開源帶來震撼,一體機可滿足基礎需求
騰訊云(yun)專有云(yun)及智算首席架構師方天(tian)戟強調DeepSeek具有技術創(chuang)新性,基(ji)于(yu)H800在卡(ka)間通信受(shou)限的(de)情況下,大幅壓縮了大模(mo)型(xing)成本,使模(mo)型(xing)本地部署成為現實。
沐冰數據CTO邸澤民認(ren)為DeepSeek在開源周中一系列開源工作(zuo)的最大的震撼在于展現(xian)(xian)了如(ru)何在資源受限的約(yue)束下,實(shi)現(xian)(xian)最優(you)解(jie)的工程能(neng)力(li),充(chong)分挖掘了現(xian)(xian)有算(suan)力(li)的潛(qian)力(li)。DeepSeek團隊(dui)不僅想到了精(jing)妙的優(you)化技(ji)巧與方案(an),還完成(cheng)了代碼(ma)與工程實(shi)現(xian)(xian),并將其完全開源,十分令人尊敬。
▲騰(teng)訊云專有(you)云及(ji)智算首席(xi)架(jia)構師(shi)方天戟
談(tan)及近期銷售(shou)火爆的DeepSeek一(yi)體機,方天戟(ji)認為這(zhe)有(you)助于企業在保護數據(ju)安全的情況(kuang)下快速用(yong)上DeepSeek,北京智(zhi)源人(ren)(ren)工智(zhi)能研(yan)究院AI框架研(yan)究負(fu)責(ze)人(ren)(ren)敖(ao)玉龍指出用(yong)戶(hu)需要關注DeepSeek一(yi)體機部(bu)署后的軟硬件(jian)更新問題。
云(yun)軸科技CTO王為(wei)提到DeepSeek一體(ti)機(ji)為(wei)客(ke)(ke)戶提供了(le)入門(men)的解(jie)決方案,通過(guo)預(yu)裝(zhuang)模(mo)型(xing)和(he)應(ying)用降低了(le)部署門(men)檻,能夠快速滿足基礎(chu)需求。但隨著需求增長,客(ke)(ke)戶可(ke)能需要(yao)更復雜(za)的算力調度(du)和(he)混合部署方案。
2、國產芯片軟硬件可用性提升,如何繞開CUDA護城河?
敖(ao)玉龍記得在2017年-2018年,他嘗試將大規模(mo)并行技(ji)(ji)術運(yun)用到AI計算中,但當時相關技(ji)(ji)術尚未(wei)完(wan)善。過去幾年AI Infra快速發展,有力地支持了大模(mo)型的技(ji)(ji)術進步。
在智(zhi)源(yuan)研究院的(de)工作過程中,他接(jie)觸到了端(duan)側(ce)與(yu)服務器側(ce)的(de)大(da)量國產芯片(pian)。目前,國產芯片(pian)的(de)硬件、軟件都已具備一定可用(yong)性,主要挑戰在于生(sheng)態還相對落后(hou),為此智(zhi)源(yuan)打造了開源(yuan)開放統(tong)一軟件生(sheng)態FlagOS來推動國產芯片(pian)生(sheng)態發展。
▲北京智(zhi)源(yuan)人(ren)工智(zhi)能研究(jiu)院AI框架研究(jiu)負(fu)責人(ren)敖玉(yu)龍
在ChatGPT爆火之(zhi)后,關(guan)于DSA特定領域芯片或ASIC專用芯片是否(fou)會消亡(wang)的(de)討論不絕于耳(er)。
邸澤民認為,對(dui)于(yu)特定(ding)領(ling)域的(de)計(ji)算(suan)負載(zai)而言(yan),與GPGPU相比,DSA具有(you)(you)(you)性(xing)能,成本(ben)(ben)與能效(xiao)優勢(shi)。從目前(qian)趨勢(shi)來看(kan),Transformer這個模型架構的(de)有(you)(you)(you)效(xiao)性(xing)經過了驗證,短(duan)期內(nei)出現顛覆性(xing)變化的(de)概(gai)率不高,那(nei)么(me)一定(ding)會(hui)有(you)(you)(you)對(dui)Transformer架構計(ji)算(suan)特點更有(you)(you)(you)針對(dui)性(xing)設計(ji)的(de)專用芯片出現,不論是采用TPU的(de)脈動陣列、存算(suan)一體或者別的(de)什么(me)技術(shu)路線(xian),ASIC夠有(you)(you)(you)效(xiao)降(jiang)低推(tui)理計(ji)算(suan)成本(ben)(ben),只有(you)(you)(you)不斷(duan)降(jiang)低推(tui)理成本(ben)(ben),才(cai)更能讓大(da)模型的(de)應用實現普惠。
▲沐冰數據CTO邸澤(ze)民
王(wang)為也(ye)提(ti)到一些(xie)優化(hua)技(ji)術在(zai)(zai)GPGPU上效率不是特別高,所(suo)以(yi)AI推理往ASIC上發(fa)展的可能性(xing)非常大。國(guo)產算力在(zai)(zai)推理上替代(dai)能力很強,在(zai)(zai)訓練上還需要一定時間追趕,但(dan)應該不會太久(jiu)。
王(wang)為認為,在(zai)(zai)AI訓練方面,英(ying)偉(wei)達(da)目前優(you)勢比較突出,因(yin)為通信性能、通信庫等技(ji)術壁壘很(hen)高,但(dan)現在(zai)(zai)也有國(guo)產卡(ka)訓練較大大參數(shu)模型的(de)(de)案例,因(yin)此假(jia)以時日還是可以趕上(shang)的(de)(de)。英(ying)偉(wei)達(da)如(ru)今(jin)在(zai)(zai)數(shu)據發(fa)布上(shang)選擇(ze)性披露(lu),著重在(zai)(zai)低精度上(shang)、稀疏算力上(shang)等,近年披露(lu)的(de)(de)數(shu)據逐漸偏向商業宣傳(chuan)性質(zhi),詳細的(de)(de)技(ji)術披露(lu)較少,這使得評估其(qi)真實性能需要更多(duo)測(ce)試(shi)。
▲云軸科技CTO王為
邸澤民預測在(zai)AI訓(xun)(xun)練(lian)場(chang)景,GPGPU依舊將(jiang)會繼續占據(ju)主導地位。在(zai)他看來,國產(chan)算(suan)力如(ru)果要通過對(dui)PyTorch、TensorFlow等框(kuang)架(jia)兼(jian)容(rong),并覆(fu)蓋數千個長尾(wei)算(suan)子,以實現與(yu)(yu)英偉(wei)達(da)的(de)CUDA護城河(he)的(de)競爭甚至替換(huan),在(zai)短期內是(shi)不現實的(de)。但如(ru)果將(jiang)這(zhe)種兼(jian)容(rong)與(yu)(yu)替換(huan)目(mu)標進一步收斂、聚焦到特(te)定的(de)模型或(huo)者特(te)定領域的(de)模型訓(xun)(xun)練(lian),比(bi)如(ru)DeepSeek這(zhe)樣的(de)語言模型,國產(chan)廠(chang)商是(shi)有適(shi)配能力與(yu)(yu)突破(po)空間(jian)的(de)。除了框(kuang)架(jia)與(yu)(yu)算(suan)子適(shi)配外,另一個難點在(zai)于進一步提升通信庫的(de)效(xiao)率。
3、混合推理系統是必然趨勢,具身智能將催化AI Infra演進
澎峰(feng)科技創(chuang)(chuang)始人(ren)兼CEO張先(xian)軼談道,英偉達在硬(ying)件創(chuang)(chuang)新上(shang)的(de)(de)持續投(tou)入,使其在AI領域保持領先(xian);英偉達在精度上(shang)的(de)(de)創(chuang)(chuang)新不斷提升了(le)性能(neng)峰(feng)值,也為(wei)其他芯片(pian)公司設立了(le)競爭壁壘。
▲澎峰科技創始人(ren)兼(jian)CEO張先軼
在混合(he)云部署的實踐方面,張先軼認為當(dang)前(qian)對數字(zi)隱私要求不(bu)是特別高的客(ke)戶比(bi)較容易接受,可(ke)以利用智算(suan)(suan)中(zhong)心的算(suan)(suan)力進行補充,比(bi)如一些(xie)學校或中(zhong)小B端(duan)。大B端(duan)通常對私有化要求會(hui)更高。當(dang)前(qian)做AI機(ji)器人(ren)的企業,基本采用的是邊緣與云端(duan)結(jie)合(he)的方式。
方天戟(ji)預測,從長遠來看,相比大語(yu)言模型(xing),具身智能(neng)可能(neng)會成為(wei)進(jin)一步促進(jin)未來AI Infra演進(jin)的新(xin)應用領域。
敖玉龍提到具身(shen)智(zhi)能機(ji)器(qi)人對端云(yun)協(xie)(xie)同(tong)、通信等方(fang)面提出(chu)了新要求,目(mu)前(qian)機(ji)器(qi)人的(de)(de)大腦(nao)模(mo)(mo)型(xing)(xing)往往部署在云(yun)端,控制運動的(de)(de)小腦(nao)模(mo)(mo)型(xing)(xing)部署在機(ji)器(qi)人本(ben)體,如(ru)何實現低延(yan)遲的(de)(de)協(xie)(xie)同(tong)需要進一步探索。
結語:中國生成式AI浪潮波濤洶涌
中(zhong)國生成式AI的(de)每一(yi)次突破,從來不是(shi)某家(jia)企業的(de)獨角戲,而是(shi)產學研用協同攻堅的(de)交響曲。
開(kai)年DeepSeek的爆(bao)火(huo),成(cheng)為中(zhong)國乃至(zhi)世(shi)界生成(cheng)式AI產業的關鍵拐點。它顛覆了(le)“堆砌(qi)算力(li)”的固有路徑(jing),開(kai)辟出一(yi)條“效(xiao)率優先”的創(chuang)新路徑(jing),催(cui)化開(kai)源(yuan)、推(tui)理模(mo)型與(yu)AI Infra研發熱潮,更為端側AI與(yu)國產AI算力(li)基(ji)礎設施的落地應用注入了(le)新動(dong)能。
站在技術與產業共(gong)振的歷史節點,我們(men)每一(yi)個人(ren),都正在見證和參與一(yi)場激動人(ren)心(xin)的技術躍遷。
春(chun)天來了(le),生成式AI的浪潮更加波濤洶涌,未來正呼嘯而至。
下一(yi)站(zhan),也(ye)許(xu)(xu)是基(ji)礎模型的(de)飛躍式進化,也(ye)許(xu)(xu)是AI超級(ji)應用橫(heng)空(kong)出(chu)世,也(ye)許(xu)(xu)是人(ren)形機(ji)器人(ren)的(de)覺醒,也(ye)許(xu)(xu)是商業(ye)價(jia)值的(de)裂(lie)變(bian),也(ye)許(xu)(xu)是AGI新路徑的(de)曙光。
生(sheng)成式AI正以摧枯拉朽(xiu)之勢重塑傳統產業(ye),創新火種(zhong)從未如此燎原,我(wo)們無比(bi)期待看到,中國科技企業(ye)在時(shi)代的浪尖(jian)揚帆起航。