
智東西(公眾號:zhidxcom)
作者 | 智東西編輯部
爆(bao)!爆(bao)!爆(bao)!好(hao)火(huo)爆(bao)的一場AI主題盛會。
智東西4月19日報道(dao),為期(qi)兩天的2024中國生成式AI大會,今(jin)日在京(jing)圓(yuan)滿收官。
54位產學研投嘉賓(bin)代表(biao)全程干(gan)貨(huo)爆棚,報名咨詢人數(shu)逾5200人,超(chao)過1800位觀(guan)(guan)眾到場(chang)參會,線(xian)上觀(guan)(guan)看人次更是超(chao)過850萬。
參會(hui)觀(guan)眾們的熱(re)情溢滿了1230平(ping)方米主會(hui)場,連分會(hui)場收費制的具身智能、AI智能體技術(shu)研討(tao)會(hui)和免費開放的中國智算中心(xin)創新(xin)論(lun)壇都(dou)座無虛席,展區(qu)附近(jin)交(jiao)流(liu)討(tao)論(lun)聲此起彼伏(fu)。
▲中(zhong)(zhong)國智算中(zhong)(zhong)心創新論壇座無虛席,連追加兩排座椅(yi),還有(you)不少觀眾站著(zhu)聽(ting)會
還有(you)多(duo)(duo)個“行(xing)業首發(fa)”:會上(shang),2024「AI生產力創新(xin)先鋒(AiiP)-中國生成式AI企業TOP50」正(zheng)式揭曉,李未(wei)可科技(ji)發(fa)布面(mian)向眼鏡(jing)等(deng)未(wei)來終端定向優化的自研WAKE-AI多(duo)(duo)模態大模型(xing),58同(tong)城宣布其大語言模型(xing)平臺今晚將上(shang)線Llama 3。
▲智(zhi)一科(ke)技聯合(he)創始人、智(zhi)車芯產媒矩陣(zhen)總編輯(ji)張國仁公布年度榜單
大會以“重(zhong)構世界 奔(ben)赴(fu)未(wei)來”為主題,聚集54位產學研投嘉賓(bin)代表同(tong)臺共探(tan)生成式AI全(quan)產業鏈的(de)發展現狀與未(wei)來趨(qu)勢,為業界把握時代脈(mo)搏提(ti)供原創性、高質量的(de)洞見參(can)考。
清華(hua)(hua)大學計算機NLP實(shi)驗室是國內開(kai)展(zhan)NLP研(yan)究最早、深具影響(xiang)力的科(ke)研(yan)單位(wei)。清華(hua)(hua)NLP實(shi)驗室的學術帶頭人——歐(ou)洲人文和自(zi)然科(ke)學院外籍院士、清華(hua)(hua)大學人工智能研(yan)究院常務(wu)副院長孫茂松教(jiao)授,為生成式AI大會作開(kai)場報告。
孫茂松(song)分享道,通(tong)用人工智能已開(kai)始登上(shang)歷史(shi)舞臺(tai),生(sheng)成(cheng)式AI會開(kai)啟人類(lei)全新的創(chuang)(chuang)造(zao)模式。原(yuan)來(lai)的創(chuang)(chuang)作(zuo)往(wang)往(wang)是從人類(lei)創(chuang)(chuang)造(zao)的現實空間出發,現在機器創(chuang)(chuang)造(zao)了(le)更大的現實可(ke)能空間,使人們能通(tong)過鑒(jian)賞選擇和修改提升進行創(chuang)(chuang)作(zuo)。
當前生成(cheng)(cheng)式AI的基本(ben)定位是啟發、輔助(zhu)人(ren)(ren)類,不會(hui)取代人(ren)(ren)類,因為其(qi)(qi)均屬(shu)于概率式方法(fa)范(fan)式,兼(jian)具(ju)(ju)創造與幻(huan)覺一枚硬幣的兩面,難以精確操(cao)控。生成(cheng)(cheng)式AI面臨的近期挑戰(zhan),一是走向多(duo)智能(neng)體,需要讓模(mo)型在盡(jin)量減少人(ren)(ren)為干預的情況下完成(cheng)(cheng)某些(xie)任務更加“靠譜”,二是走向具(ju)(ju)身(shen)智能(neng),其(qi)(qi)中的關鍵難點是如何有(you)效建(jian)立可計算(suan)的世(shi)界(jie)模(mo)型。
▲歐洲人(ren)文和自然科(ke)學(xue)(xue)院(yuan)外籍院(yuan)士、清華大(da)學(xue)(xue)人(ren)工智能研究(jiu)院(yuan)常務副(fu)院(yuan)長孫茂松
國(guo)內資(zi)深大(da)(da)模型行業(ye)投(tou)資(zi)人,“清(qing)華系”、“北大(da)(da)系”、“前大(da)(da)廠(chang)(chang)高管”等光環加身的(de)明(ming)星創(chuang)業(ye)者,國(guo)內外頂(ding)級AI大(da)(da)廠(chang)(chang)的(de)資(zi)深算法專家,三大(da)(da)國(guo)內頭部AI研(yan)究機(ji)構的(de)科學家與青年(nian)學者,最懂AI基(ji)礎設施(shi)的(de)大(da)(da)廠(chang)(chang)與創(chuang)企嘉賓(bin)代表,異軍突起(qi)的(de)爆款AIGC應用先行者,他們悉數而(er)來(lai)。
大會首日,25位(wei)嘉(jia)賓(bin)暢談大語言模(mo)型(xing)(xing)、視頻生成、具(ju)身智能、音樂生成、世界(jie)模(mo)型(xing)(xing)、垂類行業大模(mo)型(xing)(xing)、AI全棧軟件、加速大模(mo)型(xing)(xing)端側部(bu)署等前(qian)沿(yan)議題。()
今日,來(lai)自生成式AI前線的學術代表、商業領袖、技術專家、青年(nian)學者們,繼續(xu)分享對關(guan)鍵技術創新、全棧軟件及智算基礎設(she)施升級、AI應用落地探索實踐、可持續(xu)商業模(mo)式的趨勢(shi)洞察。其中多位嘉(jia)賓cue到(dao)了昨夜(ye)新鮮登場的Llama 3。
一、AI Infra專場:攻克這些“基建”挑戰,才能通往高階AGI
頂尖大(da)模型的(de)強大(da)性能(neng),不止有(you)賴(lai)于技術研發實力,還需要扎(zha)實的(de)工程功(gong)底(di)。底(di)層算力基礎設施(shi)和AI軟件基礎設施(shi)的(de)升級,都在加速大(da)模型訓(xun)練(lian)與部署的(de)過程中(zhong)發揮(hui)了關鍵作用(yong)。
開源(yuan)大(da)模(mo)型(xing)領導者Meta最新發布的開源(yuan)力作Llama 3 8B和70B,再(zai)度例證攻克“基(ji)建”難關何(he)其(qi)重要。據Meta披露,兩款模(mo)型(xing)是(shi)同體量中最好(hao)的開源(yuan)模(mo)型(xing),Llama 3 400B還在(zai)訓(xun)練(lian)(lian)中;Llama 3用兩個定制24K GPU集(ji)群進行(xing)訓(xun)練(lian)(lian),訓(xun)練(lian)(lian)數據量逾15T tokens,比Llama 2的7倍還多(duo)。
▲Meta研究團隊在4月15日評估了預訓(xun)練和(he)Instruct版中經過部分(fen)訓(xun)練的模型(xing),并報告了性(xing)能(neng)數(shu)據
這背后,Meta采(cai)用指令微(wei)調(diao)技(ji)術來改善對話效果,并(bing)結合了(le)數據并(bing)行(xing)、模型并(bing)行(xing)、流(liu)水線并(bing)行(xing)三(san)類并(bing)行(xing)方式來訓練Llama 3,再加上其他(ta)優化策略,綜合訓練效率比Llama 2提高(gao)了(le)約3倍。
在大(da)會AI Infra專場,來自潞(lu)晨科(ke)技、NVIDIA、星環科(ke)技、中(zhong)科(ke)加禾、天津大(da)學(xue)&派歐云(yun)、阿里云(yun)、焱融(rong)科(ke)技、Zenlayer的嘉(jia)賓代表,分(fen)享(xiang)了類Sora開源架(jia)構、大(da)模型全棧(zhan)AI解決(jue)方案、應用(yong)開發工(gong)具鏈、編譯器、分(fen)布式算力網絡、高效存儲(chu)等方向的技術、挑戰與(yu)策略(lve)。
新加(jia)坡國立大學校長青年教授、潞晨科技創始人兼董事長尤洋談(tan)到模(mo)型(xing)(xing)(xing)訓練(lian)流程開源的(de)重要性,包括模(mo)型(xing)(xing)(xing)架(jia)構(gou)、模(mo)型(xing)(xing)(xing)權重、訓練(lian)細節、數據處理等。正如Meta最(zui)新發布Llama 3,其超過4000億(yi)個(ge)參數的(de)版本開源后,將造福大量開發者。
面向(xiang)視頻(pin)生(sheng)成領域,他認為現在正(zheng)處于“GPT-2時刻”,還(huan)沒有出現成熟(shu)的(de)應(ying)用。尤洋(yang)帶領團隊開源的(de)全(quan)球首(shou)個類Sora架(jia)構視頻(pin)生(sheng)成模型Open-Sora采用STDiT架(jia)構,相比DiT成本大(da)幅降(jiang)低。Open-Sora未來的(de)發展方向(xiang)主要是(shi)完(wan)善數據(ju)處理流程以及(ji)訓練(lian)視頻(pin)壓縮Encoder。
▲新加坡國立大學校長青年教授、潞晨(chen)科(ke)技創始人(ren)兼董事長尤洋(yang)
NVIDIA解決方案架(jia)構與工程(cheng)總監(jian)王(wang)淼(miao)談到大語(yu)言模型(xing)生態系(xi)統四大趨(qu)(qu)勢,一(yi)是(shi)(shi)新基(ji)礎大語(yu)言模型(xing)發布(bu)提速,最(zui)新代(dai)表便(bian)是(shi)(shi)Meta剛(gang)發布(bu)的Llama 3,二是(shi)(shi)新算子和(he)定制技術(shu)持(chi)續(xu)優化,三是(shi)(shi)模型(xing)規(gui)模繼續(xu)增(zeng)加(jia),四是(shi)(shi)從Dense到MoE轉變趨(qu)(qu)勢形成。這意味(wei)著需要(yao)全棧AI解決方案助力模型(xing)開發和(he)應(ying)用(yong)部署。
NVIDIA如何搭建(jian)大(da)(da)語(yu)言模型(xing)基礎(chu)設施?王(wang)淼分(fen)享說,NVIDIA為(wei)GPU增加的(de)FP8支持相比FP16、BF16實(shi)現2倍吞(tun)吐性能(neng)提升(sheng),同(tong)時進一步將數(shu)據精度縮減(jian)到FP4并勝任推(tui)理(li)任務(wu)。他(ta)還分(fen)享了(le)NVIDIA在網絡基礎(chu)設施上的(de)布局,包括(kuo)融(rong)合標(biao)準以太(tai)(tai)網連接和專業高性能(neng)架構的(de)NVIDIA Spectrum-X以太(tai)(tai)網平臺、助(zhu)攻大(da)(da)語(yu)言模型(xing)應用落地全流程的(de)NVIDIA NeMo、NVIDIA Triton推(tui)理(li)服務(wu)器等。
▲NVIDIA解決方案架(jia)構與(yu)工程(cheng)總監王淼
星環科(ke)技(ji)大(da)(da)模型(xing)產(chan)品負責人(ren)童(tong)欣欣談道,當下(xia)大(da)(da)模型(xing)幻覺問(wen)題(ti)凸顯,通用(yong)的大(da)(da)模型(xing)難以(yi)解決(jue)特定(ding)場景的問(wen)題(ti)。企(qi)業(ye)內部落地(di)大(da)(da)模型(xing)應(ying)(ying)用(yong)時,可通過組合提示(shi)詞工程、檢索(suo)增強(qiang)、智能(neng)體、有(you)監督微調及(ji)預(yu)訓練(lian)等不同方式,來解決(jue)垂直場景的業(ye)務問(wen)題(ti)。他(ta)還表示(shi)大(da)(da)模型(xing)及(ji)應(ying)(ying)用(yong)開發和落地(di)不是一(yi)錘子買賣(mai),需要企(qi)業(ye)級別(bie)的長期運維(wei)和監控(kong)。
Sophon LLMOps是星(xing)(xing)環科技推(tui)出的企業級(ji)大(da)模型(xing)和(he)應(ying)(ying)用開發工(gong)具(ju)鏈,提供語(yu)料知識精細(xi)化處理入庫(ku)、提示詞開發、語(yu)料數據標注、大(da)模型(xing)微調訓練、大(da)模型(xing)評估部署(shu)到(dao)大(da)模型(xing)應(ying)(ying)用構建(jian)和(he)應(ying)(ying)用部署(shu)上線的全鏈路(lu)工(gong)具(ju)能力(li)。此外(wai),星(xing)(xing)環科技還(huan)推(tui)出大(da)模型(xing)和(he)應(ying)(ying)用開發服務一(yi)體(ti)機(ji),通過(guo)預裝(zhuang)Sophon LLMOps工(gong)具(ju)平(ping)臺,用戶(hu)可按(an)需快速的體(ti)驗大(da)模型(xing)開發和(he)應(ying)(ying)用的全流程(cheng)能力(li)。
▲星(xing)環科技(ji)大(da)模型產品負責(ze)人童欣欣
中(zhong)科(ke)加禾創(chuang)始(shi)人、CEO崔慧敏談道(dao),在(zai)AI芯片(pian)(pian)落(luo)地過程中(zhong),關鍵是要構建整個基(ji)礎軟件的(de)(de)能(neng)力(li),從而(er)增強可(ke)持續發展能(neng)力(li)。正如CUDA成(cheng)(cheng)就了英偉(wei)達,軟件生態成(cheng)(cheng)為AI基(ji)礎設施的(de)(de)標(biao)準和(he)競爭優勢,決定了芯片(pian)(pian)的(de)(de)可(ke)用性和(he)市場接受(shou)度。
崔慧(hui)敏(min)強調(diao)了(le)跨平(ping)臺編(bian)譯(yi)技術的(de)(de)重(zhong)要性,對標CUDA層(ceng)次(ci),能跨多(duo)(duo)種芯(xin)片的(de)(de)底(di)層(ceng)編(bian)譯(yi)工具(ju)是解(jie)決國產芯(xin)片長期可持(chi)續(xu)的(de)(de)重(zhong)要基(ji)礎能力(li)。中科加禾(he)利用編(bian)譯(yi)技術構建的(de)(de)大模型推理引擎可以實現一套軟件對多(duo)(duo)種AI加速卡的(de)(de)支持(chi)。
天津大學計(ji)(ji)算(suan)(suan)(suan)機科學與技(ji)術學院(yuan)教授、PPIO派歐云首(shou)席(xi)科學家王曉飛分享了三(san)個AGI時代的(de)(de)思(si)考:首(shou)先,計(ji)(ji)算(suan)(suan)(suan)與算(suan)(suan)(suan)力供需長尾化且分布(bu)不均;其次,計(ji)(ji)算(suan)(suan)(suan)任(ren)務和需求是否完美匹配、能(neng)否精準調度(du);第三(san),“核心+邊緣”分層協同的(de)(de)算(suan)(suan)(suan)力網(wang)絡計(ji)(ji)算(suan)(suan)(suan)范式及算(suan)(suan)(suan)力經濟。
基于上述思考,他認(ren)為要搭(da)建AGI Infra,分布式算力(li)網絡是云(yun)邊端協同計算基礎設施的(de)收斂形態。PPIO推出的(de)“派歐(ou)算力(li)云(yun)”覆蓋全國(guo)數千(qian)個分布式算力(li)節點,通過智能調度和推理加(jia)速(su)技術,可以實現算力(li)性(xing)價比提升(sheng)數十倍,推理成本大(da)幅度降低。
▲天(tian)津大學計算機科學與技術學院教授(shou)、PPIO派歐云(yun)首(shou)席科學家王曉飛(fei)
阿里云(yun)高級技術專家(jia)、阿里云(yun)異構計(ji)算(suan)AI推(tui)理團隊負責人(ren)李鵬談道,大模(mo)(mo)(mo)型(xing)的發(fa)展給計(ji)算(suan)體系結構帶來了功耗墻(qiang)、內存墻(qiang)和通訊墻(qiang)等多重(zhong)挑戰。其中,大模(mo)(mo)(mo)型(xing)訓練層面(mian)(mian),用(yong)戶在模(mo)(mo)(mo)型(xing)裝載、模(mo)(mo)(mo)型(xing)并行、通信等環節(jie)面(mian)(mian)臨(lin)各種現實問(wen)題(ti);在大模(mo)(mo)(mo)型(xing)推(tui)理層面(mian)(mian),用(yong)戶在顯存、帶寬、量化上(shang)面(mian)(mian)臨(lin)性能(neng)瓶頸。
對于如何進一步釋(shi)放云(yun)上(shang)性能?阿里云(yun)彈(dan)性計(ji)算為云(yun)上(shang)客(ke)戶提(ti)(ti)(ti)供了ECS GPU DeepGPU增強(qiang)工具包,幫(bang)助用(yong)戶在云(yun)上(shang)高(gao)(gao)效(xiao)地構建AI訓練(lian)和AI推理基礎設施,從(cong)而提(ti)(ti)(ti)高(gao)(gao)算力(li)利用(yong)效(xiao)率。目前,阿里云(yun)ECS DeepGPU已經(jing)幫(bang)助眾多(duo)客(ke)戶實(shi)現性能的大幅提(ti)(ti)(ti)升。其中,LLM微調訓練(lian)場景(jing)下(xia)性能最高(gao)(gao)可提(ti)(ti)(ti)升80%,Stable Difussion推理場景(jing)下(xia)性能最高(gao)(gao)可提(ti)(ti)(ti)升60%。
▲阿(a)里云(yun)高級技術專家、阿(a)里云(yun)異構計算AI推理團隊負責人李(li)鵬
焱融(rong)科技(ji)CTO張(zhang)文濤解(jie)讀了存(cun)儲對大模(mo)型訓(xun)練和推理(li)的(de)重(zhong)要性,從數據加(jia)(jia)載、協議、模(mo)型加(jia)(jia)載到Checkpoint保存(cun)等,過程中存(cun)在大量(liang)小(xiao)的(de)讀寫(xie)請(qing)求(qiu)、GPU傳(chuan)輸(shu)等。對于多(duo)模(mo)態大模(mo)型,高性能存(cun)儲對訓(xun)練的(de)提升效果更好(hao),效率可(ke)提升20-40%。
針對訓練推理,焱融科技推出(chu)了多云存儲解決方案,基(ji)于(yu)統一的數(shu)(shu)據(ju)(ju)(ju)湖底座,通過數(shu)(shu)據(ju)(ju)(ju)編排將數(shu)(shu)據(ju)(ju)(ju)按需加(jia)載到數(shu)(shu)據(ju)(ju)(ju)中(zhong)心,并異(yi)步將新(xin)增的模型數(shu)(shu)據(ju)(ju)(ju)推到數(shu)(shu)據(ju)(ju)(ju)湖。數(shu)(shu)據(ju)(ju)(ju)加(jia)載支持對接OSS、COS、BOS等各大主流對象存儲平(ping)臺(tai)。
Zenlayer行業拓(tuo)展總監陳(chen)秀(xiu)忠(zhong)談道,通往更(geng)高級AGI的(de)(de)(de)挑戰在于更(geng)即(ji)時的(de)(de)(de)交互、更(geng)廣(guang)的(de)(de)(de)數據(ju)、更(geng)廣(guang)的(de)(de)(de)算力。因此,面(mian)向AGI的(de)(de)(de)全球(qiu)邊(bian)(bian)緣(yuan)云方案需要考慮(lv)支持(chi)實時交互的(de)(de)(de)全球(qiu)網絡、數據(ju)本地存儲(chu)和全球(qiu)流動、大量(liang)的(de)(de)(de)邊(bian)(bian)緣(yuan)節點。
專線對中國企(qi)業在海(hai)外部署關鍵(jian)應用(yong)十分重要(yao)。陳秀(xiu)忠稱,安(an)全(quan)合規(gui)的跨境專線是(shi)企(qi)業連接全(quan)球的第一跳。Zenlayer通過邊緣數據中心服務,可為(wei)企(qi)業提供定制化的機(ji)房托(tuo)(tuo)管和托(tuo)(tuo)管主機(ji)解決(jue)方案。
二、AIGC應用專場:核心問題是高質量數據,3D生成今年將實現真正可用
過去一(yi)年,中國(guo)生(sheng)成(cheng)式AI產業出現(xian)很多代表性的商業化探索成(cheng)果。在手機、互聯網、影視(shi)、音樂、游(you)戲、金融、電商、文娛、教(jiao)育(yu)、工(gong)業、自動駕駛(shi)、生(sheng)活服務等(deng)應用場景,搜索、辦公、寫作、創意到繪畫、修圖、視(shi)頻(pin)編輯、3D建(jian)模等(deng)AI提效工(gong)具如雨后春筍般蓬勃而(er)生(sheng)。
探索視(shi)頻生成(cheng)(cheng)和世界模型的(de)極(ji)佳科(ke)技(ji),用AIGC賦能(neng)(neng)影視(shi)行(xing)業的(de)天圖萬(wan)境,將(jiang)3D生成(cheng)(cheng)帶入秒級時代的(de)VAST,為生活服務打造(zao)垂(chui)類大模型的(de)58同城(cheng),提(ti)供決策(ce)式AI和生成(cheng)(cheng)式AI相輔相成(cheng)(cheng)技(ji)術方案的(de)百融云創,打造(zao)游戲行(xing)業一站式AI賦能(neng)(neng)平臺的(de)行(xing)者AI,提(ti)供全鏈(lian)路電商內容生成(cheng)(cheng)引擎的(de)極(ji)睿(rui)科(ke)技(ji),用AIGC降低(di)音樂(le)制作門檻的(de)靈動音DeepMusic,均在今天下午的(de)AIGC應用專場進行(xing)分享(xiang)。
極佳科(ke)技(ji)創始人(ren)兼CEO黃冠(guan)認為,當下所有“通(tong)用智能(neng)”都(dou)在走向“端到端大模型(xing)”,一切(qie)問題都(dou)變成(cheng)了“高質量(liang)數(shu)(shu)據(ju)(ju)”問題。“世界模型(xing)”是(shi)未來(lai)具(ju)身智能(neng)最(zui)重(zhong)要的“高質量(liang)數(shu)(shu)據(ju)(ju)”來(lai)源,它結合(he)(he)互聯網數(shu)(shu)據(ju)(ju)、仿真數(shu)(shu)據(ju)(ju)、遙操數(shu)(shu)據(ju)(ju)、真實采集數(shu)(shu)據(ju)(ju)等多種數(shu)(shu)據(ju)(ju),學習(xi)、訓(xun)練、組合(he)(he),從而得到交(jiao)互式物理世界模擬器。
極(ji)佳科(ke)技正基于世界模型打造新(xin)一代(dai)數據平臺(tai),面向(xiang)端(duan)到端(duan)自(zi)動駕駛(shi)(shi)和(he)通用機(ji)器人提供服務。極(ji)佳科(ke)技DriveDreamer自(zi)動駕駛(shi)(shi)世界模型、WorldDreamer通用世界模型目(mu)前已(yi)成功商業(ye)化落(luo)地。
天圖萬境創始人圖拉古認為,AI應(ying)(ying)該是(shi)能夠(gou)給(gei)人們帶(dai)來(lai)溫(wen)暖、彌(mi)合世界的(de)創作工具,而(er)不(bu)是(shi)取代人工作的(de)的(de)“內卷(juan)武器”。因此AI不(bu)能離開應(ying)(ying)用(yong)談技術,而(er)是(shi)要(yao)建立到應(ying)(ying)用(yong)端的(de)完整產業鏈。天圖萬境從AI文本創作,到視頻生(sheng)成,再到服務用(yong)戶的(de)應(ying)(ying)用(yong)端,打造了全產業鏈技術解(jie)決方案,且都早(zao)于(yu)國際(ji)巨(ju)頭發(fa)布了對應(ying)(ying)產品,目前正在快速迭代中。
其展示的(de)(de)聲音(yin)生(sheng)成工具Sora Opera,可以(yi)自動感知、智能(neng)識別視(shi)頻畫(hua)面(mian)中的(de)(de)物理(li)邏輯(ji),精準配出(chu)風格多變(bian)的(de)(de)音(yin)樂(le)音(yin)效,為視(shi)頻增加聲音(yin)的(de)(de)魅(mei)力。還有聲音(yin)克隆工具SoundMax,它(ta)不走傳(chuan)統TTS路(lu)線,而(er)是將輸入的(de)(de)人聲轉換(huan)成其他(ta)聲線。這樣的(de)(de)人工智能(neng)工具,不會讓(rang)(rang)配音(yin)演(yan)員失(shi)業(ye),而(er)是讓(rang)(rang)他(ta)們在(zai)演(yan)繹不同角色時插上飛翔的(de)(de)創意翅(chi)膀。
從文字、圖片到視頻(pin)、3D,信息載體不斷升級,VAST創始人兼(jian)CEO宋亞宸(chen)談道,3D的體驗質量(liang)、信息密度不斷提升且更具互動性。他認(ren)為目前3D生(sheng)成已經達到類似(si)Midjourney V3的效果,今年9月將達到類V4效果,年底達到類V5效果,實(shi)現真正可用。
為了應對3D生(sheng)成(cheng)(cheng)創作成(cheng)(cheng)本和門檻(jian)過高的(de)挑戰(zhan),VAST將3D內容平臺(tai)和大眾級(ji)創作者平臺(tai)結合。VAST的(de)3D大模型Tripo已實現模型生(sheng)成(cheng)(cheng)數量超150萬個。
58同城(cheng)TEG-AI Lab大語言模(mo)(mo)型(xing)算法(fa)部(bu)負責(ze)人孫啟明(ming)認為,通用(yong)大模(mo)(mo)型(xing)+提示不會代替一切,應用(yong)方需(xu)要(yao)結合自身業(ye)務(wu)場(chang)景(jing),微調出自己的大模(mo)(mo)型(xing)。58同城(cheng)構建了(le)模(mo)(mo)型(xing)領先、敏捷易用(yong)的AI平(ping)臺,助力AI應用(yong)在(zai)內部(bu)各業(ye)務(wu)線快速落地。
58同城搭建(jian)了(le)一套支持大(da)語言(yan)模(mo)型(xing)訓練、推(tui)(tui)理(li)的(de)平臺,集(ji)成開源通用大(da)模(mo)型(xing),今晚將上線(xian)Meta最新推(tui)(tui)出的(de)Llama 3模(mo)型(xing)。基于(yu)大(da)語言(yan)模(mo)型(xing)平臺,58同城已推(tui)(tui)出了(le)垂類大(da)語言(yan)模(mo)型(xing)靈犀(xi)大(da)模(mo)型(xing)(ChatLing),相比(bi)官方(fang)開源大(da)模(mo)型(xing)實現(xian)了(le)更好效果。
▲58同城TEG-AI Lab大語言(yan)模型算法(fa)部負責人(ren)孫啟明
百融(rong)云創AI創新負責(ze)人談道,生成式(shi)(shi)AI是AGI的(de)先導,其與決策(ce)式(shi)(shi)AI最大的(de)區別在于問(wen)題(ti)空間的(de)擴(kuo)大。傳統模型提供的(de)優化(hua)候選集(ji)合約為數千個(ge)。而Llama 2提供詞(ci)表中(zhong)包含3.2萬個(ge)選項(xiang),對信(xin)息的(de)壓縮比(bi)達到(dao)14倍;剛剛發(fa)布的(de)Llama 3候選詞(ci)表擴(kuo)充超過了12萬個(ge),對信(xin)息的(de)壓縮比(bi)也提升到(dao)30倍以(yi)上。
面向金融(rong)行(xing)業,百融(rong)云創開(kai)發了百融(rong)大模型一站式應用開(kai)發平臺,針對信息安全、復雜溝(gou)通等需求(qiu)構建了BR-Coder編程(cheng)助手、數字(zi)員工和(he)交互式數字(zi)人(ren)Web-Copilot等應用。
▲百融云創(chuang)AI創(chuang)新(xin)負責人(ren)分享(xiang)生成式AI是(shi)AGI的先導
在他看來(lai),大模型走(zou)向(xiang)落地時(shi),“最后一(yi)公里”需要結合具(ju)體行(xing)業、具(ju)體領域工(gong)作(zuo)流(liu),一(yi)致(zhi)、可控(kong)、高精度是工(gong)業化AI成為工(gong)具(ju)必不可少的(de)(de)(de)特性。而行(xing)者AI的(de)(de)(de)解決方案可以(yi)將產品策劃、美術(shu)總監等用(yong)戶的(de)(de)(de)工(gong)作(zuo)效率提(ti)升3-5倍。
極(ji)睿科(ke)技創始人兼CEO武彬談道,當下電商行(xing)業圖文(wen)和短視頻的內容數量(liang)與(yu)需求都在大幅上升,內容關(guan)聯著平臺、賣家(jia)與(yu)買家(jia)的核心交易(yi)訴求,但內容制作效率(lv)嚴重不(bu)足。
成(cheng)立于(yu)2017年的極睿科技(ji)專(zhuan)注于(yu)打造電(dian)商(shang)內容生成(cheng)引擎(qing),推出(chu)了(le)ECGPT+FashionCLIP基座模型(xing)及多種電(dian)商(shang)垂直(zhi)大模型(xing),可支持商(shang)品AI拍攝、AI排版上(shang)新、AI直(zhi)播切片、AI生成(cheng)商(shang)品短視頻(pin)、AI帶貨、一站(zhan)式AI技(ji)術與(yu)數據服務平臺、智(zhi)能商(shang)品操作系統(tong)等(deng)多種功能,目(mu)前已合(he)作超4萬電(dian)商(shang)客(ke)戶。
DeepMusic CEO劉曉光(guang)分享說(shuo),當前(qian)的音(yin)樂商業格局,主要面向泛音(yin)樂愛好者(zhe)的聽歌(ge)及淺度實(shi)踐(jian)用戶的唱歌(ge)消費體(ti)驗,而中間有1億以上活(huo)躍的音(yin)樂人、音(yin)樂實(shi)踐(jian)者(zhe)群體(ti),其(qi)需求尚未得到好的產品滿足;同時(shi)音(yin)樂制作流(liu)程長、門(men)檻(jian)高(gao),這(zhe)使得音(yin)樂AIGC技(ji)術有用武之地。
對(dui)此,DeepMusic構建了跨平(ping)臺一站式AI音(yin)樂(le)工作站“和弦派”,以更直觀的(de)音(yin)樂(le)知識呈現、編輯形(xing)式,解決(jue)音(yin)樂(le)中(zhong)歌(ge)詞、旋律、伴奏等(deng)不同模(mo)態之(zhi)間溝(gou)通(tong)(tong)困難(nan)的(de)問(wen)題,覆蓋音(yin)樂(le)創作、制作多個(ge)流(liu)程;未來(lai)DeepMusic也會通(tong)(tong)過積(ji)累的(de)精細化標(biao)注數據數據,實(shi)現對(dui)音(yin)頻模(mo)型(xing)的(de)精細化控制。
除(chu)了上(shang)述嘉(jia)(jia)賓外(wai),另有7位嘉(jia)(jia)賓在分會(hui)場(chang)的(de)中(zhong)國智算中(zhong)心創新論(lun)壇(tan)進(jin)行分享,6位嘉(jia)(jia)賓在分會(hui)場(chang)收費制(zhi)的(de)智猩猩AI智能體技術研討(tao)會(hui)上(shang)輸出(chu)干(gan)貨(huo)。
結語:下一站,上海見!
“我們正站(zhan)在歷史的(de)轉折(zhe)處,見證和(he)參與由生成式AI引(yin)領(ling)的(de)新(xin)一輪科(ke)技變革。”智一科(ke)技聯合(he)創(chuang)始人(ren)、CEO龔倫常(chang)代表主辦方(fang)為大(da)會致辭。
過去(qu)一年,生(sheng)成式AI狂(kuang)飆(biao)突進(jin)(jin),整個產業鏈成為全(quan)球創新(xin)、投資和應用最活躍的(de)領域(yu)之一,每位參與者都在與時間賽跑。作為智能產業的(de)長期觀察者,我們(men)期待見證并(bing)記錄(lu)中(zhong)國生(sheng)成式AI浪潮之變,并(bing)將(jiang)持續(xu)邀請這股浪潮中(zhong)的(de)生(sheng)力軍們(men),分享他(ta)們(men)最新(xin)的(de)技(ji)術進(jin)(jin)展與商業化探索(suo)。
今(jin)日(ri),為(wei)期兩天的(de)2024中(zhong)國生成式(shi)AI大(da)會·北京站(zhan)圓滿收官。半年(nian)后的(de)11月份,我們將在(zai)上海,為(wei)中(zhong)國生成式(shi)AI產業再辦一場秋(qiu)日(ri)盛會。
除此之(zhi)外(wai),智一科技旗下AI與硬科技知識分享社區智猩猩將聯合智能(neng)汽車(che)(che)產(chan)(chan)業(ye)新媒(mei)體車(che)(che)東(dong)西、芯(xin)片產(chan)(chan)業(ye)新媒(mei)體芯(xin)東(dong)西,6月(yue)在(zai)上海舉行(xing)中(zhong)國智能(neng)汽車(che)(che)算力峰(feng)會(hui)(hui),9月(yue)在(zai)深圳舉行(xing)第六屆全球AI芯(xin)片峰(feng)會(hui)(hui),12月(yue)在(zai)深圳舉行(xing)第四屆全球自(zi)動駕駛峰(feng)會(hui)(hui)。歡(huan)迎參(can)會(hui)(hui)交流。