
智東西(公眾號:zhidxcom)
編輯?| ?GTIC
智東西6月5報道,在(zai)GTIC 2023中(zhong)國AIGC創新峰會(hui)上,商(shang)湯科技聯合創始人(ren)、大裝(zhuang)置事業群總(zong)裁楊帆(fan)以《AI 2.0 — 大模(mo)型帶來的(de)新時代(dai)浪潮》為主題發表演講(jiang),解讀了作為“小(xiao)模(mo)型時代(dai)”走(zou)出(chu)的(de)創企的(de)求變之路和能力圈。
AI正(zheng)引(yin)(yin)領新一代技術(shu)革命(ming),從AI輔助(zhu)科研、生成(cheng)式(shi)AI席卷(juan)到近期(qi)爆火的對話機器(qi)人ChatGPT。大(da)(算)力出(chu)奇(qi)跡、量變引(yin)(yin)發質變。楊帆稱,AI生產范式(shi)正(zheng)發生重大(da)轉變——大(da)模(mo)型時代到來。
楊帆(fan)談(tan)道(dao),在(zai)過去(qu)10年的AI“小模(mo)(mo)型”時(shi)代(dai),解決單一問題的深(shen)度學習方法與(yu)工業(ye)化小模(mo)(mo)型生產工具(ju)逐步成熟;在(zai)新的大(da)模(mo)(mo)型時(shi)代(dai),大(da)模(mo)(mo)型即服務(MaaS)成為新主題,誕生了圍(wei)繞(rao)大(da)模(mo)(mo)型基礎設施(shi)降本、算力數據軍備賽、實時(shi)用(yong)戶反饋展開的AI新范式。
面向這(zhe)一趨(qu)勢,扎根AI近10年的(de)商(shang)湯(tang)沉淀出商(shang)湯(tang)SenseCore大裝置(zhi),從AI原生基礎(chu)設施、大模(mo)(mo)型生產平臺、算法(fa)模(mo)(mo)型服務、行業應用四個層面,使能極致大模(mo)(mo)型開(kai)發(fa)體驗。
楊帆說,商湯將結(jie)合(he)多年行(xing)業經驗累積,提(ti)供高效(xiao)率、低成(cheng)本、規模化的新一代AI基礎設施產(chan)品與服務,全棧加速千(qian)億級大(da)模型(xing)生產(chan)部署,促進(jin)數據采集、標注(zhu)、管(guan)理效(xiao)率大(da)幅提(ti)升(sheng),縮減模型(xing)迭代周期。同(tong)時(shi)商湯還會通過提(ti)供大(da)模型(xing)開發支(zhi)持服務,保障開發成(cheng)果落(luo)地。
以下為楊帆的演講實錄:
感謝今(jin)天(tian)有這個機會來跟大(da)(da)家(jia)分享一(yi)下商湯(tang)最近在做的(de)一(yi)些工作(zuo)。今(jin)年ChatGPT、大(da)(da)模型(xing)非常(chang)火(huo),商湯(tang)作(zuo)為一(yi)個從(cong)事算法研發的(de)公司,我們(men)不叫大(da)(da)模型(xing),而是講預訓練模型(xing),這件事情我們(men)從(cong)18年就開始(shi)在做了(le)。
一、很多預訓練模型的技術進步,比起ChatGPT毫不遜色
在我們看來,今天ChatGPT因為能跟(gen)C端用戶無縫交(jiao)互的(de)對話式能力(li),使得最近兩年以大數據、暴力(li)美學為基礎的(de)新的(de)預訓(xun)練模型技術(shu)火(huo)出圈(quan),被更多人所(suo)認(ren)識和感知到。
過去兩年,我們(men)看到的(de)很多(duo)技術進步其實都是類似的(de)機(ji)理和機(ji)制,我個人認為它們(men)的(de)意義某種程度上比(bi)起(qi)ChatGPT毫不遜色,甚至(zhi)更(geng)大。
比如前年到去年很多AI for Science的(de)突破,今(jin)天能(neng)夠快速推演所(suo)有蛋白質的(de)結(jie)構,能(neng)夠做原子(zi)劇變(bian)的(de)模(mo)擬(ni),這些實際(ji)上都(dou)是一些最新AI技術通過更(geng)大的(de)模(mo)型訓練帶(dai)來(lai)的(de)改變(bian)。
大(da)模(mo)(mo)型、預(yu)訓(xun)練其實是一個(ge)非常(chang)寬泛的領域(yu),不止是自然語言(yan),也(ye)包(bao)括(kuo)視覺、多(duo)模(mo)(mo)態、決策(ce),雖然決策(ce)模(mo)(mo)型今天(tian)的數據量級和參數量級沒有(you)那么大(da),但是很多(duo)模(mo)(mo)態模(mo)(mo)型最(zui)終還是要應(ying)用(yong)到決策(ce)任務上。所以在我看來,最(zui)近兩(liang)年(nian)(nian)整個(ge)AI研究范式確實產(chan)生了非常(chang)大(da)的改(gai)變,而且這個(ge)改(gai)變是全方位的。包(bao)括(kuo)AI for Science,不僅僅是技術(shu)的進步(bu),過去兩(liang)年(nian)(nian)相關商業化節奏(zou)也(ye)非常(chang)快(kuai),很多(duo)國內外公司已經(jing)可以利用(yong)最(zui)新的科(ke)研技術(shu),迅速形成一些生產(chan)力的轉化。
再比(bi)如說(shuo)去年非常(chang)火的文(wen)生圖,還有最(zui)新(xin)的Stable Diffusion繪(hui)畫結(jie)果,都已經是實實在在的商業嘗試。你可(ke)以在社交(jiao)平臺上找(zhao)到(dao)10萬粉(fen)絲的AI博(bo)主(zhu)。此(ci)前,Midjourney發布V5版本,已經解決了畫手指的問題。
技(ji)術(shu)(shu)本(ben)身在非常快速(su)地迭(die)代(dai),不僅僅是對話(hua)式(shi)大模型(xing)。當然對話(hua)大模型(xing)本(ben)身有無數的(de)(de)探(tan)討與思考,我們相信它在未來(lai)能夠形成大量新的(de)(de)技(ji)術(shu)(shu)應(ying)用。今天在國內外有很(hen)多從業者(zhe)已經開(kai)始用這樣的(de)(de)技(ji)術(shu)(shu)快速(su)地做一些應(ying)用的(de)(de)創造與更(geng)新。
二、大模型時代,AI生產范式發生重大轉變
這樣(yang)技術的創新與進步背后,底(di)層支撐(cheng)是什么?
今天很多嘉賓(bin)提到了大(da)數(shu)(shu)據、大(da)模(mo)型以及支撐它的(de)大(da)算(suan)力,的(de)確如此。單(dan)個AI模(mo)型的(de)數(shu)(shu)據參數(shu)(shu)量(liang)以及所需要的(de)算(suan)力規模(mo)到2010、2012年之后是(shi)一個非常(chang)陡峭的(de)曲線(xian),呈現極高速(su)的(de)增(zeng)長(chang),它的(de)成本也(ye)是(shi)非常(chang)高昂的(de)。
我們做了一個簡單的測(ce)算(suan)(suan),微(wei)軟現(xian)在嘗試把(ba)一部分ChatGPT接(jie)進了Bing搜索結果,假設把(ba)谷歌每秒的查詢全部AI化,為了支撐這個東西去跑,意味著(zhu)300億美(mei)金的運(yun)算(suan)(suan)成(cheng)本(ben),非常高昂(ang)。
我(wo)們面(mian)(mian)(mian)前還(huan)有很長(chang)的路。一(yi)方面(mian)(mian)(mian)是技術的進步,一(yi)方面(mian)(mian)(mian)是成本的下降、資源的節約,還(huan)有很多的工作需要我(wo)們去做。從GPT-2到GPT-3到3.5再到4,特(te)別是3.5到4,模型參數并沒有很大(da)變(bian)化,主要來(lai)自于(yu)數據量級(ji)多了20倍,而產生很大(da)的效果。所有這一(yi)切都指向“大(da)力出(chu)奇(qi)跡,量變(bian)引發質變(bian)”。在我(wo)們看來(lai),這個(ge)(ge)方向更多意(yi)味著整個(ge)(ge)AI從技術生產范式以及商業模式帶來(lai)全新的變(bian)化。
商(shang)湯(tang)2014年(nian)成立,經歷(li)了上一輪(lun)AI的(de)完整商(shang)業化過程。我(wo)們(men)看到所有AI技術創新、算法(fa)的(de)迭(die)代,其實是(shi)一個鏈條很長、要不斷高頻迭(die)代形成閉環,最后(hou)才能產生應用的(de)模(mo)式。
這樣的模式有一(yi)(yi)個(ge)問題:鏈(lian)條中牽扯到多(duo)環(huan)節(jie),而且在每個(ge)環(huan)節(jie)需(xu)要(yao)的技術能力、業務理解、場景能力都(dou)是不(bu)同(tong)的,需(xu)要(yao)在每個(ge)環(huan)節(jie)都(dou)保(bao)持專業性。同(tong)時(shi),它(ta)要(yao)求整個(ge)迭代頻率比較快,AI所有的技術今(jin)天應用(yong)在任何一(yi)(yi)個(ge)新(xin)場景上,都(dou)是不(bu)足的,都(dou)需(xu)要(yao)通過快速迭代去改進提升。
這某種意義上帶(dai)來了高(gao)單點(dian)成本和高(gao)門檻,也是過去我們遇到(dao)的(de)AI產業化沒有達(da)到(dao)多數人預期的(de)背后,很重要的(de)原(yuan)因所在。
超大規模預訓(xun)練模型出現(xian)之后,整(zheng)個(ge)生(sheng)產范(fan)式發生(sheng)了完(wan)全的(de)改變,從AI原生(sheng)的(de)基礎設施,包(bao)括硬件(jian)、計算機的(de)體系結構、數據的(de)組(zu)織結構、資源的(de)組(zu)織結構,甚至(zhi)包(bao)括基礎軟(ruan)件(jian)。
在這之(zhi)前(qian),支撐(cheng)一個可能是(shi)更(geng)高成(cheng)本,但是(shi)通用(yong)泛化能力更(geng)好(hao)的(de)基礎模型(xing)可以(yi)進行橫向(xiang)閉環,可以(yi)通過更(geng)低(di)成(cheng)本、更(geng)低(di)門檻的(de)嵌入去(qu)加(jia)速整(zheng)個應用(yong)邏輯。因為今天做很多C端應用(yong),天然數據閉環更(geng)好(hao),形成(cheng)一個更(geng)好(hao)的(de)飛輪效應。
這(zhe)中間最重要(yao)的,還不是來自于(yu)對應(ying)用場(chang)景成本(ben)的下(xia)降(jiang),而是應(ying)用場(chang)景門檻的下(xia)降(jiang)。
三、被改變的不僅是互聯網應用,還有企業服務
過去(qu)做AI應用(yong),很多時候(hou),首先你(ni)需要(yao)一個懂行業(ye)(ye)(ye)的(de)(de)(de)人,知道這個技術工具到底怎(zen)么(me)樣(yang)解決(jue)行業(ye)(ye)(ye)的(de)(de)(de)問(wen)題、去(qu)解決(jue)行業(ye)(ye)(ye)的(de)(de)(de)什么(me)問(wen)題,以及解決(jue)問(wen)題之后企業(ye)(ye)(ye)自身的(de)(de)(de)發展(zhan)、商(shang)業(ye)(ye)(ye)模式(shi)該(gai)怎(zen)么(me)設計,需要(yao)你(ni)去(qu)理解所服務(wu)的(de)(de)(de)行業(ye)(ye)(ye)、你(ni)所服務(wu)的(de)(de)(de)客戶(hu)。同(tong)時,用(yong)好這個工具,你(ni)又(you)需要(yao)非常(chang)專業(ye)(ye)(ye)的(de)(de)(de)人才(cai)、資源、能(neng)力,幫助(zhu)你(ni)做算(suan)法迭代(dai)、技術的(de)(de)(de)提升。
你可能很(hen)幸運,找到懂(dong)行業的(de)創始人(ren)、懂(dong)技術的(de)合伙人(ren),但是接下來(lai)你就會發(fa)現,兩個(ge)人(ren)去溝通時,大家有很(hen)多底層(ceng)的(de)常識不一(yi)樣,非常難(nan)在(zai)一(yi)個(ge)人(ren)身上同時具備專業的(de)人(ren)工智能技術能力和深(shen)厚的(de)行業經驗和積累。
但(dan)是(shi),今天這一(yi)切(qie)事情(qing)不(bu)太需要了。我們今天去做(zuo)一(yi)個(ge)場景(jing)化的(de)應用(yong)、場景(jing)化的(de)服(fu)(fu)務(wu),對AI的(de)學習門檻(jian)做(zuo)大幅下降,不(bu)再需要去學習那么復雜(za)的(de)完(wan)整的(de)模型(xing)(xing)訓(xun)練,不(bu)需用(yong)讀論文,可能接入(ru)第三(san)方的(de)大模型(xing)(xing)服(fu)(fu)務(wu),結合一(yi)些領(ling)域(yu)數據(ju)和(he)領(ling)域(yu)Know-how做(zuo)一(yi)些微調和(he)人(ren)工干(gan)預,就可以快(kuai)速實(shi)現場景(jing)應用(yong)的(de)閉環。
這(zhe)會(hui)帶(dai)(dai)來整個(ge)產業或(huo)技(ji)術(shu)革新(xin)(xin)模(mo)式(shi)的(de)改(gai)變(bian),技(ji)術(shu)迭代(dai)方式(shi)發生核心轉(zhuan)變(bian)之后(hou),對于(yu)很多人做創業、做新(xin)(xin)的(de)應用,做企業服務,在(zai)商業模(mo)式(shi)上也會(hui)帶(dai)(dai)來大(da)量的(de)改(gai)變(bian)。
而且因為這個(ge)過程中(zhong)(zhong)需要更大(da)規模更低成本(ben)的基礎設(she)施來(lai)提供(gong)服務,這一(yi)定是軍(jun)備競賽巨頭級的游戲。同(tong)時,在場景應(ying)用設(she)計中(zhong)(zhong)會更加關(guan)注數據閉環、數據飛輪和數據積累,它會帶來(lai)整個(ge)產業和應(ying)用非(fei)常大(da)的改變(bian)。
很(hen)多人說有了(le)這樣一個(ge)新(xin)的(de)技術浪(lang)潮之后,整個(ge)人工智能(neng)的(de)所有互聯(lian)網應用會被全(quan)部(bu)重(zhong)做(zuo)一遍。
在我(wo)們(men)看來,(被改(gai)變的(de))不僅(jin)僅(jin)是互聯網(wang)應用,還有今(jin)天的(de)企業服(fu)務。過去在行業中,推動產業數字化(hua)之后下一(yi)步的(de)智(zhi)能化(hua)過程中,我(wo)們(men)所遇到的(de)一(yi)些困難,因(yin)為這(zhe)樣的(de)一(yi)些新技術突破(po),門檻會被極大降低,會有更多人(ren)會參與(yu)到整個過程中來,to B也會發生(sheng)很大的(de)改(gai)變。
這一切依(yi)賴的(de)基礎,叫作人(ren)工智能的(de)基礎設施。
四、把大算力、大模型、大數據構建成基礎服務
什么叫(jiao)人工智能的基礎(chu)設施(shi)?
我們經常講智能時代(dai)的(de)基(ji)(ji)礎設施,大(da)算力(li)(li)、大(da)模(mo)型(xing)、大(da)數(shu)據(ju),實際(ji)上就是怎么樣(yang)把(ba)這樣(yang)一些(xie)核心(xin)的(de)基(ji)(ji)礎性底(di)層(ceng)能力(li)(li)構建出(chu)更加(jia)規模(mo)化、更加(jia)高效率、更加(jia)低(di)成本的(de)基(ji)(ji)礎供應,這中間(jian)包括物理環境設施,包括AI原生為AI設計的(de)基(ji)(ji)礎底(di)層(ceng)軟件(jian),包括AI的(de)核心(xin)一整套(tao)工具(ju)體(ti)系,以(yi)及架設于(yu)之上的(de)模(mo)型(xing)服(fu)務,用(yong)它更好(hao)地去服(fu)務支持到每個行(xing)業未來的(de)應用(yong)迭代(dai)和發展。
這是(shi)商湯從2019年(nian)開始(shi)去迭代、去年(nian)正式對外發(fa)(fa)布(bu)的(de)大(da)(da)(da)裝(zhuang)置SenseCore。今天做科(ke)學研究(jiu)很(hen)多時候(hou)用到科(ke)學大(da)(da)(da)裝(zhuang)置,它的(de)特點就是(shi)投資(zi)巨大(da)(da)(da),規模(mo)也很(hen)大(da)(da)(da),當你(ni)要(yao)突破一(yi)(yi)些科(ke)學前沿的(de)時候(hou),一(yi)(yi)定需要(yao)大(da)(da)(da)規模(mo)的(de)基礎設施,才(cai)能真正解決問題(ti),這是(shi)我們對于人工智(zhi)能基礎設施未來發(fa)(fa)展方向(xiang)的(de)理解。我們今天把這樣一(yi)(yi)種能力作為一(yi)(yi)個開放的(de)服務,提供給行業中(zhong)的(de)伙伴、客戶和(he)兄弟姐(jie)妹。
商湯(tang)AIDC是(shi)2020年上海市(shi)第一個人(ren)工智能(neng)新基建項(xiang)目,是(shi)全亞洲目前為止最大的人(ren)工智能(neng)專用(yong)基礎(chu)設(she)施、專用(yong)的人(ren)工智能(neng)計算(suan)中心(xin)之一,有將近(jin)5000P的算(suan)力(li)。通過這樣的一個算(suan)力(li),我們提(ti)供完(wan)整(zheng)的AI基礎(chu)設(she)施資(zi)源的能(neng)力(li)。
除了(le)基(ji)礎的(de)(de)資源規模(mo)和量以外,商湯一直以來(lai)作為(wei)一個以算法應用(yong)(yong)為(wei)核心的(de)(de)企業(ye),在(zai)過去發展的(de)(de)十(shi)年間(jian)積(ji)累(lei)了(le)大量AI原生(sheng)(sheng)的(de)(de)從算法框架(jia)到(dao)開(kai)源模(mo)型的(de)(de)能(neng)力,我們今天在(zai)做的(de)(de)事情是把這(zhe)樣的(de)(de)能(neng)力整合,提供一整套AI原生(sheng)(sheng)從資源到(dao)硬件(jian)到(dao)軟件(jian)到(dao)體系化服務的(de)(de)能(neng)力,通過自(zi)動(dong)化的(de)(de)工具,幫助更好地訓練和使用(yong)(yong)大模(mo)型。
當我們(men)講到(dao)大模型,很多人在關注(zhu)算(suan)(suan)力。除了算(suan)(suan)力還(huan)有(you)數據(ju),今天(tian)所(suo)有(you)人都在講數據(ju)來源,除了把這些數據(ju)爬下(xia)來,大模型能替代標注(zhu)很多數據(ju)外,數據(ju)如何做有(you)效處(chu)理、有(you)效管理仍是(shi)問(wen)(wen)題(ti)(ti)。只做自然(ran)語言還(huan)好一(yi)(yi)點,你可以(yi)用大的(de)文件去存。下(xia)一(yi)(yi)步我們(men)做多模態(tai),首先(xian)遇到(dao)一(yi)(yi)個(ge)問(wen)(wen)題(ti)(ti)——圖像、視(shi)頻(pin)是(shi)海量的(de)小(xiao)文件,今天(tian)有(you)沒(mei)有(you)足夠好的(de)文件管理系統去支持百億量級的(de)文件,能夠在一(yi)(yi)個(ge)AI訓(xun)練(lian)任務上快速(su)地訪問(wen)(wen)和調(diao)用,這些都是(shi)從我們(men)去看待一(yi)(yi)個(ge)AI大規模訓(xun)練(lian)所(suo)面臨的(de)大量原(yuan)生(sheng)問(wen)(wen)題(ti)(ti)。
我們不僅提(ti)供(gong)硬件(jian)、軟件(jian),還提(ti)供(gong)一些專業的專家(jia)支持服務(wu)(wu),這種(zhong)服務(wu)(wu)涵蓋(gai)了(le)今(jin)天(tian)做一些大模(mo)(mo)(mo)型訓練、推理、優化。訓練一個(ge)(ge)(ge)大模(mo)(mo)(mo)型,這個(ge)(ge)(ge)大模(mo)(mo)(mo)型如果要(yao)提(ti)供(gong)一個(ge)(ge)(ge)應用服務(wu)(wu),成本會(hui)很高昂,模(mo)(mo)(mo)型做好后有(you)沒有(you)辦法做快(kuai)速蒸餾、快(kuai)速剪(jian)枝,變(bian)成一個(ge)(ge)(ge)可(ke)以讓下(xia)游更低成本使用的商業化產品。對此商湯提(ti)供(gong)了(le)一整套的解決方案去(qu)服務(wu)(wu)今(jin)天(tian)有(you)志于參與到人工智能2.0新(xin)浪潮中的朋友們。今(jin)天(tian)的嘉賓里有(you)好幾家(jia)是我們的客戶,我們現在(zai)正在(zai)服務(wu)(wu)他們,幫助他們去(qu)訓練自己(ji)的大模(mo)(mo)(mo)型。
最后有(you)一些例子,很多(duo)是視覺和AI for Sicence。我們今天看(kan)到基于(yu)基模型,基于(yu)預訓練的(de)體系(xi),它在不同的(de)細分領域中已經越來越多(duo)越來越快地能夠在行業(ye)中產生(sheng)應用(yong),產生(sheng)實(shi)際(ji)價值。
我們相信通(tong)過這(zhe)樣的一(yi)些趨(qu)勢:未(wei)來以人工智(zhi)能泛化(hua)性(xing)、通(tong)用性(xing)為目標的大規模(mo)(mo)預訓練模(mo)(mo)型,把(ba)它作為一(yi)種服(fu)(fu)務,用它為算力(li)、數據、算法在內的一(yi)體化(hua)基礎(chu)設施(shi)能力(li),服(fu)(fu)務到更廣闊的不管to B場(chang)景應(ying)用海量市場(chang)還是C端互聯網全(quan)部(bu)被重(zhong)做(zuo)一(yi)遍的用戶生態,這(zhe)一(yi)定是未(wei)來的核(he)心(xin)趨(qu)勢。
而在這個過程中(zhong),商湯對(dui)自己有(you)一個的定位(wei),用(yong)一句話來講:“訓AI大(da)模型,用(yong)商湯大(da)裝置。”歡迎在這方面有(you)興趣的朋友同仁跟我們做交流(liu)。
以上是我的(de)分享,謝謝!
以上是楊帆演講內容的完整整理。