智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣

智(zhi)東西4月8日杭州報道,今日,在由中國人(ren)工智(zhi)能(neng)(neng)學會(hui)主(zhu)辦的(de)人(ren)工智(zhi)能(neng)(neng)大(da)模型(xing)技術高(gao)峰論壇(tan)上,華(hua)為云AI領域(yu)首(shou)席科(ke)學家、國際歐亞科(ke)學院院士(shi)田奇出席現場,對華(hua)為盤古系列大(da)模型(xing)的(de)研發(fa)與應用落地情(qing)況進(jin)行(xing)了分享。

在論壇上,田奇談道,華為在2021年就立項盤古大(da)模(mo)(mo)(mo)(mo)型,目前在CV大(da)模(mo)(mo)(mo)(mo)型、NLP大(da)模(mo)(mo)(mo)(mo)型、科學計算大(da)模(mo)(mo)(mo)(mo)型等領域都有(you)技術和落地案例。他提出(chu)了一種(zhong)將大(da)模(mo)(mo)(mo)(mo)型像自動駕駛一樣劃分為“L0~L2”不同階段的方(fang)式(shi),并(bing)稱(cheng)大(da)模(mo)(mo)(mo)(mo)型已成為應對AI應用碎片化的一種(zhong)方(fang)式(shi),將導致市場向大(da)公司集(ji)中,產業規則及(ji)格局也可能隨(sui)之改變。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

在備受行(xing)業關注的NLP大模型(xing)方(fang)面,田(tian)奇談(tan)及了盤古NLP大模型(xing)目前覆蓋的智(zhi)(zhi)能(neng)文檔(dang)檢索、智(zhi)(zhi)能(neng)ERP、小語種大模型(xing)等落地領(ling)域,比(bi)如2022年剛交(jiao)付(fu)了一(yi)個(ge)阿拉(la)伯(bo)語的千億參數大模型(xing)。

一、大模型成確定趨勢,分L0~L2三個層級

AI正加速進入千(qian)行百業,田奇公布了一(yi)組數(shu)據:華為云(yun)過去幾年的AI項目已(yi)超100個,其中(zhong)30%已(yi)滲(shen)入核心生產系(xi)統,助客戶盈利能力平均提升10%。現在隨著(zhu)AI迎來一(yi)波(bo)新浪潮,AI的滲(shen)透速度會大大增(zeng)快。

田奇稱(cheng),華為云在2020年就預判(pan)AI發展(zhan)有(you)以下兩大趨勢(shi):

一(yi)是AI會從傳(chuan)統小模(mo)型發(fa)展到(dao)大(da)模(mo)型的趨勢(shi),對(dui)應算(suan)力需(xu)求過去十年里增加了40萬(wan)倍(bei)。大(da)模(mo)型成(cheng)為應對(dui)AI應用碎(sui)片(pian)化的一(yi)種方式,可能收編高(gao)度定制化的小模(mo)型,導(dao)致市場(chang)向大(da)公司集(ji)中,產業規(gui)則集(ji)格局也(ye)可能改變。

二是AI for Science(AI賦能(neng)科(ke)研),AI與科(ke)學計(ji)算交匯。包括傳統的氣(qi)象、海洋、農業、地球科(ke)學、航(hang)空航(hang)天等領(ling)域開始(shi)從偏微分方(fang)程的方(fang)法拓展到AI方(fang)法,在這(zhe)一領(ling)域華為云推出了(le)氣(qi)象、藥物分子領(ling)域的多個行業大模型。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

田奇(qi)說,大模(mo)(mo)型(xing)是對各行(xing)各業產(chan)業賦能(neng)的一個重要樞紐,華為把(ba)大模(mo)(mo)型(xing)賦能(neng)千行(xing)百(bai)業分成了“L0~L2”三(san)個層級,分別(bie)對應基礎通用模(mo)(mo)型(xing)、行(xing)業模(mo)(mo)型(xing)和(he)細分場景任務模(mo)(mo)型(xing)。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

二、2021年立項盤古大模型,賦能行業分三步走

田奇回(hui)顧(gu)道,過(guo)去幾(ji)年,華為(wei)主要聚焦打(da)造“盤古”系列的(de)預訓(xun)練(lian)(lian)大模(mo)型(xing)(xing)。大模(mo)型(xing)(xing)誕(dan)生分兩(liang)個階(jie)段:第一是預訓(xun)練(lian)(lian)階(jie)段,由海量(liang)數據來運行(xing)鏈(lian)路的(de)通用底座基礎模(mo)型(xing)(xing)。第二(er)是針對下(xia)游的(de)千行(xing)百業的(de)具體(ti)的(de)任務,基于行(xing)業數據進行(xing)微調。

同時大家也(ye)看到大模型為了越(yue)用越(yue)好,迭代也(ye)非常重要,如何(he)實現大模型的增量學(xue)(xue)習(xi)、終身學(xue)(xue)習(xi)、應用全生命周期迭代,非常重要。因此華為布局了第三步:大模型的迭代。

從發(fa)展關鍵節點來看(kan),華(hua)為于2021年開始立項做盤(pan)古(gu)(gu)大(da)(da)(da)模(mo)型(xing)(xing)(xing);2021年4月(yue)(yue)發(fa)布了(le)盤(pan)古(gu)(gu)NLP大(da)(da)(da)模(mo)型(xing)(xing)(xing)、盤(pan)古(gu)(gu)視覺大(da)(da)(da)模(mo)型(xing)(xing)(xing)、盤(pan)古(gu)(gu)科學計(ji)算(suan)大(da)(da)(da)模(mo)型(xing)(xing)(xing);2021年9月(yue)(yue),推出用于藥物研發(fa)細分(fen)場景的大(da)(da)(da)模(mo)型(xing)(xing)(xing);2022年,與能源集團合作發(fa)布了(le)盤(pan)古(gu)(gu)礦山大(da)(da)(da)模(mo)型(xing)(xing)(xing)、盤(pan)古(gu)(gu)氣(qi)象大(da)(da)(da)模(mo)型(xing)(xing)(xing)、盤(pan)古(gu)(gu)海浪(lang)大(da)(da)(da)模(mo)型(xing)(xing)(xing)、盤(pan)古(gu)(gu)金融OCR大(da)(da)(da)模(mo)型(xing)(xing)(xing)。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

對應(ying)到華(hua)為大模型賦能千行百業的(de)層次,其基于底層一站式AI開發平臺ModelArts建立了L0基礎(chu)大模型、L1行業大模型、L2場景(jing)模型多層服務,通過系統化工程賦能行業。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

三、CV大模型落地礦山,NLP大模型落地智能文檔檢索等

田奇談道,在(zai)過去的2022年,華為盤(pan)古大模型主(zhu)要是AI for Industry(AI賦能產業),希望(wang)為煤礦、水(shui)泥(ni)、電力、金(jin)融、農業等行(xing)業創造更多產業價(jia)值(zhi),目(mu)前已(yi)有(you)多個(ge)案例。

如下圖所(suo)示,盤古CV大(da)(da)模型目前覆(fu)蓋(gai)了工業質檢、物流倉庫監控(kong)、時尚輔助設(she)計(ji)(ji)等行業;盤古NLP大(da)(da)模型覆(fu)蓋(gai)了智能文檔檢索、智能ERP、小(xiao)語種大(da)(da)模型等領域,比如去年交付(fu)了一個阿拉伯(bo)語的千億參數大(da)(da)模型;盤古科學計(ji)(ji)算大(da)(da)模型也(ye)用在了氣象預報、海浪預測等方向。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

而后,田奇(qi)展開講解了(le)幾(ji)個相關案例,覆蓋礦山(shan)大(da)模型(xing)(xing)、科學計算大(da)模型(xing)(xing)、華為氣象大(da)模型(xing)(xing)等幾(ji)個領域。

比如在與能(neng)源公司合作的盤古礦山大模(mo)型(xing)中(zhong)案例中(zhong),礦井現場是一個40米(mi)長的采(cai)掘機,寬度僅2米(mi)左右,傳統相機很難一下子捕捉到全(quan)部畫面,只能(neng)用圖中(zhong)的種九宮格(ge)視(shi)頻(pin)畫面。通過(guo)5G+AI全(quan)景(jing)視(shi)頻(pin)拼接綜采(cai)畫面卷,傳輸到地(di)(di)面,地(di)(di)面工作人員(yuan)將來可以實現地(di)(di)面控制機器(qi)進行采(cai)礦,實現礦下無人少人安全(quan)作業。

盤(pan)古礦(kuang)山大模型還用(yong)在(zai)了(le)煤(mei)礦(kuang)的(de)主運輸皮帶(dai)作(zuo)(zuo)(zuo)業(ye)監控。煤(mei)礦(kuang)被采集下(xia)來以后,它會通(tong)過一個(ge)主運輸皮帶(dai),從地(di)下(xia)傳輸到地(di)上。按傳統方法是(shi)通(tong)過工(gong)人(ren)配(pei)合作(zuo)(zuo)(zuo)業(ye),華為(wei)提出通(tong)過視頻對(dui)作(zuo)(zuo)(zuo)業(ye)的(de)安(an)全規范進行巡(xun)檢(jian),主運場景(jing)的(de)異(yi)物(wu)識(shi)(shi)別(bie)精度達98%,煤(mei)礦(kuang)作(zuo)(zuo)(zuo)業(ye)場景(jing)動(dong)作(zuo)(zuo)(zuo)識(shi)(shi)別(bie)準確率達95%,助井下(xia)安(an)全事(shi)故減(jian)少90%以上;此(ci)外大模型還能進行軌道機車缺陷(xian)檢(jian)測,比如掉鏈、脫(tuo)落、裂(lie)痕等(deng)潛在(zai)不安(an)全因(yin)素,人(ren)工(gong)檢(jian)測成本較高,盤(pan)古大模型提供圖像質(zhi)量的(de)自動(dong)評估(gu)、小樣本的(de)故障定位與識(shi)(shi)別(bie)等(deng)。

華為盤古大模型新進展,華為云AI首席科學家7000字演講精華

結語:大模型掀起AI新浪潮,大廠之戰一觸即發

當下,ChatGPT引(yin)發的(de)AI新戰場正在從國外推進到國內,AI大(da)模型成(cheng)為(wei)新的(de)大(da)廠一(yi)(yi)把手工程,不做大(da)模型的(de)大(da)廠很(hen)有可能在新一(yi)(yi)輪洗牌中掉隊。

隨(sui)著百度的(de)對(dui)話機(ji)器人文心一言、阿里的(de)通義千問紛(fen)紛(fen)推出,在開(kai)放測(ce)試中展(zhan)開(kai)激烈對(dui)打,作為另一大云廠商的(de)華為云進展(zhan)情(qing)況備受產業關注,答案或許(xu)也呼(hu)之欲出。

盡管本次(ci)田奇沒有(you)透(tou)露(lu)華(hua)為(wei)云對(dui)話機(ji)器(qi)人(ren)的(de)(de)進展,但從田奇的(de)(de)分享,我們(men)能看到華(hua)為(wei)對(dui)大(da)模型技術的(de)(de)前(qian)瞻布局和(he)重(zhong)視,作為(wei)大(da)模型細分場(chang)景(jing)應用之一的(de)(de)對(dui)話機(ji)器(qi)人(ren),應該也(ye)正在路上(shang)。