智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣

智東西7月7日東莞報道,在今日啟動的華為開發者大會2023(Cloud)上,華為常務董事、華為云CEO張平安宣布推出盤古大模型3.0,從通用大(da)模(mo)型(xing)(xing)(xing)、行業大(da)模(mo)型(xing)(xing)(xing)及場景模(mo)型(xing)(xing)(xing)“L0~L2”三(san)個層面為行業提供大(da)模(mo)型(xing)(xing)(xing)服務。

盤古3.0提供100億參數、380億參數、710億參數和1000億參數的系列化基礎大模型,預訓練數據中包含了超3萬億tokens,推出了(le)NLP大模(mo)型的(de)知識問答、文案生(sheng)成、代(dai)碼生(sheng)成,以(yi)及多模(mo)態大模(mo)型的(de)圖(tu)像生(sheng)成、圖(tu)像理解等全新(xin)能力(li)集。

同日,華為云昇騰AI云服務在烏蘭察布和貴安上線。張平安稱,昇(sheng)騰AI云服(fu)務可(ke)提供(gong)更(geng)長(chang)(chang)穩(wen)的AI算力(li)服(fu)務,千卡(ka)訓(xun)練30天(tian)長(chang)(chang)穩(wen)率達到90%,斷點恢(hui)復時長(chang)(chang)不超過10分鐘。昇(sheng)騰AI云服(fu)務支持華為(wei)MindSpore以及(ji)PyTorch、TensorFlow等(deng)主流AI框(kuang)架,支持便捷(jie)遷移。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲華為云推出昇騰AI云服務

隨(sui)著ChatGPT在(zai)全球(qiu)(qiu)爆火,當(dang)下(xia)全球(qiu)(qiu)已(yi)發布上(shang)百個(ge)大(da)模型,中國內(nei)已(yi)有80多個(ge)大(da)模型發布。華(hua)為云于(yu)2020年就(jiu)啟動盤(pan)古大(da)模型立(li)項,2021年4月推出(chu)盤(pan)古系列大(da)模型,包(bao)括業界首個(ge)千億參數中文(wen)語(yu)言預訓練(lian)模型,并在(zai)當(dang)時就(jiu)現(xian)場(chang)演示了對話機器人(ren)。然而,華(hua)為今年上(shang)半年卻一(yi)直隱而不發,引(yin)起產(chan)業的(de)關注。

為何(he)華為云今年(nian)上半年(nian)一直沒有(you)消息?

張平安(an)現(xian)場首先正面回(hui)答了這一(yi)問題(ti)。他說,華為(wei)(wei)盤(pan)(pan)古大(da)模型“不寫詩,只做事”,華為(wei)(wei)的理念是AI for Industry(AI賦能產業(ye)),因此要將盤(pan)(pan)古大(da)模型致力(li)于(yu)深耕(geng)各個行業(ye)。盤(pan)(pan)古大(da)模型在礦業(ye)、鐵路(lu)、氣象、金融、政務、制造、軟件開(kai)發(fa)、數(shu)字內容生成等多個領域的落地成果在現(xian)場得(de)以展示。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲華為(wei)云(yun)團(tuan)隊現場演示政務大模型用于圖文結合問(wen)答(da)

現場,智東西與(yu)部分媒(mei)體對張平安等(deng)華為高(gao)管進行了采訪。

當被問及華為云做大模型的差異化競爭力時,張平安尤其強調行業結合:“我們的科(ke)學(xue)家(jia)、數學(xue)家(jia)可以下到(dao)礦井、蹲(dun)車庫、下田頭,因此盤(pan)(pan)古真(zhen)的是和行(xing)業(ye)的痛點(dian)深度結(jie)合(he)而來,這(zhe)是華為盤(pan)(pan)古大(da)模(mo)型(xing)最(zui)大(da)的優勢。”就在昨日,國際頂級學(xue)術(shu)期(qi)刊《自然(ran)》(Nature)登載(zai)了(le)華為云盤(pan)(pan)古氣象大(da)模(mo)型(xing)成果,與張平安的闡述形成呼應。

一、盤古3.0面世:NLP、多模態新升級,模型服務“開箱即用”

張平安說(shuo):“希望盤(pan)古(gu)大模(mo)型成(cheng)為每個行業、企業和個人的(de)(de)專家(jia)助(zhu)手,讓工作更(geng)輕松。”盤(pan)古(gu)大模(mo)型3.0是一個面(mian)向行業的(de)(de)大模(mo)型系(xi)列,簡單來說(shuo),主要(yao)通過以下“5+N+X”三層架構(gou),在不同層面(mian),構(gou)建不同的(de)(de)能(neng)力。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲盤古大模型3.0的“5+N+X”三層(ceng)架構

1、L0基礎模型層:提供五大模型服務,NLP、多模態模型大升級

首(shou)先是(shi)L0基(ji)礎(chu)模型(xing)層,包括自然語言處理(NLP)、視(shi)覺(CV)、多模態、預測(ce)、科學計(ji)算(suan)五個基(ji)礎(chu)大模型(xing),提供滿足行業場景(jing)中的(de)多種技能需求。

具體來說(shuo),盤古3.0為(wei)客(ke)戶(hu)(hu)提供100億(yi)(yi)參(can)(can)數(shu)(shu)(shu)、380億(yi)(yi)參(can)(can)數(shu)(shu)(shu)、710億(yi)(yi)參(can)(can)數(shu)(shu)(shu)和1000億(yi)(yi)參(can)(can)數(shu)(shu)(shu)的系列化基礎大模(mo)型,匹配客(ke)戶(hu)(hu)不同(tong)場(chang)景(jing)、不同(tong)時(shi)延、不同(tong)響應速度(du)的行業多樣化需(xu)求(qiu)。

同時,盤古3.0提(ti)供全新能(neng)(neng)力集,包括NLP大(da)(da)模(mo)型(xing)(xing)的(de)知識問答、文案生成、代碼生成,以及多模(mo)態大(da)(da)模(mo)型(xing)(xing)的(de)圖像生成、圖像理解等(deng)能(neng)(neng)力,這(zhe)些技能(neng)(neng)都(dou)可以供客(ke)戶(hu)和伙伴(ban)企業直(zhi)接調用(yong)。張平安說,無論多大(da)(da)參數規模(mo)的(de)大(da)(da)模(mo)型(xing)(xing),盤古提(ti)供一致的(de)能(neng)(neng)力集。

重磅!登Nature正刊后,華為云盤古大模型3.0來了

▲盤古L0基(ji)礎(chu)大模型(xing)層架(jia)構圖

盤古大模型3.0的預訓練數(shu)據(ju)中包含(han)了超(chao)過3萬億tokens,使用超(chao)1000+TB數(shu)據(ju)訓練,指令微(wei)調數(shu)據(ju)達千萬級,因此也(ye)可(ke)以稱之為“讀(du)萬卷書”。

2、L1行業大模型層:行業通用大模型+客戶專有大模型,“行萬里路”

然(ran)后(hou)是L1層行(xing)業(ye)大模型。如果說最底(di)層的基礎(chu)(chu)模型是做(zuo)好海量(liang)基礎(chu)(chu)知識(shi)的學習,相當(dang)于(yu)“讀萬卷書(shu)”,打(da)好基礎(chu)(chu);那么行(xing)業(ye)大模型、場景模型就相當(dang)于(yu)“行(xing)萬里路”。

在L0基礎大(da)模(mo)(mo)型之上,針對不同行業(ye)和場景,客戶可(ke)基于盤古(gu)3.0進行專項知識(shi)和經驗的訓練。一方(fang)面,L1層提(ti)供(gong)使(shi)用行業(ye)公開數(shu)據訓練的行業(ye)通用大(da)模(mo)(mo)型,包括政(zheng)務、金融、制造、礦山(shan)、氣象等大(da)模(mo)(mo)型;另一方(fang)面,客戶也可(ke)以基于自有數(shu)據,在盤古(gu)大(da)模(mo)(mo)型的L0和L1層上訓練自己的專有大(da)模(mo)(mo)型。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲盤古L1行業大模型(xing)層(ceng)架構圖

3、L2場景大模型層:專注細分場景,“開箱即用”

最后是L2場(chang)景大模型層。張平(ping)安說(shuo),華為云為客(ke)戶(hu)提供了更(geng)多細化(hua)場(chang)景的模型,更(geng)加專注于政務熱線、網點助手、先導藥(yao)物篩選(xuan)、傳(chuan)送帶異物檢(jian)測(ce)(ce)、臺風路徑預測(ce)(ce)等(deng)具體行業(ye)應(ying)用(yong)(yong)或特(te)定業(ye)務場(chang)景,為客(ke)戶(hu)提供“開箱即用(yong)(yong)”的模型服務。

張平安談道,盤古大模型采用完全的分層解耦設計,可以快速適配、快速滿足行業的多變需求。客戶既可以為自己的大模型加載獨立的數據集,也可以單獨升級基礎模型,也可以單獨升級能力集。

在L0和L1大模型的基礎上,華為云還為客戶提供了大模型行業開發套件,通(tong)過對客(ke)戶自有數(shu)據的二次訓練,客(ke)戶就可以擁有自己的專屬行業(ye)大(da)模(mo)(mo)型。同時,根據客(ke)戶不同的數(shu)據安全與(yu)合規(gui)訴求,盤古大(da)模(mo)(mo)型還提供了公用云、大(da)模(mo)(mo)型云專區(qu)、混合云多樣化的部(bu)署(shu)形態。

此外,華為云2000P Flops單集群的昇騰AI云服務在烏蘭察布和貴安同時上線。

據張平安稱,昇騰AI云服(fu)務可提供(gong)更長(chang)穩的(de)AI算力服(fu)務,千卡訓(xun)練(lian)30天長(chang)穩率(lv)達到(dao)90%,斷點恢(hui)復時長(chang)不(bu)超過10分(fen)鐘(zhong)。昇騰云服(fu)務除了支持華為(wei)的(de)AI框(kuang)架MindSpore外,還(huan)支持PyTorch、TensorFlow等主流(liu)AI框(kuang)架,框(kuang)架中的(de)90%算子,都可以通過華為(wei)的(de)遷移工具(ju)從(cong)GPU平滑遷移到(dao)昇騰。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲張平(ping)安(an):盤(pan)古大模型3.0采用全棧自研技術

二、氣象大模型登Nature正刊,盤古發力行業“不作詩 只做事”

“盤古為行(xing)業而生,就要為行(xing)業著想,更好(hao)地服務千行(xing)百(bai)業的客戶。”張平安(an)說。

7月5日,國(guo)(guo)際(ji)頂刊Nature登載了華(hua)(hua)為(wei)云盤古氣象大模型(xing)(xing)(xing)研(yan)發團隊(dui)研(yan)究成果,成為(wei)近年來首篇以中國(guo)(guo)科(ke)技(ji)公司為(wei)唯一署名單(dan)位發表的(de)Nature正(zheng)刊論文。審(shen)(shen)稿(gao)人高度評價該模型(xing)(xing)(xing):“華(hua)(hua)為(wei)云盤古氣象大模型(xing)(xing)(xing)讓人們開始重新審(shen)(shen)視(shi)氣象預(yu)報模型(xing)(xing)(xing)的(de)未來,模型(xing)(xing)(xing)的(de)開放(fang)將(jiang)推動(dong)該領域的(de)發展(zhan)。”

本次,張平安談及這一(yi)成果的(de)(de)行(xing)業落(luo)地(di)情況。作為(wei)首個精度(du)超過傳統數值預(yu)(yu)報方法的(de)(de)AI預(yu)(yu)測(ce)模(mo)型,盤(pan)古(gu)氣象(xiang)大模(mo)型的(de)(de)預(yu)(yu)測(ce)速度(du)也有(you)大幅提升(sheng)。原來預(yu)(yu)測(ce)一(yi)個臺風未來10天的(de)(de)路(lu)徑,需要在3000臺服務(wu)器(qi)的(de)(de)高性(xing)能(neng)計算機集群上花費5小(xiao)時進行(xing)仿真(zhen)。現在基于預(yu)(yu)訓練的(de)(de)盤(pan)古(gu)氣象(xiang)大模(mo)型,通過AI推(tui)理的(de)(de)方式,研(yan)究者只(zhi)需單(dan)臺服務(wu)器(qi)上單(dan)卡配置,10秒內就可以獲得更精確的(de)(de)預(yu)(yu)測(ce)結(jie)果。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲盤古氣(qi)象(xiang)大(da)模型落地全(quan)球多地

除了(le)氣象大(da)模型成果,張平安(an)還(huan)在現場展(zhan)示了(le)盤(pan)古大(da)模型在政(zheng)務、煤(mei)礦、金融、制造、醫(yi)藥(yao)研發(fa)、鐵路等諸多行業(ye)發(fa)揮的(de)價值(zhi)。

比(bi)如在政(zheng)(zheng)務(wu)領域(yu),華為云攜手深圳市福(fu)田(tian)區政(zheng)(zheng)務(wu)服務(wu)數(shu)據(ju)(ju)管理(li)局,上線了(le)基于(yu)盤古政(zheng)(zheng)務(wu)大模(mo)(mo)型(xing)(xing)的福(fu)田(tian)政(zheng)(zheng)務(wu)智慧助手小福(fu),能(neng)夠精準理(li)解(jie)民眾咨詢意圖,改變傳統的一網通辦(ban)模(mo)(mo)式。據(ju)(ju)稱(cheng),盤古政(zheng)(zheng)務(wu)大模(mo)(mo)型(xing)(xing)對超過20萬(wan)條政(zheng)(zheng)務(wu)數(shu)據(ju)(ju)進行精調,包括12345熱線、政(zheng)(zheng)策文件、政(zheng)(zheng)務(wu)百科等(deng)(deng),掌(zhang)握了(le)豐(feng)富的法(fa)律法(fa)規、辦(ban)事流(liu)程等(deng)(deng)行業知識。

在(zai)(zai)煤(mei)礦(kuang)領域,盤古礦(kuang)山大(da)(da)模(mo)(mo)型(xing)已經在(zai)(zai)全(quan)國8個礦(kuang)井規模(mo)(mo)使用,一個大(da)(da)模(mo)(mo)型(xing)可以覆蓋煤(mei)礦(kuang)的采、掘、機、運、通(tong)、洗選等業(ye)務(wu)流程下(xia)的1000多(duo)個細分(fen)場(chang)景,讓更(geng)多(duo)的煤(mei)礦(kuang)工人能夠(gou)在(zai)(zai)地(di)面(mian)上作業(ye),不僅能讓煤(mei)礦(kuang)工人的工作環境更(geng)加舒適,而(er)且可以極大(da)(da)地(di)減少安全(quan)事故。

重磅!登Nature正刊后,華為云盤古大模型3.0來了▲盤古礦山大模型已在(zai)8個礦井復制使用(yong)

在鐵路領(ling)域,盤(pan)古鐵路大模型能精準識別現網運(yun)行的(de)67種貨車(che)、超430種故障,無故障圖(tu)片篩除率高達95%,成為貨運(yun)列檢(jian)員身邊(bian)有力的(de)數字助手,將列檢(jian)員從(cong)每日數百萬張的(de)“圖(tu)海”檢(jian)測(ce)中解(jie)放出來。

在(zai)金融領域(yu),盤古金融大(da)模型可以對(dui)銀行的(de)(de)各種(zhong)操作(zuo)、政策、案例文檔進行預(yu)訓練,能根據(ju)客戶的(de)(de)問題,為(wei)柜臺工作(zuo)人員自動生成流程和(he)操作(zuo)指導,將原(yuan)來(lai)需要平(ping)均5次的(de)(de)操作(zuo)降低為(wei)1次,辦結時間縮短5分鐘以上。盤古大(da)模型讓數十萬網點柜員都擁有(you)自己的(de)(de)智慧助手。

在制造領域,過去單產線制定器(qi)件分配計劃,往(wang)往(wang)要花費3個小時(shi)以(yi)上才能做(zuo)齊1天(tian)的生產計劃。盤(pan)古制造大模型(xing)學習(xi)了華為產線上各種器(qi)件數據(ju)、業務流程(cheng)及規則以(yi)后(hou),能夠對(dui)業務需(xu)求進(jin)行準確的意圖(tu)理(li)解,并調用(yong)天(tian)籌AI求解器(qi)插件,1分鐘即可做(zuo)出未來3天(tian)的生產計劃。

重磅!登Nature正刊后,華為云盤古大模型3.0來了
▲盤古大模(mo)型(xing)助(zhu)力(li)制造業(ye)降本增效(xiao)

在(zai)藥物研(yan)(yan)發(fa)領域,原來一款新(xin)藥研(yan)(yan)發(fa)平均需(xu)要10年時間(jian)、花費10億美金。盤(pan)古藥物分子大模型助力(li)西安交(jiao)通(tong)大學第一附屬醫院劉冰教授團(tuan)隊發(fa)現(xian)全球40年來首個(ge)新(xin)靶點、新(xin)類別(bie)的抗生素,并將(jiang)先導藥物研(yan)(yan)發(fa)周(zhou)期縮短至(zhi)1個(ge)月、研(yan)(yan)發(fa)成本降(jiang)低70%。

張平安(an)說:“我們始終(zhong)堅持(chi)AI for Industries的戰略,在(zai)深耕行(xing)(xing)業的道(dao)路上不斷前行(xing)(xing)。我堅信大(da)模型將重塑千行(xing)(xing)百業,而每(mei)一個(ge)開發者,都將是改變世界的英雄。”

結語:深耕行業,國內大模型走深向實

回顧華為盤古(gu)(gu)大(da)模(mo)型(xing)(xing)的(de)(de)發展歷程,其(qi)在(zai)2021年就(jiu)推出(chu)了(le)NLP、CV、科(ke)學(xue)計(ji)算(suan)、多(duo)模(mo)態(tai)等基(ji)礎大(da)模(mo)型(xing)(xing);于2022年4月(yue)推出(chu)盤古(gu)(gu)2.0,而(er)后陸(lu)續發布了(le)盤古(gu)(gu)氣象大(da)模(mo)型(xing)(xing)、盤古(gu)(gu)海浪大(da)模(mo)型(xing)(xing)、盤古(gu)(gu)金融OCR大(da)模(mo)型(xing)(xing)、盤古(gu)(gu)礦山大(da)模(mo)型(xing)(xing)等行業大(da)模(mo)型(xing)(xing)。今日,隨著盤古(gu)(gu)3.0的(de)(de)推出(chu),其(qi)有(you)望進一步推動大(da)模(mo)型(xing)(xing)在(zai)行業真正(zheng)走深(shen)向實,我們有(you)望看(kan)到大(da)模(mo)型(xing)(xing)落地行業的(de)(de)進程大(da)大(da)加快(kuai)。

一(yi)(yi)手抓算力(li)底(di)座,一(yi)(yi)邊加速大(da)(da)(da)模(mo)型(xing)(xing)落地行(xing)業。可以(yi)看到,在(zai)(zai)(zai)當下“百(bai)模(mo)大(da)(da)(da)戰”的(de)(de)背景下,華(hua)為盤古(gu)大(da)(da)(da)模(mo)型(xing)(xing)走出了(le)一(yi)(yi)條相對差異化的(de)(de)道路(lu)。很多人都在(zai)(zai)(zai)問(wen)國內(nei)大(da)(da)(da)模(mo)型(xing)(xing)與ChatGPT的(de)(de)差距有多大(da)(da)(da),但實際上Chat(聊(liao)天)僅(jin)僅(jin)是大(da)(da)(da)模(mo)型(xing)(xing)的(de)(de)一(yi)(yi)個很小的(de)(de)能力(li),當下ChatGPT的(de)(de)訪問(wen)量也在(zai)(zai)(zai)減(jian)少,以(yi)OpenAI為代表的(de)(de)公司下一(yi)(yi)步也需要在(zai)(zai)(zai)千行(xing)百(bai)業中(zhong)探索大(da)(da)(da)模(mo)型(xing)(xing)落地的(de)(de)真(zhen)實剛需。當AI大(da)(da)(da)模(mo)型(xing)(xing)落地進入(ru)深水(shui)區(qu),或(huo)許在(zai)(zai)(zai)行(xing)業落地跑在(zai)(zai)(zai)前面的(de)(de)玩家更容易脫穎而出。