
智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣
盡(jin)管近(jin)期大模型(xing)產業打(da)得不可開交,但華(hua)為(wei)的(de)AI野(ye)心,與瘋狂的(de)價格戰(zhan)和刷榜競賽無關!
智東西6月21日東莞報道,今日,中國南方的陽光明媚熱烈,在下午開幕的華為開發者大會2024上,華為常務董事、華為云CEO張平安重磅發布盤古大模型5.0。
華為AI核彈“Harmony Intelligence(鴻蒙原生智能)”滾燙發布,呈現出華為AI“云+端”的行業獨一家打法,同時盤古5.0大模型的鼎力支持更顯耀眼。
盤古大模型5.0實現從十億級到萬億級參數版本全覆蓋,小到十億級參數的Pangu E系列,可支撐手機、PC等端側應用;大到萬億級參數的Pangu S系列,能夠幫助企業處理更為復雜的跨領域多任務。
在技術能力方面,盤古大模型5.0在全系列、多模態、強思維三大方面帶來全新升級,同時在現場具身智能機器人與真人交(jiao)互、視頻(pin)生(sheng)成及AI語音合成、模型(xing)物(wu)理世界3D生(sheng)成等應用展示一輪接著一輪。
▲現(xian)場演示基于盤古大模型5.0的具身智能機(ji)器人
但更加引起關注的是,華為云一口氣發布了盤古鋼鐵大模型、盤古高鐵大模型、盤古具身智能大模型、盤古工業設計大模型、盤古安全大模型及盤古媒體大模型六大模型,通過其特有的“行業難題死磕者”氣質,引得觀眾陣陣“遙遙領先,一直領先”呼聲。
但(dan)華為云的“殺招”遠不止如(ru)此。
在盤古5.0背后,華為云昇騰AI云服務已快速迭代一年,服務超100個業內主流大模型。同時,華為云ModelArts studio、CodeArts、DataArts、MetaStudio等多條生產線也基于盤古大模型實現升級,下一代云基礎設施CloudMatrix助力模型訓練效率提升68%,業界首創EMS彈性內存存儲正式發布,都(dou)在(zai)重塑(su)華為(wei)云服(fu)務。
此外,華為云還首次揭秘了盤古5.0誕生的背后技術,包括公布了昇騰親和的新模型架構π、MindStar技術等十幾項核心技術點,講解了其如何實現數據高效、效率高效、參數高效。
一、從10億到萬億參數全覆蓋,多模態強思維,打造“世界模型”?
張平安宣布,盤古5.0在全系列、多模態、強思維三個方面實現全新升級。而在他近40分鐘的演講中,透露華為云不僅將熱門的視覺理解與生成、復雜任務推理等高階能力升級,還多次提及模型“遵循物理規律”,隱隱透露出華為云打造“世界模型”的野心。
1、全系列:從十億級到萬億級參數,從手機到云全覆蓋
盤古大模(mo)(mo)型5.0包(bao)含不(bu)同(tong)參數規(gui)格的模(mo)(mo)型,以適配不(bu)同(tong)的業務場景。
十億級參數的Pangu E系列可支撐手機、PC等端側的智能應用;百億級參數的Pangu P系列,適用于低時延、高效率的推理場景。
千億級參數的Pangu U系列適用于處理復雜任務;萬億級參數的Pangu S系列超級大模型能夠幫助企業處理更為復雜的跨領域多任務。
2、多模態:支持10K超圖像識別,生成內容模擬物理世界
本次鴻蒙原生智能更新的小藝智能體,很多能力(li)用(yong)到(dao)了(le)盤(pan)古5.0多模(mo)態(tai)理(li)解和生成能力(li)。
盤古大模型5.0能夠更好更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態。
在圖片和視頻識別方面,盤古大模型5.0可支持10K超高分辨率。比如當被問到《清明上河圖》中趙太丞家有多少人,盤古5.0可以在占全圖1/200的畫面中,識別出細小畫面和漢字,并(bing)得出(chu)“4個人”這一正確答(da)案。
在內容生成方面,盤古大模型5.0采用業界首創的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術,聚焦自動駕駛、工業制造、建筑等多個行業場景,可生成更加符合物理規律的多模態內容。
3、強思維:思維鏈結合策略搜索,支持復雜推理
復雜邏輯推理是大模型成為行業助手的關鍵。盤古大模型5.0將思維鏈技術與策略搜索深度(du)結合,極大(da)地提(ti)升(sheng)了數學(xue)能(neng)力(li)、復雜任務規劃能(neng)力(li)以(yi)及工具(ju)調用能(neng)力(li)。但華為(wei)云今日并未公布其在各大(da)榜單中的得分情況。
二、具身智能機器人現場“活了”,推出六大行業模型
基(ji)于盤古(gu)具身智能大模型的人形機器人首次(ci)登場,現場演示了復雜任(ren)務執行。
名(ming)為“夸(kua)父”的人(ren)形機器人(ren)能夠(gou)在要(yao)求下(xia)與張平安擊掌,分辨位于它面前的與華為有關的物品,并在得知主持人(ren)口(kou)渴時,將面前桌上的水遞給了(le)口(kou)渴的主持人(ren)。
去年,張平(ping)安在發(fa)布盤(pan)古3.0時稱,華為云盤(pan)古大模型“不作詩,只(zhi)做(zuo)事”。今年,盤(pan)古5.0已經進入(ru)各(ge)行各(ge)業做(zuo)事,解決(jue)行業難題。
在工業設計領域,盤(pan)古大模(mo)型(xing)可(ke)以讓汽車的(de)造型(xing)設(she)計(ji)時間大幅縮短,助設(she)計(ji)師直接輸出成3D文(wen)件(jian);可(ke)以支持建筑師在(zai)輸入設(she)計(ji)草圖的(de)情況下,生成彩色并(bing)帶(dai)有紋理的(de)建筑群360°實景視頻。
在媒體產業,華為云推出盤古媒體大模型,通過在語音生成、視頻生成和AI翻譯三(san)方(fang)面的技術創新,重塑內容生產(chan)和應用的新模式(shi)。
盤(pan)古媒(mei)體大模型(xing)在視(shi)頻(pin)(pin)生成方(fang)面取(qu)得(de)了顯著成果,支持將實拍視(shi)頻(pin)(pin)轉換為不同風格的高(gao)清動漫,現場演(yan)(yan)示(shi)視(shi)頻(pin)(pin)中(zhong)演(yan)(yan)員的舞蹈、武打等大運動軌(gui)跡能保持一致視(shi)覺效果,角色(se)的面貌特征也(ye)保持前(qian)后(hou)一致。
在(zai)語音生(sheng)成方面,盤(pan)古大模型(xing)通過AI原(yuan)聲譯制與(yu)視頻生(sheng)成能力,實現了將(jiang)原(yuan)片譯制成不同(tong)語言的視頻,還能同(tong)步生(sheng)成新的口型(xing)。
在AI翻譯方面,華為云會議基于盤古大模型實現了升級,支持同聲傳譯,翻譯準確性高于93%,時(shi)延小于(yu)5秒(miao),解決跨語言溝通難題。參會者還基于(yu)數字人分(fen)身功(gong)能,在自(zi)己不出面的情況下,讓(rang)實時(shi)合成的數字人分(fen)身來替自(zi)己發言,講述起來流暢自(zi)然。
但真正(zheng)更令現場(chang)沸騰(teng)的(de)(de),是華為云盤古大模(mo)型還(huan)進入了更多專(zhuan)業化更強(qiang)、與生產(chan)息(xi)息(xi)相(xiang)關(guan)的(de)(de)行業。
在高鐵行業,基于盤古高鐵大模型,華為云為高鐵檢測裝上了“盤古眼”,幫巡檢工人減少了巨大的工作量。一列動車的3.2萬個故障檢測項點,本來需要4人花費2小時進行反復、細致地檢查,用盤古大模型可以自動識別準確率可達99%。
再拿鋼鐵大模型來說,寶武集團是(shi)中國最大(da)的鋼(gang)鐵(tie)集團,年鋼(gang)產量超1億噸。據稱盤古鋼(gang)鐵(tie)大(da)模(mo)型(xing)(xing)已(yi)經幫他們把(ba)大(da)模(mo)型(xing)(xing)與高爐煉鐵(tie)和熱軋鋼(gang)帶環(huan)節結合(he)了起(qi)來,通過現(xian)場學習實(shi)現(xian)實(shi)時預測最優參數,最終效率提升了數十倍。
除(chu)此之外(wai),在氣(qi)象、醫藥等其(qi)他(ta)行業,盤古(gu)大模(mo)型也已(yi)經在助力解決行業難題(ti)。死(si)磕行業的(de)打法,體現了華為云(yun)有別于很多其(qi)他(ta)大模(mo)型廠商的(de)獨特氣(qi)質。
三、昇騰AI云已服務100+大模型,免費為開發者提供一臺云主機
華為云(yun)的(de)“殺招”不止于此,盤古5.0升級背后,是華為云(yun)昇騰AI云(yun)服務的(de)一年迭代優化。
目前,華為云已經在貴安、烏蘭察布和蕪湖,構建了三大AI算力中心,支持大模型產業發(fa)展。
根據華為云官方數據:業界萬億參數模型訓練的平均無中斷時長約2.8天,昇騰AI云服務可實現40天無中斷;業界平均集群故障恢復時間約60分鐘,昇騰AI云服務可以縮短到10分鐘。同時(shi),昇騰AI云服務能(neng)將大模(mo)型的資源開通時(shi)間(jian)從月級縮短(duan)到天級,加(jia)速大模(mo)型的開發。
目前昇騰AI云服務已全面適配行業主流的100多個大模型(xing),以(yi)云服務的方式協助客戶開(kai)發(fa)、訓練、托管和應用模型(xing),打造百模千態的“黑土地(di)”。
張平安宣布,華為發布華為開發者布道師計劃,未來(lai)3年計劃發展超過3000名(ming)華為開發者布道師。
了讓開發者更好地學習和使用這些技術,華為云為每個新生態的開發者免費提供一臺云主機、一套開發工具和5GB的云存儲空間。
華為云通過全棧系統性創新結合AI重塑云服務,打造AI Native的云。
通過下一代云基礎設施CloudMatrix,華為云推動單體算力向矩陣算力發展。盤古5.0在同等NPU算力基礎上,CloudMatrix對比傳統服務器集群實現模型訓練效率提升68%。
華為云還宣布業界首創EMS彈性內存存儲正式發布。通過(guo)業界首創EMS-彈性內(nei)存(cun)存(cun)儲,華(hua)為云助企(qi)業打破AI內(nei)存(cun)墻(qiang),釋放極致算力。
四、盤古5.0技術首揭秘:三大類技術優化,推出新模型架構π
華為云首次公布揭秘盤古5.0誕生的背后技術,涉及數據高效、效率高效、參數高效三大方面。
在數據高效方面,基于兩大關鍵技術——數據合成和數據課程學習,華為(wei)云(yun)提(ti)升(sheng)數(shu)據利用(yong)率,試用(yong)優(you)質(zhi)的數(shu)據激活盤古(gu)5.0模型更多的能力。
同時,華為云推出了昇騰親和的新模型架構——π。一方(fang)面(mian)團隊基于增廣殘差連接的(de)模型(xing)增強,緩解(jie)特(te)征坍塌;另一方(fang)面(mian),基于級數激活函數的(de)非線性增強,使得模型(xing)與昇(sheng)騰架構更(geng)友好。
面對大集群訓練千億稠密大模型,技術挑戰在于大集群訓練如何提升算力利用率,華為云通過多副本并行+計算通信流水,以及大集群調度與通信優化,使得隱藏通信降低70%,通信和等待時間從30%降至10%。
在多模態上,團隊主要做了兩大關鍵技術,一是統一視覺編碼器,二是采用動態分辨率,從而(er)克服當下編碼器無法兼(jian)顧自(zi)然(ran)圖(tu)像和文檔(dang)圖(tu)表(biao)的問(wen)題。
在強思維,也就是復雜推理方面,華為云通過MindStar技術,圍繞多步生成+策略搜索兩(liang)大關鍵方法,從(cong)而(er)將模(mo)型(xing)的(de)推理能力(li)提高30分,使得(de)百億(yi)模(mo)型(xing)達到千(qian)億(yi)模(mo)型(xing)的(de)能力(li)。
五、生產線大升級,用大模型重塑華為云服務
工欲善其(qi)(qi)事,必先(xian)利其(qi)(qi)器,華為(wei)云還用(yong)大模(mo)型(xing)重塑了其(qi)(qi)多條生產線。
在模型開發方面,華為云ModelArts studio大模型即服務平臺支持便捷大模型開發與應用,通過0代碼、免配置完成模型開發與微調,通過多模型智能路由降低模型調用成本超25%,沉淀50+智能代理,賦能RPA、政務、會議等多個方面的企業內(nei)部(bu)助手。
繼去年接入大模型后,今年華為云通過結合AI Agent能力,將CodeArts軟件開發生產線從單點智能升級到項目級智能。相比業界主流方案,CodeArts在問題定位率上提升了73%,項目級問題修復成功率提升了57%,讓開發者能輕松實(shi)現項(xiang)目級智能。
在數據治理方面,華為云DataArts數據治理生產線也(ye)實現(xian)升(sheng)級,將盤古大(da)模(mo)型(xing)和華為18年的數據治理(li)經驗(yan)相結合,一是將沉淀(dian)在企業海(hai)量數據中(zhong)的業務(wu)規則、決策(ce)流程、行(xing)業經驗(yan)發掘出來,形成企業知識(shi)湖;二是基于(yu)大(da)模(mo)型(xing),實現(xian)數據集成、開(kai)發、治理(li)、分(fen)析等生命周(zhou)期的自動化、智能化,從而(er)降(jiang)低智能化管(guan)數、用數的門檻。
在MetaStudio數字內容生產線方面,華為云將多模態大模型和生成式AI技術相結合,基于800多萬小時的音視頻數據和3000多萬的3D資產,打造了盤古媒體大模型;將盤(pan)古媒體大模型(xing)和華為有(you)深厚積累的音視頻編解碼、3D模型(xing)物(wu)理(li)仿(fang)真等結(jie)合用于(yu)AI內容生成,突破了當前大模型(xing)不懂物(wu)理(li)世界的局(ju)限。
在數據庫方面,華為云將產品文檔、專家知識、運維經驗等數據庫專業數據和大模型相結合,構建盤古數據庫大模型,實(shi)現了GaussDB數據庫(ku)的(de)開發(fa)、測試(shi)、遷移、運(yun)維的(de)全生命周(zhou)期智能化,提(ti)升開發(fa)人員和DBA的(de)使用效率(lv)。
在安全方面,華為云用盤古大模型升級華為云安全服務,打造了面向安全領域的盤古安全大模型,學(xue)習了(le)華(hua)為云(yun)每年4500億次(ci)攻(gong)擊對抗的攻(gong)防經驗,600多次(ci)的護網(wang)演(yan)練流程腳(jiao)本,和400多個行(xing)業的攻(gong)擊場景等數據,讓華(hua)為云(yun)能夠快速、精準的給出安全治(zhi)理咨詢的專業意見。
結語:華為云AI原生布局初現,盤古5.0將大模型深扎行業
今日,中國人迎(ying)來(lai)了自己的操作系(xi)統,純血鴻蒙正式發布,與此同時華(hua)為鴻蒙原(yuan)生智能的大招炸場,背后則是華(hua)為云盤古(gu)5.0大模型的硬核支(zhi)持。
去年(nian),華(hua)為云在盤(pan)古3.0發(fa)布(bu)時提出(chu)“不作詩(shi),只做(zuo)事(shi)”,今年(nian)隨(sui)著(zhu)盤(pan)古5.0的發(fa)布(bu),華(hua)為云提出(chu)“不僅(jin)要(yao)做(zuo)事(shi),還要(yao)做(zuo)最(zui)難的事(shi)”,從三(san)大技術更新到行業(ye)大模型(xing),從車間到工(gong)地,盤(pan)古大模型(xing)正在融入(ru)更多行業(ye)解決實際難題。
當下,如(ru)火如(ru)荼的(de)(de)“百模(mo)大戰”拼價格、比參數、刷榜單,競賽(sai)到了白熱(re)化階段。但與此同(tong)(tong)時,大模(mo)型(xing)是(shi)不是(shi)同(tong)(tong)質化了、停留在(zai)GPT-3.5水平(ping)了?引起產業人思考。華為(wei)云為(wei)大模(mo)型(xing)的(de)(de)中國方案給出了新思路,通(tong)過與千(qian)行(xing)百業的(de)(de)實際問題結合,大模(mo)型(xing)有望(wang)在(zai)實踐中迸(beng)發新的(de)(de)生命力。