
智東西(公眾號:zhidxcom)
作者 |? 云鵬
編輯 |? 漠影
今天(tian),AI正給整(zheng)個(ge)手機產(chan)業帶來巨(ju)大影響和變革,從底層(ceng)芯(xin)片到操(cao)作系(xi)統,再到上層(ceng)應用生態(tai),幾乎都在被(bei)AI重構。
越(yue)(yue)(yue)來越(yue)(yue)(yue)復雜的(de)模型(xing)、越(yue)(yue)(yue)來越(yue)(yue)(yue)強大的(de)AI Agent,都對計算效率(lv)、延遲、功耗、內存(cun)帶寬等方面提(ti)出了新的(de)挑戰(zhan)。
從蘋果到三星、聯發科、小米,手機芯片玩家們都在加速AI能力在芯片端的集成,上周(zhou)蘋果剛剛發布的A19芯(xin)片,直接在GPU的每(mei)一個核(he)心(xin)中都塞入了一顆神經網絡加速器。
芯片底層技術創新,是加速端側AI落地、推動AI手機體驗升級的核心支撐。在(zai)這樣的行業趨勢(shi)下,芯片(pian)底層技術(shu)領域的核心玩家(jia)Arm再次向行業拋出一枚AI重磅大(da)招(zhao)。
近日,Arm在上海正式亮出了旗艦級Arm Lumex計算子系統(CSS)平臺,這也是(shi)Arm CSS平(ping)臺的一(yi)次(ci)重要更名和(he)升級。
Arm Lumex包(bao)括新(xin)的CPU、GPU、DSU等(deng)模塊,在性(xing)能、能效顯(xian)著提升的同時,突破性(xing)地(di)將第二代(dai)可伸(shen)縮矩(ju)陣擴(kuo)展(SME2)技術引入到(dao)CPU中(zhong),這也是這類(lei)技術首次在安卓(zhuo)手機芯片中(zhong)落地(di)。而(er)據筆者了(le)解,蘋果(guo)芯片CPU中(zhong)使用的仍然是第一代(dai)SME技術。
Arm特別強調稱,這是一個完整的“AI優先”的平臺。
今天(tian),AI正成為全行業瞄(miao)準的核(he)心方向,而面向這一新時代,Arm的計算平臺正成為AI與個人計算發展不(bu)可(ke)或缺的計算底座。此次Arm重磅(bang)技術升(sheng)級(ji)背后有(you)哪些關鍵思考、對產業和消費者有(you)哪些價(jia)值和意(yi)義?我們將(jiang)一起深入(ru)挖掘。
一、CPU裝上“AI加速器”,攜手支付寶、vivo等企業,讓端側AI從“能用”到“好用”
AI手機經過近兩年的迭代,在發展方向和AI功能種類上已經基本達成行業共識。今天各家的重點毫無疑問是端側AI體驗的優化。在端(duan)云結合的(de)混合AI成為基(ji)礎模式之下,如何(he)更高效(xiao)地(di)在手(shou)(shou)機(ji)上落地(di)模型(xing)、如何(he)在手(shou)(shou)機(ji)上實現更佳的(de)AI應用體驗(yan),成為需(xu)要行業共同破(po)解的(de)難(nan)題。
縱觀Arm整場發布會,AI是當下Arm技術迭代圍繞的核心主題,正如Arm高級副(fu)總裁兼(jian)終端事(shi)業(ye)部總經(jing)理 Chris Bergey所(suo)說,新(xin)的Arm Lumex是(shi)一(yi)個“AI優先”的平臺。
如何實現AI優先,Arm此次最核心的改進是將SME2技術引入了CPU中。
在5倍性能提升、3倍能效提升這些亮眼數字的背后,Arm實際上在做的就是給CPU這一手機中最核心、通用性最強的模塊配備新的矩陣加速器,讓AI時代的各類復雜計算變得更快、更省電,進而(er)讓(rang)我們能在智能手(shou)機(ji)上獲得(de)更好的AI體驗。
目前,SME2這一技術已經獲得了阿里巴巴、支付寶、三星System LSI、騰訊、vivo等(deng)科技領域頭(tou)部企(qi)業的(de)支持(chi)和采用。基(ji)于SME2技術,Arm與這些合作(zuo)伙伴深度(du)合作(zuo),已經(jing)在諸(zhu)多AI應(ying)用中實現了直觀(guan)的(de)升級(ji)。
總體來看,這種AI體驗的升級最突出的特點就是讓AI功能從“能用”到“好用易用”前進了一大步。
如何去定義“好用易用”呢?就是要讓設備“更懂你”,且能“無縫響應”。
手機行業的創新與競爭,是最貼近用戶應用場景的領域之一。過去卷攝影、快充等,是優化單點場景痛點;如今在AI時代,生成式AI應用以及AI與計算攝影、通信、性能等各領域的融合成為焦點,其本質是用AI重構各場景價值,實現從“被動響應”到“主動服務”的轉變。
我們在現場看到了一項“智能瑜伽教練”的演示,在演示中,AI教練可以快速流暢地將文本轉換為語音進行輸出,據稱其生成速度提升了2.4倍之多,這樣用戶就可(ke)以(yi)在(zai)健身過程中即時獲得姿勢(shi)反(fan)饋與(yu)指導,并(bing)且(qie)全(quan)程都(dou)不(bu)用擔心設備(bei)的電(dian)池續航問題。
▲智能瑜伽教練
其實AI健身教練類似功能我(wo)們(men)并不陌生,但讓AI真(zhen)正能夠像(xiang)真(zhen)人一(yi)樣快(kuai)速、準確、高效(xiao)地與我(wo)們(men)進行交流、交互(hu),仍是(shi)產業持(chi)續(xu)努力的(de)目標,Arm無疑將(jiang)這一(yi)愿(yuan)景向現(xian)實推近(jin)了(le)一(yi)大步。
在Arm與支付(fu)寶(bao)和vivo的三方(fang)深度合作中,AI手機體驗(yan)的升級(ji)給我帶來(lai)了更多驚(jing)喜。
支付寶端側AI引擎xNN集成了SME2技術,在vivo的旗艦智能手機上完成了基于Arm SME2技術的大語言模型推理驗證,在預填充與解碼階段,性能分別實現了超過40%和25%的提升,大語言模型交互響應時間縮短了40%。據稱,在SME2加持下,vivo手機實現了額外20%的性能提升。
從應用效果來看,vivo手機在一些視覺、語音、文本等AI計算任務中,性能都實現了顯著加速,比如在全局離線翻譯這(zhe)樣的真(zhen)實場景(jing)中,AI響應時間明顯加快,讓整個翻譯的過(guo)程(cheng)更加流暢自然。
▲本地離線實時翻譯
可以說,這些翻倍式的改善,都標志著CPU后端能力的重大突破,證明了SME2可為終端設備帶來更快的實時生成式AI體驗,端側AI的各(ge)類本地功能,都得到了顯著提升。
再來看看用(yong)戶非常看重的(de)計算(suan)攝影。搭載SME2單核心運行(xing)神經攝像頭降噪(zao)功(gong)能(neng),可以(yi)在1080P分辨(bian)率(lv)下實現(xian)(xian)每(mei)秒120幀(zhen)的(de)超(chao)高幀(zhen)率(lv),即使在4K高分辨(bian)率(lv)下,也能(neng)實現(xian)(xian)每(mei)秒30幀(zhen)的(de)幀(zhen)率(lv)表現(xian)(xian)。這意味著,我們日常使用(yong)手機拍照(zhao),即使在光線(xian)昏(hun)暗(an)的(de)場(chang)景中,也可以(yi)拍出更加清晰、銳利的(de)照(zhao)片(pian)。
縱觀此(ci)次發(fa)布的(de)產品(pin)和(he)技(ji)術(shu),從CPU、GPU到(dao)軟件(jian)庫的(de)一系列升級,都(dou)讓我們看(kan)到(dao)了(le)Arm Lumex在AI時代給(gei)廠商(shang)、開發(fa)者、消費者帶(dai)來的(de)價(jia)值。
而對于開發者而言,從軟件工具到生態層面的完善支持更能讓他們迅速將這些新技術與自身的產品相結合,將AI創新成果更快推向市場。
根據Arm預測,到2030年,SME與SME2技術將為全球超過30億臺設備新增超100億TOPS的計算能力,端側AI性能呈(cheng)現指數級提升。
二、深耕計算數十年,年均兩位數IPC提升,用技術和生態領跑行業
今天,我們看到Arm基于底層技術創新實現了移動設備端側AI性能的大幅提升,實現這一切,一方面源于Arm的技術硬實力,另一方面也源于數十年來Arm在移動技術和生態領域的持續引領,在(zai)技術和產業發展的關鍵(jian)節點,Arm始終跑在(zai)前(qian)列。
從技術演進來看,Arm對AI的布局實際已持續十余年:Armv8架構時代,通過優化NEON模塊以提升AI效率;Armv9架構引入SVE2與SME以適配更多AI場景;到Armv9.3-A架構時代,集成SME2技術,優化現代AI工作負載的吞吐量、延遲與精度。Arm通過架構層面改進SoC設計,為AI應用的爆發提前蓄力。
如今,智能設備的海量爆發讓計算變得無處不在,從手機、PC、汽車到各類AIoT設備,萬物智聯的趨勢變得愈發顯著。與此同時,產業對能效比的極致追求、對功耗的死磕、對大模型的支持優化、對AI算力的需求都成為行業共同面對的挑戰——Arm終于等到了AI的東風。
回到手機行業,如果只是架構上的革新,還不足以跟上端側AI應用的步伐。ArmLumex計算子系統(CSS)平臺給出了新的解題思路,它(ta)從(cong)系統性(xing)層面,集(ji)成搭載SME2技(ji)術(shu)的最高性(xing)能Arm CPU、GPU及(ji)系統IP,加速端側AI的落地和普(pu)及(ji)。
軟件工(gong)具和生態層面,KleidiAI已經(jing)集成至所有主流移(yi)動操作系統及(ji)AI框(kuang)架中。開(kai)發者能在各類Arm設備上獲得(de)最佳AI性能,無(wu)需進行任何額外操作。
縱觀手機行業的發展,Arm一直跑在技術浪潮的最前沿。每一個版本更新都為行業注入新的活力,給行業玩家提供最堅實的底層技術“資源池”。Arm及其生(sheng)態(tai)系統(tong)在奠(dian)定計(ji)算基礎方(fang)面所做(zuo)的努力,讓行(xing)業(ye)能夠(gou)時刻(ke)把(ba)握新(xin)興的機遇。
三、從手機PC到全生態,算力產業激變,模式轉型構筑“核心基石”
今天(tian),AI新浪潮正在快速席卷整個科(ke)技(ji)行業。
終端大廠(chang)們紛紛“All in AI”,從(cong)產品(pin)到服務(wu)圍繞(rao)AI升級;大模型迭代從(cong)半年更、月更到今天的(de)周更,競爭(zheng)進入(ru)(ru)白熱(re)化階段;底層芯片層,各路芯片廠(chang)商都在(zai)產品(pin)中(zhong)密(mi)集融入(ru)(ru)AI新特性。
從手機、PC、汽車、物聯網到數據中心,從十億級、百億級到萬億級、數十萬億級模型,AI正在快速重構各行業各領域,同時也給計算產業也帶來了新的挑戰和機遇。
Arm顯然是在這股AI浪潮中行動頗為積極的一家。作為驅動AI應用的技術基石,不論是要快速上市兌現性能價值,還是要深度設計配置,從高端智能手機、PC到新興AI智能設備,Arm總能幫助廠商找到峰值性能、持續能效與芯片面積之間的靈活平衡“甜點”。
AI浪(lang)潮之(zhi)下(xia),曾深(shen)耕幕后的底層技術廠商正(zheng)逐(zhu)步走向臺前,以(yi)核心技術重塑產業格局。
全力沖刺AI的Arm,從(cong)技術(shu)到生態(tai),從(cong)產品到服務,已經全面做好了準備。
結語:打牢AI時代計算根技術,端側AI提速
今天,從安卓(zhuo)到蘋果(guo)生(sheng)態,端側(ce)AI的快速發展需要(yao)更多底層技(ji)術(shu)創新的支撐,AI應用體(ti)驗(yan)仍(reng)有較大(da)提升空(kong)間,Arm Lumex的發布,給行業提供了(le)一套扎實的計算平臺基礎,讓廠商和開發者們面(mian)對(dui)AI這場硬(ying)仗有更充足的彈藥。
未來,AI手機之戰會愈發焦灼,芯片層的創新仍然會長期是行業競爭的焦點領域。從廠商到開發者,面對AI時代的機遇和挑戰,Arm生態已經成為AI創新的肥沃土地。