智東西(公眾號:zhidxcom)
作者 | 云鵬
編輯 | 心緣

手機AI芯片大戰,正成為今天科技賽場上極為重要的一場較量。

從手機芯片大廠到(dao)手機終端(duan)巨頭,無一不在力挺端(duan)側AI,不論是系統級(ji)還是個性(xing)化AI的實現(xian),都(dou)離不開(kai)AI的端(duan)側計算,而(er)計算就(jiu)離不開(kai)芯片。

尤其結合當下AI智能體、AI OS方向成為行業共識,AI對芯片能力的需求愈發高漲,這種需求不是簡單的“TOPS”算力,而是對芯片全方位能力的考驗。

放眼國內,小米掏出自研(yan)SoC大招(zhao),玄戒O1首秀即(ji)在CPU、GPU性能方面(mian)(mian)與高通聯發(fa)科掰(bai)手腕,與蘋果A18 Pro較(jiao)量(liang)互(hu)有勝負(fu)。據小米方面(mian)(mian)透露,其自研(yan)NPU架構也實現(xian)了不少細節(jie)創新。

芯片六巨頭,決戰手機AI芯片光明頂

▲5月22日小米發布玄戒O1自研芯(xin)片(pian)

華為海(hai)思的(de)麒麟(lin)手機芯片雖(sui)仍然受限于工藝(yi)制程,卻在架構和軟件系(xi)統(tong)層面尋找突破口,自(zi)研(yan)泰山大小核徹底(di)擺脫Arm架構,基于自(zi)研(yan)鴻蒙操作(zuo)系(xi)統(tong)的(de)深(shen)度(du)(du)優(you)化連年實現整機性能的(de)提升(sheng),AI功能落地(di)速度(du)(du)甚(shen)至(zhi)部分超過安卓旗艦機。

芯片六巨頭,決戰手機AI芯片光明頂

▲6月(yue)20日華(hua)為開發者大會(HDC)上展示的(de)最(zui)新手機(ji)端側AI功能,AI可以幫助用戶在拍照時進行輔助構圖

放眼全球,蘋果芯片在硬件性能方面已經遇到不少有力挑戰者,在AI掉隊之下,如何基于芯片和系統優勢實現AI體驗是蘋果當務之急;三星3nm工(gong)藝(yi)被曝(pu)良率堪(kan)憂,自家(jia)Exynos旗(qi)艦(jian)芯遲遲未能(neng)量產落地,內部(bu)團隊動蕩,但其(qi)多年技術積累令其(qi)仍然是(shi)AI手機時代不可忽視(shi)的一(yi)股芯片力(li)量。

在終端大廠加碼布局自研芯片之時,高通、聯發科自(zi)然(ran)也感受到了(le)壓力,高通(tong)自(zi)研(yan)Oryon架構CPU進一步實現能效比(bi)的(de)提(ti)升,聯發(fa)科連(lian)放AI開(kai)發(fa)工具大招力求(qiu)用完善生(sheng)態吸引AI開(kai)發(fa)者。

芯片六巨頭,決戰手機AI芯片光明頂

▲2024年10月21日高通發布(bu)采(cai)用Oryon CPU的旗艦(jian)SoC驍龍8 Elite

縱觀行業,雖說做手機不一定是“得芯片者得天下”,但在AI手機時代強化對芯片技術的掌控,已悄然成為巨頭們的必然選擇。

芯片六巨頭,決戰手機AI芯片光明頂

▲六(liu)大主流手(shou)機AI芯片(pian)廠商旗艦SoC及工藝情況(kuang)

從工藝(yi)制(zhi)程到(dao)芯(xin)片架(jia)構(gou),再到(dao)基于芯(xin)片的AI開(kai)發生態,如(ru)今各家有哪些(xie)關(guan)鍵(jian)動作和布(bu)局,又有哪些(xie)臺上(shang)臺下(xia)的精(jing)彩較(jiao)量?我們嘗試(shi)在這場AI芯(xin)片手機大戰中洞察到(dao)更多關(guan)鍵(jian)趨勢。

一、2nm被蘋果搶先包圓,小米高通聯發科們要靠什么打贏“能效比”?

為何芯片(pian)對AI手機的(de)體驗如此(ci)重(zhong)要?性(xing)能和功耗表現可以說是(shi)一切功能想要真(zhen)正落(luo)地前都必須要邁過的(de)一道坎。

對于移動智能設備來說,PPT中漂亮AI功能的實現,前提都是不能以犧牲手機功耗、續航為基礎,這是一條絕對的“紅線”。

十幾(ji)年來,提升(sheng)芯片能效一直是智能手(shou)機(ji)芯片行業迭代的重(zhong)點,而在AI手(shou)機(ji)時代,這一需求(qiu)顯得(de)更為(wei)迫切。

從工藝制程到芯片架構設計,各家(jia)的(de)競爭態勢愈發激烈。

工藝(yi)方面,如今旗(qi)艦手(shou)機SoC的工藝(yi)制程已經普遍來到了第二(er)代3nm階段,包(bao)括蘋(pin)果(guo)、高通、聯發科(ke)、小(xiao)米。當然,蘋(pin)果(guo)每年都會率先包(bao)圓(yuan)臺積電最新最強(qiang)的工藝(yi),比如明(ming)年的2nm。

蘋果分析師Jeff Pu提到,A19 Pro芯片會采用臺積電(dian)第三代3nm制程,蘋果最快會在明(ming)年(nian)的iPhone 18系列上引入臺積電(dian)2nm工藝。

芯片六巨頭,決戰手機AI芯片光明頂

臺積電董事長魏哲家在財報電話會上曾透露,臺積電寶山廠首批2nm產能已經全部被蘋果包圓了。

高(gao)通、聯發科(ke)、小米雖然不(bu)是第一批,但目前的旗(qi)艦(jian)芯片(pian)也都用上了蘋果“同款(kuan)”工(gong)藝,三星(xing)這邊(bian)雖然自(zi)家集團(tuan)中的半導體(ti)部門有著先進(jin)工(gong)藝制程技術,但在量產(chan)和內部管理方面卻頻頻“翻車”,甚至(zhi)原計劃的3nm Exynos系列芯片(pian)直接難產(chan)。

就在最近,三星的芯片業務被曝出偽造數據、掩蓋缺陷的丑聞,據報道(dao),三星(xing)芯(xin)片工程師也紛紛跳槽到對家,可(ke)以說是“屋漏偏逢連(lian)夜(ye)雨”。

相比(bi)(bi)三星工(gong)藝翻車,華為海(hai)思(si)這邊(bian)則是承壓前行,由(you)于代工(gong)受(shou)到(dao)限制,麒麟手機芯片(pian)無法用(yong)上最(zui)新工(gong)藝制程(cheng),在芯片(pian)能(neng)效(xiao)比(bi)(bi)提升(sheng)方面(mian)與同代采用(yong)新工(gong)藝的旗艦芯片(pian)會拉開一(yi)定差距,操作系(xi)統和軟件層面(mian)的優化(hua)對整(zheng)機性(xing)能(neng)提升(sheng)貢獻(xian)較(jiao)大(da)。

芯片六巨頭,決戰手機AI芯片光明頂

▲ CPU多核(he)能效曲線(紅色圓點為麒(qi)麟9020,紫色、綠色曲線為高(gao)通、聯發科旗艦芯,時間為2024年12月),來源:極客灣Geekerwan

整體來看,工藝制程的升級對芯片能效的提升固然十分重要,但工藝制程的進步在明顯放緩,手機能效比如果想要實現顛覆性提升,不能僅憑工藝升級。

臺積電在2024年的IEDM會議上(shang)提到(dao),同(tong)面積2nm芯(xin)片的晶體管數(shu)量比3nm芯(xin)片多15%,同(tong)功(gong)耗下芯(xin)片性能提升大約(yue)15%。

在工藝之外,芯片設計層面、架構層面等更多廠商可自主把控環節的技術創新就顯得更為重要,這也是各(ge)家(jia)能夠(gou)形成差異的一部分(fen)。

二、巨頭死磕自研架構,芯片設計掀起“真假自研大戰”

業內普遍認為,在做AI手機這事上,蘋果有著軟硬件打通的先天優勢——越深度全面地掌握底層技術,就越容易最終實現整機更好的體驗。

各家手機AI芯片的自研深度或許決定著其AI手機體驗的上限天花板。

雖然自研(yan)芯片(pian)的優勢(shi)不(bu)是絕對的,但強化對自研(yan)芯片(pian)技術的掌握,已經成為目(mu)前手機芯片(pian)領域毋庸置疑(yi)的大勢(shi)所趨(qu)。

具體來看,各家手機AI芯片自研模式有所不同,蘋果、華為、高通,基于Arm指令集,在SoC所有核心模塊實現自研;聯發科、小米、三星,基于Arm指令集,采用Arm公版架構+部分模塊自研。

當然,不論是哪種模式,都是毫無疑問的“自研”。簡單來說,Arm指令集就像是芯片說的“語言”,但兩個人即便都用同樣的語言來寫文章,也會有“大學生論文”和“小學生作文”的差別。

蘋果這邊的自研深度自然不必(bi)多(duo)說(shuo),甚至可以說(shuo)是(shi)“斷檔式領先”。

深度自(zi)研在(zai)AI方面實(shi)則能帶來不少優勢(shi),比如蘋果芯片的GPU模塊可(ke)以針對圖(tu)形處理(li)和AI計算進行(xing)優化,其(qi)神(shen)經網絡(luo)引(yin)擎(NPU)更是蘋果獨特優勢(shi),對端側AI各(ge)類功能加速都進行(xing)了深度優化。

芯片六巨頭,決戰手機AI芯片光明頂

華為雖然芯片工藝受限(xian),但麒麟芯片的(de)架(jia)構(gou)(gou)卻一直在(zai)持續迭代。據了解,在(zai)最新的(de)麒麟9020這一代上(shang),華為已經實(shi)現(xian)了CPU全部核心(xin)替(ti)換為自(zi)研泰(tai)山架(jia)構(gou)(gou),從超(chao)大核到小核。而GPU方面(mian)也有其自(zi)研的(de)馬(ma)良系列。

芯片六巨頭,決戰手機AI芯片光明頂

▲華為(wei)麒麟9020芯片CPU內核情況(kuang),來源:極(ji)客灣(wan)Geekerwan

實際(ji)上(shang),華為也是(shi)在麒麟9020這一代上(shang)才實現的(de)完(wan)全核心(xin)模(mo)塊自研,此前9010的(de)CPU小核依(yi)然用(yong)的(de)Arm公版IP。

在AI手機這波浪潮中,華為是手機行業中第一個將大模型能力用在手機上,實現自家智能助手升級的廠商,其自研麒麟芯片和自研鴻蒙操作系統的深度協同,讓華為即使在工藝制程受限的情況下,每年也能穩定實現一定的整機性能提升,這對于AI體驗的落地也十分關鍵。

相較于蘋果華為這種“自產自銷”的廠商,高通作為三方芯(xin)片廠商,其自研芯(xin)片的特(te)性(xing)多(duo)少會一定程度上掣肘于安卓系統。

目前高通自研Oryon CPU已經迭代(dai)至第二(er)代(dai),并大規模量產應用在(zai)旗艦(jian)手機中,其自研(yan)的(de)Adreno GPU也做了(le)十幾年。

Oryon CPU架構的(de)突破,幫高通在(zai)(zai)CPU單核(he)、多核(he)性能上都(dou)領先于(yu)同代聯發(fa)科旗艦(jian)SoC,在(zai)(zai)手機CPU能效(xiao)方面穩居第一梯隊(dui)。

高通自研的Hexagon NPU,最新一代AI算(suan)(suan)力(li)(li)突破了80TOPS,據稱今年即將(jiang)突破100TOPS,從算(suan)(suan)力(li)(li)絕對(dui)值層(ceng)面來說(shuo),高通自研NPU有比(bi)較明顯的優勢。

聯發科、小米(mi)的CPU、GPU核心模塊都(dou)是基于Arm IP授權進行定制(zhi)設計(ji),均為Arm架(jia)構;三星的Exynos CPU雖然是Arm架(jia)構,但(dan)GPU卻采(cai)用了AMD的RDNA 3架(jia)構。

芯片六巨頭,決戰手機AI芯片光明頂

▲小米玄(xuan)戒O1 CPU內核(he),來源:小米

ISP和NPU沒有“公版”之說,因此各家都是自研定制,比如ISP方面(mian)聯(lian)發科的(de)Imagiq、小米(mi)的(de)自研ISP;聯(lian)發科旗艦芯NPU有42TOPS算力,小米(mi)也有自研6核NPU。

前段時間關(guan)于芯片(pian)“自(zi)研(yan)”的討(tao)論成(cheng)為科技圈第一大話題,實際上,正如前文所說,芯片(pian)自(zi)研(yan)與(yu)否與(yu)是(shi)否采用了(le)Arm架構或Arm IP授權并無直(zhi)接(jie)關(guan)系。

一個手機SoC里面包含上百個IP模塊,如何讓各個模塊高效、低功耗地集成在一起,并保證其協同工作,還要實現差異化優勢,這是真正的難點所在。

一(yi)位芯(xin)片(pian)行(xing)業(ye)人士告訴(su)智(zhi)東西,最難的(de)不是“自研”,而是真正把芯(xin)片(pian)設計的(de)每(mei)一(yi)個(ge)細節吃透,做出一(yi)個(ge)成熟好用、性能功(gong)耗平衡優秀的(de)芯(xin)片(pian),實(shi)際上(shang),實(shi)現(xian)這件事(shi)的(de)過程,就是在(zai)自研芯(xin)片(pian)。

可以看到,一方面,自研芯片核心技術可以直觀地給產品帶來性能或體驗的優勢,另一方面,芯片自研帶來的不僅是芯片產品本身,更是對一家廠商整個技術版圖的重要補全,對廠商優化芯片與操作系統、大模型、應用的協同都會有幫助。

不做深度自研,很難像蘋果一樣實現人無我有的優勢,強化手機AI芯片自研技術,已經成為行業的必然方向。

三、都說蘋果AI掉隊了,怎么突然被蘋果“反將一手”?

正如前文所說,如今早已不是“唯TOPS論”的時代,隨(sui)著端側AI快速發展,AI應(ying)用真正(zheng)落地(di)的能效表(biao)現成為(wei)行業關注焦(jiao)點。

優(you)秀模型(xing)一(yi)個接一(yi)個,但AI手機上的(de)AI應用能否高效(xiao)利用端側AI大(da)模型(xing)能力,如何在(zai)有限的(de)能效(xiao)內更高效(xiao)地(di)運行(xing)AI,最終實現好的(de)AI體驗,仍然(ran)存在(zai)很大(da)優(you)化空間。

在芯片本身過硬的基礎上,手機AI芯片的相關開發加速工具支持完善程度也十分關鍵。

在這方面,蘋果在今年WWDC上,邁出了非常關鍵的一步——向所有App開放權限,允許App直接訪問蘋果智能核心的設備端大語言模型。

芯片六巨頭,決戰手機AI芯片光明頂

如(ru)何訪問?蘋(pin)果發布(bu)了基礎模型(xing)框(kuang)架,也就是如(ru)今業內常常被(bei)討論的(de)蘋(pin)果開源(yuan)機器(qi)學習框(kuang)架(MLX),讓開發者(zhe)可以使用蘋(pin)果的(de)模型(xing),開發工具層(ceng)面(mian)的(de)App Intents則讓開發者(zhe)能在整個系統中關(guan)聯(lian)自己App的(de)內容(rong)和功能。

具(ju)體來看(kan),蘋果(guo)MLX支(zhi)持(chi)Python、C++、C和(he)Swift等多種主流編程語言,根據(ju)GitHub信息,其(qi)API對于(yu)開(kai)發者來說熟悉易(yi)用(yong),同時支(zhi)持(chi)函數變換的組合性(xing)、延遲計算(suan)模式、動態圖構建(jian)、跨設備(bei)運行(xing)能力以及(ji)統一內存(cun)模型。

在性能方面,跟傳統的機器學習框架相比,蘋果MLX內存傳輸開銷為零拷貝,同時對蘋果芯片GPU計算能力進行了優化,未來MLX可以直接調用ANE專用指令集,而其他框架大多是間接支持或有限支持;動態圖響應速度方面,MLX能達到毫秒級,PyTorch為秒級,TensorFlow則需分鐘級。

對于開發(fa)者們來說,MLX的(de)實時錯誤(wu)追蹤(zong)比傳統靜態(tai)圖框架(jia)快3-5倍(bei),85%的(de)NumPy/PyTorch代碼可(ke)直接遷移,并且還可(ke)以利用(yong)蘋(pin)果芯片統一(yi)架(jia)構減少跨平臺適配工作。

可以說,蘋果MLX是全流程的開源框架,從模型訓練到推理的端側優化,并且深度整合了自家的硬件。

安卓陣營中雖然沒有能完全對標蘋果MLX的開源機器學習框架,但在開發者提效降本方面也都發布了各自的軟件平臺或開發工具。安卓(zhuo)陣營(ying)的芯(xin)片廠商更多通(tong)過閉源SDK或開(kai)源協作的方式支持AI開(kai)發。

比如高通的AI軟件棧,可以讓開(kai)發者在手(shou)機上市幾個月(yue)前,通(tong)(tong)過高通(tong)(tong)Device Cloud,基于驍龍(long)8 Elite開(kai)發AI應用(yong)服務(wu),進行(xing)調試(shi)、優化。AI應用(yong)可以通(tong)(tong)過ONNX、DirectML等框架和高通(tong)(tong)AI軟(ruan)件棧,實現NPU的(de)加速(su)。

芯片六巨頭,決戰手機AI芯片光明頂

▲高通AI軟件棧

聯發科這邊則有天璣開發工具集(Dimensity Development Studio),比(bi)如其(qi)中(zhong)的(de)Neuron Studio能基于神(shen)經網(wang)絡(luo)進行自動化(hua)調(diao)優,幫開發者進行跨模型的(de)全鏈路分析(xi),節省(sheng)調(diao)優時間。

芯片六巨頭,決戰手機AI芯片光明頂

此外,聯發科的天璣AI開發套件2.0,通過開源(yuan)彈性(xing)架構(gou)提升開放(fang)度,模型(xing)庫適(shi)配的(de)模型(xing)數量(liang)提升了(le)3.3倍,對DeepSeek這樣的(de)熱門(men)模型(xing)的(de)關鍵技術(shu)實現端(duan)側支持,提升tokens的(de)生產速(su)度。

總體來看,讓AI芯片的能力可以被開發者高效地用到AI應用中,實現更好的端側AI體驗,這事目前仍然只有蘋果做的是最完善的,安卓陣營并非不做,但生態層面的不統一、各自為戰仍然會帶來很大挑戰。

結語:手機AI芯片之戰,不能輸的硬仗

在AI手機(ji)高歌猛進之下,手機(ji)AI芯片走到了舞臺C位,成為(wei)巨(ju)頭兵家必爭(zheng)之地。

雖(sui)然蘋果(guo)看似在(zai)AI功能落地(di)的“豐富度”上(shang)少了些驚艷(yan)感,但仔細梳理(li)卻能看到(dao)其AI功能端側實(shi)現(xian)占(zhan)比(bi)極高,其從(cong)底層(ceng)芯(xin)片、操作系統到(dao)大(da)模型(xing)、應用的打(da)通,是安(an)卓陣(zhen)營極難段(duan)時(shi)間(jian)追趕的。

蘋果AI誠然有其內部深層次問題,從團隊到技術,但歸根結底,蘋果依然按照他最擅長的做法——小步快跑,來做AI,蘋果確實在“架橋鋪路”上花費了更多時間,但一旦打好地基,AI大廈的上限將充滿巨大想象空間。

這也(ye)是安卓陣營從終端廠商到芯(xin)片(pian)廠商都不斷加碼芯(xin)片(pian)自研技術布局(ju)的重要性所在。真正好的端側AI體(ti)驗,離不開(kai)這些底層技術的支撐。

毫無疑問(wen),AI的(de)到來給手(shou)(shou)機(ji)芯(xin)片市場注(zhu)入了(le)新(xin)的(de)活(huo)力,帶來了(le)新(xin)的(de)變量,能否做出好的(de)手(shou)(shou)機(ji)AI芯(xin)片將成為(wei)決勝(sheng)AI手(shou)(shou)機(ji)之戰的(de)關鍵(jian)。