
芯東西(公眾號:aichip001)
作者 |? 云鵬
編輯 | ?漠影
今天,以DeepSeek為代表的國產大模型強勢突圍,引爆大模型落地部署熱潮和AI應用開發熱潮,根據公開數據預測,未來3年,推理算力年復合增速將達到訓練算力的近4倍,算力規模將在3年后超過訓練算力規模。
推理側更注重性能、效率與成本的平衡,如何把AI推理與業務場景做高效的結合,是(shi)當下行(xing)業聚焦的重(zhong)點(dian)之一。
在今日剛剛開幕的RISC-V中國峰會上,國內芯片設計領域年輕創企知合計算亮出了“通推一體”的概念,公開了自主設計研發高性能RISC-V CPU核的研發進展,并發布通推一體產品“阿基米德”系列,其目標是通過RISC-V架構的高性能通推一體芯片來解決通用計算與AI增強計算高效融合的問題,進而(er)真(zhen)正將AI更好地(di)融入(ru)到企業(ye)的實(shi)際業(ye)務(wu)中。
性能指標層(ceng)面(mian)“打破天花板”式的突破、兼容性以及生態規范(fan)層(ceng)面(mian)的完備支持,都(dou)讓我(wo)們看到RISC-V在高性能計算(suan)領(ling)域所迸(beng)發出的巨(ju)大潛(qian)力(li)。
產品亮相(xiang)之際,芯東西與知合(he)計算CEO孟建熠博士進行了(le)深度交流,對RISC-V技術(shu)和生態(tai)做了(le)進一步挖(wa)掘(jue)和探討。
在產品技術創新之外,知合計算高性能RISC-V CPU核與通推一體的產品更重要的意義或許是讓整個產業看到了一個基于RISC-V打造的“燈塔級產品”,進而激勵行業共同努力爬坡,給RISC-V芯片生態的發展注入新的動力。
一、AI推理時代,RISC-V催生新一代計算芯片無限可能
當下,隨著端側AI發展提速,如何把更大、更高質量、效果更好的模型部署在芯片上去做推理,如何把推理能力從云端帶向應用?從性(xing)能、能效(xiao)到成本,還有諸多(duo)問題需要解決。
在這樣的行業背景下,RISC-V的優勢愈發凸顯,在孟博看來,RISC-V首先是一種技術迭代模式上的變化,相比x86和Arm的“Inside-Out(由內而外)”,RISC-V更多是“Outside-In(由外而內)”。
簡單來說,RISC-V更(geng)多是(shi)從需(xu)求的角度出發(fa)來改進架構(gou),能跟應用需(xu)求走的更(geng)近,開發(fa)者甚至不需(xu)要(yao)懂CPU設計,就可以對軟件進行改進,這是(shi)其突出優勢之一(yi)。
對于芯片廠商和開發者來說,RISC-V就像一個計算架構底座,在AI時代,計算的類型更復雜,開源的RISC-V使其(qi)可以根據需求進行擴展去設計芯(xin)片,更靈活(huo)自(zi)定義,就如(ru)同(tong)眾(zhong)多(duo)優(you)秀的工(gong)程機械都是基于同(tong)樣的履帶式底盤(pan)打造。
知(zhi)合(he)計算的(de)高性(xing)能CPU核(he)以(yi)(yi)及基于(yu)(yu)其(qi)上的(de)通(tong)推一體(ti)RISC-V芯(xin)片(pian),實際上給(gei)了產業一個新的(de)選擇,讓產業看(kan)到基于(yu)(yu)開源、開放(fang)打造的(de)芯(xin)片(pian)產品同樣可以(yi)(yi)在高性(xing)能計算領域擁有不輸兩大(da)生(sheng)態(tai)的(de)競爭力。
今天的RISC-V,正在催生新一代計算芯片的無限可能。
二、沖刺“高性能俱樂部”,打破RISC-V性能天花板,從芯片架構到軟件算法協同創新
顯然(ran)(ran),RISC-V的(de)(de)發展方(fang)向(xiang)是(shi)(shi)(shi)明確(que)的(de)(de),但實踐的(de)(de)道(dao)路(lu)誠然(ran)(ran)是(shi)(shi)(shi)不(bu)(bu)易的(de)(de)。如果以過去的(de)(de)視角來(lai)看,RISC-V或許仍然(ran)(ran)只(zhi)是(shi)(shi)(shi)點(dian)亮了算(suan)力星(xing)(xing)空中為數不(bu)(bu)多的(de)(de)幾顆星(xing)(xing)星(xing)(xing)。
在孟博看來,技術創新是RISC-V發展的根本,真正打造出更優秀、更有性價比的RISC-V產品才是硬道理,這就像是“先有雞還是先有蛋”的問題。
就像今天的(de)Arm芯片在很(hen)多場景之所以可以跟x86掰手腕,就是因(yin)為兩者在計算能(neng)力上的(de)差距越來越小,同(tong)時Arm的(de)能(neng)效比更(geng)高(gao)、性價比更(geng)高(gao)、成本(ben)大幅降(jiang)低,企業自然會選擇對(dui)自身降(jiang)本(ben)增效更(geng)有利的(de)方案。
RISC-V生態想要發展的核心本質還是要做出好的產品,在性價比上形成優勢。這是一個“螺旋上升”的過程:做(zuo)好(hao)了芯片,軟件(jian)才能移(yi)植(zhi)、優化,生態才能生長(chang),反哺(bu)硬件(jian)設(she)計,從而形成螺旋上升的良性生態。
從物聯(lian)網、嵌入式(shi)到終端應用場景,再到今天即將擁有“高性能(neng)俱樂(le)部”的(de)(de)入場券,RISC-V的(de)(de)成(cheng)長是(shi)有目共睹的(de)(de),業內也對標桿性產(chan)品(pin)翹首以待。
知合計算的RISC-V通推一體芯片,將通用計算和AI加速能力高效融合在一款芯片中,這無疑是一次大膽的嘗試,其核心要兼顧高性能通用計算和低成本AI推理計算。
高性能通用計算方面,從微(wei)架(jia)構設計到(dao)性能(neng)和能(neng)效(xiao)的(de)提升,主頻(pin)每0.1GHz的(de)提升都充滿挑(tiao)戰(zhan);低成(cheng)本AI推(tui)理方面(mian),從統一(yi)地址(zhi)、存儲訪問(wen)優化(hua)到(dao)計算效(xiao)率的(de)提升,每一(yi)環的(de)技術創新都十(shi)分關鍵(jian)。
具體來看,知合計算打造了敏捷高效的性能分析與優化平臺來支持架構(gou)創新:加強了工具鏈和微架構(gou)的(de)模塊化架構(gou)和擴展(zhan)(zhan)性,以實現(xian)軟硬件敏捷迭代,從而快(kuai)速評估(gu)RISC-V架構(gou)不斷產生的(de)新擴展(zhan)(zhan)帶來的(de)收益。
同時,知合計算通過統一的圖形化性能分析平臺,打(da)通(tong)了從建模(mo)到(dao)RTL仿真(zhen)再到(dao)原型(xing)平(ping)臺的數據和分析流程,大幅提升了分析優化的效率。而(er)結合模(mo)型(xing)精(jing)度調(diao)優,則能給處理器架構和微架構設計(ji)提供重要的決(jue)策支持。
此外,RISC-V處理器硬件的快速迭代也對PPA(性能、功耗、面積)的迭代優化效率提出了要求,為此知合計算打通了軟件、架構、設計、綜合和物理實現的開發流程體系,實(shi)現了快(kuai)速評估新擴展、新功能PPA成本和收益。
可以說,一系列底層技術創新讓RISC-V架構CPU在高性能計算領域應用打下了堅實的基礎。
在性能和PPA大幅優化基礎上,知合計算進一步提升了內核的兼容性,這對(dui)后(hou)續基(ji)于(yu)其(qi)上構建生態十分重要。其(qi)實現了對(dui)RVA23 Profile的(de)完全兼容(rong),支(zhi)持123個(ge)RISC-V官(guan)方擴展(zhan),在兼容(rong)性增強技術方面進(jin)一步(bu)迭代。
在軟硬件全系統兼容方面,CPU核(he)實現了(le)對RISC-V系統平臺總體規范(fan)兩個(ge)關鍵子項100%的(de)(de)支(zhi)持率,一個(ge)關鍵子項97%的(de)(de)支(zhi)持率。而在SoC和(he)上層軟(ruan)件棧層面(mian),也原(yuan)生兼容RISC-V數十個(ge)平臺規范(fan)和(he)擴展。
具體落(luo)到實際(ji)的(de)應(ying)用場(chang)景,知合計算通(tong)過一(yi)系列指令(ling)增強和(he)擴展、流水線(xian)架構優化改(gai)進、軟件算法改(gai)進等層面的(de)創新設(she)計,實現了不俗的(de)成(cheng)績。
根據實測數據,在視頻編解碼方面,知(zhi)合計算基于(yu)一系列技術革新,配合軟件算法的(de)(de)改進,x264和(he)x265的(de)(de)平均編解碼性能(neng)能(neng)夠達到(dao)Intel EMR和(he)ARM V2的(de)(de)80%到(dao)90%以上。
加解密計算方面,知合計算實現了OpenSSL典型應用的平均性能分別達到ARM V2的1.6倍和Intel EMR的1.8倍。在大模型推理方面,知合計(ji)算(suan)的(de)CPU通過支持MoE模型的(de)算(suan)子融(rong)合,主要算(suan)子的(de)平均(jun)性能能夠達到ARM V2的(de)1.6倍以上。
而針對低成本AI推理計算,知合計算正在重點開發AME混合計算架構,這也是高通、阿里達摩院、知合計算、希姆計算等公司主推的方案。數據存儲方面,知合計算基于多項技術優化,最終(zhong)讓壓縮(suo)解壓縮(suo)和數據校驗的性能相(xiang)比于優化前提升了(le)2至6倍。
此外,這款處理器采用了全棧的RISC-V RAS原生的架構,其(qi)整個軟硬件(jian)平(ping)臺都支(zhi)持RISC-V RERI規范。通(tong)過與合作伙(huo)伴在內核、固件(jian)和(he)BMC上(shang)的合作,知(zhi)合計算將打(da)通(tong)從底層硬件(jian)到數據中(zhong)心控制端的整個RAS通(tong)路,共同提供全系(xi)統的RISC-V RAS原生架構方案。
安(an)全(quan)方面(mian),知合計(ji)算(suan)的(de)處理器(qi)采用了(le)基于CoVE的(de)高性(xing)能軟硬件(jian)系統安(an)全(quan)平臺,內(nei)核支(zhi)持MPT、CFI、安(an)全(quan)調(diao)試、Pointer masking等(deng)最新安(an)全(quan)特性(xing);軟件(jian)方面(mian),知合計(ji)算(suan)開(kai)發了(le)配套的(de)Firmware和全(quan)套安(an)全(quan)軟件(jian)棧。
可以看到,從芯片架構到上層算法、軟件的創新,知合計算真正讓這款處理器同時兼顧了通用計算和AI加速能力,使其具有在高性能計算領域落地和應用的潛力,在打破(po)RISC-V芯(xin)片性能天花板的同時,無疑給(gei)產(chan)業帶來了極大信心。
三、首秀驚艷行業跑出中國速度,RISC-V生態成長仍需產業合力
年輕(qing)的知合(he)計算,從成立(li)之初就瞄準了通推(tui)一體芯片這一方向,并在團隊的努力(li)下很快取得了階段性成果。
為了實現這一“北坡攀登珠峰”般的目標,知合計算組建了陣容豪華的團隊:董事長嚴曉浪教授為中國集成電路領域行業泰斗;作為國內RISC-V產業領軍人物的CEO孟建熠博士,是中國RISC-V工委會輪值會長,曾任阿里平頭哥副總裁;近期加入知合計算的CTO James Jiang在芯片領域深耕近30年,曾在阿里平(ping)頭哥擔任倚(yi)天(tian)項目負責人。
據了解,公司的核心研發負責人、研發骨干都有著20年左右的從業經驗,此前曾在阿里平頭哥、Intel、AMD、聯發科、博通和哲庫等國內外知(zhi)名芯片公司任要職(zhi)。
可以說,強大的(de)核心研(yan)發與管(guan)理團(tuan)隊是打勝仗的(de)關鍵支撐。
隨(sui)著(zhu)知合計算(suan)這(zhe)樣的黑(hei)馬創(chuang)(chuang)企在高性(xing)能計算(suan)領域趟出“通推(tui)一體”這(zhe)樣新的可行之路,以及(ji)越(yue)(yue)來(lai)越(yue)(yue)多的RISC-V芯(xin)片創(chuang)(chuang)企積極競爭、創(chuang)(chuang)新技術,RISC-V生態必然將(jiang)更快生長。
不論是在演講中還是在與孟博的交流中,我們都能清晰的感受到,知合計算并不是想單純“秀肌肉”,他們更多展示了基于RISC-V所做的技術創新以及背后對產業和技術發展的深入思考。
▲孟建熠博士在RISC-V中國峰會上演講
在(zai)挑戰高(gao)性能(neng)的(de)(de)這條(tiao)艱難道路上,有(you)一家公司,通過(guo)扎實(shi)的(de)(de)底層技(ji)術創新,將(jiang)RISC-V的(de)(de)性能(neng)天花板(ban)抬到一個(ge)新的(de)(de)高(gao)度(du),并與國內賽道的(de)(de)玩家一同分享背后的(de)(de)故事,讓行業(ye)更(geng)有(you)信心、更(geng)加(jia)積極地(di)加(jia)入到推(tui)動RISC-V生(sheng)態建(jian)設的(de)(de)行列(lie)中來,這是更(geng)為難能(neng)可貴的(de)(de)。
當然(ran),這件事不是靠一(yi)(yi)兩(liang)家(jia)公司短(duan)時間就可(ke)以實現的(de),據了(le)解,在知合計算(suan)研發高性能RISC-V芯片的(de)過程中,從應用場景(jing)的(de)實際需求出發,與多家(jia)一(yi)(yi)線云廠商進行了(le)協(xie)作(zuo),并在IP方(fang)面與眾(zhong)多合作(zuo)伙伴保持(chi)深度合作(zuo)。
一款優秀芯片的落地,必然是產業共同努力的結果。
對(dui)于(yu)RISC-V的(de)未(wei)來(lai)(lai),知合(he)計算的(de)團隊充滿信心。孟博做了一個形象的(de)比喻:如(ru)果x86像(xiang)是占(zhan)領了幾座主(zhu)要島嶼,那么RISC-V的(de)未(wei)來(lai)(lai)可能會(hui)是一片大海。在他(ta)看來(lai)(lai),“三分天下”是必然(ran)趨勢(shi),很可能會(hui)在未(wei)來(lai)(lai)5到10年(nian)內實現。
結語:RISC-V高性能計算嶄露頭角,中國AI算力產業奔涌向前
知合(he)計(ji)算(suan)高性(xing)能RISC-V CPU核的公布,給RISC-V生態發展注入了助推劑(ji),也讓產業看到了RISC-V在(zai)高性(xing)能計(ji)算(suan)領域加速應(ying)用落地的巨大潛力。
今天,國(guo)內AI算(suan)力(li)需求(qiu)(qiu)(qiu)持續增長,算(suan)力(li)需求(qiu)(qiu)(qiu)發生(sheng)結構性變(bian)化(hua)、推理(li)算(suan)力(li)需求(qiu)(qiu)(qiu)增速遠超預期,中國(guo)AI算(suan)力(li)產業(ye)不斷迎(ying)來新(xin)的機遇(yu)和挑戰,諸多優秀企業(ye)通過(guo)技術創(chuang)新(xin)破解算(suan)力(li)難題,加(jia)速AI的產業(ye)化(hua)落地。
隨著RISC-V生(sheng)態的(de)不(bu)斷完善,越(yue)來越(yue)多優秀產(chan)品的(de)涌(yong)現,AI時(shi)代(dai)新的(de)算(suan)力(li)底座,正在逐漸筑牢。RISC-V正從過去的(de)“點點繁星”走向AI時(shi)代(dai)的(de)“星辰大海(hai)”。