芯東西(公眾號:aichip001)
作者 |? GACS

9月14日(ri)~15日(ri),2023全球AI芯(xin)片(pian)峰會(GACS 2023)在深圳(zhen)市(shi)南山區圓(yuan)滿舉行(xing)。在9月14日(ri)AI芯(xin)片(pian)架構(gou)創新專場(chang)上,芯(xin)至科技(ji)聯合(he)創始(shi)人、首席芯(xin)片(pian)架構(gou)師兼副(fu)總裁尹文分享了主題為《AI計算新時代催生芯(xin)片(pian)架構(gou)走(zou)向“算力統(tong)一場(chang)”》的(de)主題演講。

尹文認為,進入AI新時代,算力創新不再僅僅是單個處理器微架構和芯片工藝的創新,而需要軟硬件全棧的系統架構全面創新,未來的創新機會來自以下方面:開放的通用指令架構,高效的融合加速器,異構互聯總線和芯片工程,開源算子庫、工具鏈和軟件

1、AI大模型落地到推理側的新機會與RISC-V架構創新不謀而合,RISC-V不僅可以(yi)做標量(liang)通用(yong)計算(suan),也可以(yi)做線(xian)程級并行的(de)AI計算(suan)。Scaler小標量(liang)+SIMT大算(suan)力(li)(li)的(de)指令(ling)集/微架構融合(he)將是未(wei)來RISC-V發力(li)(li)的(de)重(zhong)點,能以(yi)相(xiang)對低的(de)成本(ben),為AI推理側應用(yong)提(ti)供高效支持。

2、SoC芯片系統的有效算力依賴于計算核心或計算Die之間的高效互聯,通用算(suan)力(li)和(he)異(yi)構(gou)算(suan)力(li)需要(yao)在整個(ge)系(xi)統(tong)的(de)內存從邏輯上可(ke)(ke)以被(bei)統(tong)一(yi)為一(yi)個(ge)更(geng)大的(de)具有一(yi)致(zhi)性(xing)(xing)(xing)的(de)空(kong)間(jian)。低時延大帶寬的(de)一(yi)致(zhi)性(xing)(xing)(xing)總線互聯可(ke)(ke)以讓異(yi)構(gou)計(ji)算(suan)芯片(pian)更(geng)好更(geng)緊(jin)密(mi)的(de)協(xie)同,從而提(ti)高整個(ge)系(xi)統(tong)的(de)性(xing)(xing)(xing)能和(he)能效。

3、WoW (Wafer on Wafer)混合鍵合在新型芯片工程技術領域有重大價值。在他看來(lai),WoW可將AI Die和Memory Die垂直堆(dui)疊,以(yi)低于(yu)(yu)HBM一個量(liang)級的(de)(de)成本提供(gong)數倍于(yu)(yu)HBM的(de)(de)帶(dai)寬;對于(yu)(yu)大模(mo)型推理來(lai)說,4~6GB的(de)(de)Memory Die完(wan)全滿足Transformer一層網絡權重的(de)(de)存儲和層內(nei)高帶(dai)寬需求(qiu)。

基于此,芯至科技圍繞RISC-V開源指令架構、自研一致性總線、WoW 3DIC的架構創新,可以帶來10倍性價比的大模型AI推理芯片

展望更長期的未來,尹文相信基于RISC-V開源指令同構和微架構異構,開源軟件工具鏈及自主一致性總線和芯片工程創新,未來有機會推進到算力統一場。算力統一場將更利于(yu)形成(cheng)更大的自(zi)主可控軟件(jian)新生態(tai),并符(fu)合計(ji)算架構的原始(shi)特征(zheng),助力我國在計(ji)算體(ti)系(xi)方面換道(dao)超(chao)車。

以下為尹文的演講實錄:

首先謝謝主(zhu)辦方的(de)(de)邀請,還有(you)各(ge)位同行、各(ge)位嘉賓的(de)(de)參與。自(zi)從今年上半年大模(mo)型層(ceng)出不(bu)窮,從芯片架構領(ling)域(yu),各(ge)位同行都在(zai)(zai)一起(qi)討論,未來芯片在(zai)(zai)AI領(ling)域(yu)的(de)(de)架構怎么做、未來新的(de)(de)機會在(zai)(zai)哪里。今天我給(gei)大家帶(dai)來的(de)(de)演(yan)講就是我們團隊在(zai)(zai)這(zhe)一方面的(de)(de)思(si)考(kao)。

一、AI新時代對算力發展提出新要求:軟硬件全棧的系統架構全面創新

進入AI計算的(de)新時代(dai),怎(zen)么催(cui)生(sheng)芯片架構不停地(di)往前推?推向一個什么樣的(de)地(di)方?我們(men)提出(chu)了一個“算力統一場”的(de)概念(nian)。

首先看芯片架構的(de)創(chuang)新,摩爾定律的(de)一(yi)個(ge)根(gen)本(ben)特征就(jiu)是(shi)(shi)單(dan)(dan)位性(xing)能的(de)成本(ben)在線(xian)性(xing)下降(jiang),但最近幾(ji)年,單(dan)(dan)純憑(ping)工(gong)藝,到5nm、3nm之后,成本(ben)下降(jiang)并不(bu)是(shi)(shi)線(xian)性(xing)的(de)。我們怎么樣去延續這個(ge)線(xian)性(xing)的(de)性(xing)價比的(de)降(jiang)低?更多地是(shi)(shi)要(yao)靠(kao)軟硬件重(zhong)構。重(zhong)構的(de)一(yi)個(ge)頂層思想其實(shi)是(shi)(shi)來自第一(yi)性(xing)原理,要(yao)把原來的(de)架構不(bu)停地分(fen)解,再不(bu)停地重(zhong)構。

芯至科技尹文:拆解架構創新四大路徑,打造10倍性價比大模型推理芯片丨GACS 2023

從芯(xin)片架構的角度來(lai)看,我們看到了幾個(ge)機會:

第一個(ge)是(shi)開放的通用指令架構(gou),上個(ge)月(yue)(8月(yue)份)在(zai)北京的RISC-V峰會,各位同(tong)行有(you)很多的討論,RISC-V就是(shi)開源開放架構(gou)的典(dian)型(xing)代表。

第二(er)個是怎樣做一個高效(xiao)融合的加(jia)速器。大模型(xing)應(ying)用需要底層適應(ying)這些模型(xing)的算力架(jia)(jia)構(gou),算力架(jia)(jia)構(gou)怎樣融合在通用指令(ling)架(jia)(jia)構(gou)上,這是我們所面(mian)臨的機會,也是一個技術難題。

另(ling)外,現在處理器(qi)核越來越多,多Die互聯、異構(gou)互聯、存儲的(de)連接越來越復雜(za),怎樣有(you)一個異構(gou)互聯的(de)高(gao)效總線,還有(you)高(gao)效互聯的(de)I/O設(she)備的(de)一個新架(jia)構(gou),是未來AI芯片架(jia)構(gou)的(de)一個新方(fang)向。

最后,芯(xin)片(pian)的晶(jing)圓和Die越(yue)來越(yue)大,功耗(hao)越(yue)來越(yue)大,在提(ti)升它的性價(jia)比、能效上需要一個非常強(qiang)大的、可演進的一個芯(xin)片(pian)工(gong)程的支持,以及整(zheng)個算子庫、工(gong)具鏈和軟件的發(fa)展。

二、AI大模型推理新機會,與RISC-V架構創新不謀而合

大模型和RISC-V在(zai)最(zui)近幾年有很好的(de)結合(he),算法(fa)、算力、數據三架馬車要齊步往上推,我們(men)看(kan)到,在(zai)微(wei)架構和模型方面是同步發展的(de)。

左邊的圖是大(da)模型在(zai)快速發展,云端(duan)訓(xun)練的大(da)模型有點類(lei)似于一(yi)(yi)(yi)個人,首先從(cong)0到1,經過九年義務教育,形成完整的世(shi)界觀。未來(lai)這(zhe)些大(da)模型要(yao)在(zai)各(ge)行(xing)各(ge)業去應用,就好比大(da)家上了大(da)學(xue),選定一(yi)(yi)(yi)個專業,進入到一(yi)(yi)(yi)個行(xing)業。有句話叫“學(xue)好數(shu)(shu)理化(hua)”,數(shu)(shu)理化(hua)就是基礎,未來(lai)模型要(yao)不停地增加(jia)行(xing)業知識,那是一(yi)(yi)(yi)個fine-tuning(微調(diao))階段,意味著(zhu)更(geng)多的機會,大(da)模型在(zai)各(ge)個行(xing)業能夠不停部(bu)署,產生(sheng)真正的市場(chang)價值。

芯至科技尹文:拆解架構創新四大路徑,打造10倍性價比大模型推理芯片丨GACS 2023

從右邊的(de)(de)(de)圖可以(yi)(yi)看到,RISC-V的(de)(de)(de)Scaler部(bu)分,有一個通(tong)用開(kai)源的(de)(de)(de)超(chao)標量(liang)架(jia)(jia)(jia)構,可以(yi)(yi)幫助我們打造在處理器(qi)主機端的(de)(de)(de)軟硬件棧(zhan)的(de)(de)(de)基礎(chu)。另外基于RISC-V的(de)(de)(de)BSD協議,它(ta)有非常(chang)廣闊的(de)(de)(de)指令擴展(zhan)空間。在上面(mian)綠色和(he)紫(zi)色的(de)(de)(de)部(bu)分,我們可以(yi)(yi)自定(ding)義Vector(向量(liang))、Tensor Core(張(zhang)量(liang)核)這(zhe)(zhe)些單元(yuan),這(zhe)(zhe)是RISC-V的(de)(de)(de)指令框架(jia)(jia)(jia)所允許的(de)(de)(de)。然后我們可以(yi)(yi)在這(zhe)(zhe)個擴展(zhan)指令框架(jia)(jia)(jia)下,去(qu)實(shi)現各(ge)種各(ge)樣的(de)(de)(de)微架(jia)(jia)(jia)構,微架(jia)(jia)(jia)構就是芯(xin)片架(jia)(jia)(jia)構所具體實(shi)現的(de)(de)(de)電路(lu),包(bao)括矩陣乘、卷積等電路(lu)。

RISC-V所帶(dai)來的一個很大價(jia)值是上游性(xing)價(jia)比的急劇提升(sheng)。

舉個例子(zi),大家可(ke)能不(bu)知(zhi)道對OpenAI的Triton是(shi)否熟悉,現在(zai)有(you)很多(duo)年輕的朋友正在(zai)利用Triton這個工具(ju)來做AI算子(zi)自動化的開發。

Triton有全開源的(de)(de)(de)(de)(de)優勢,另外(wai)它可(ke)以通過自(zi)動(dong)化(hua)的(de)(de)(de)(de)(de)生(sheng)成工具,來生(sheng)成特定的(de)(de)(de)(de)(de)一(yi)些(xie)算(suan)子,比(bi)如(ru)說(shuo)浮點(dian)的(de)(de)(de)(de)(de)卷積或(huo)者是(shi)矩(ju)陣(zhen)乘。基本上它的(de)(de)(de)(de)(de)效率(lv)和手寫(xie)的(de)(de)(de)(de)(de)算(suan)子庫(ku)效率(lv)是(shi)相當的(de)(de)(de)(de)(de),比(bi)如(ru)說(shuo)一(yi)個(ge)FP16的(de)(de)(de)(de)(de)矩(ju)陣(zhen)乘,一(yi)個(ge)Python的(de)(de)(de)(de)(de)代(dai)碼可(ke)能就20多行,大家可(ke)以在網(wang)上找到(dao)很多例(li)子。

它(ta)支持像Python這(zhe)樣的(de)高(gao)級(ji)語言,可以極大降低(di)通過(guo)自(zi)定(ding)義指令學習類似CUDA這(zhe)樣編程框架(jia)的(de)成(cheng)本。按照現在Triton的(de)發展,相比CUDA,它(ta)在自(zi)動化算子(zi)生成(cheng)、內存優化、SM核心的(de)scheduling等方面有很好的(de)效果。

芯至科技尹文:拆解架構創新四大路徑,打造10倍性價比大模型推理芯片丨GACS 2023

Triton目前是(shi)和(he)整個RISC-V的(de)(de)生態(tai)圈、全球大的(de)(de)趨勢同(tong)步發展,發展速度非(fei)常快(kuai)。另外它也可以避免不兼(jian)容的(de)(de)指令,因為(wei)RISC-V整個行業(ye)在(zai)推進(jin),在(zai)生態(tai)建設上是(shi)齊(qi)頭(tou)并(bing)進(jin)。

我們(men)基于傳統的GPGPU方案會有大量自定義的算(suan)子(zi),并且要開發(fa)自己的編譯器。作為一個(ge)芯(xin)片公(gong)司,其實我們(men)在軟件的投入上反(fan)而會更大,包括在工具鏈、算(suan)子(zi)庫的開發(fa),很(hen)多軟件開發(fa)團隊可能高達70%~80%的規模。

如果(guo)采(cai)用(yong)開(kai)(kai)源指令和開(kai)(kai)源工具鏈這樣(yang)的(de)技(ji)術路線,首先(xian)RISC-V可以復用(yong)整個編譯(yi)器(qi)的(de)開(kai)(kai)放成果(guo),另外在客戶支持、算子(zi)開(kai)(kai)發(fa)這方面,有類(lei)似于(yu)像(xiang)Triton,還有未(wei)來會發(fa)展更多的(de)開(kai)(kai)源工具,可以自動化地生成第三方算子(zi),極大降(jiang)低軟件開(kai)(kai)發(fa)的(de)人力成本(ben)。

三、一致性總線使通用和異構算力緊密耦合,大幅提升有效算力

算力效率方面,我們提到了(le)“有(you)效算力”概(gai)念,跟芯(xin)片效率是非常(chang)相近(jin)的(de)概(gai)念。現在(zai)我們做芯(xin)片架構的(de)時(shi)候,在(zai)關注單核(he)的(de)算力、主(zhu)頻、流(liu)水線的(de)能力。并且我們還要看在(zai)一張晶(jing)圓上可以(yi)做多少(shao)Chiplet的(de)Die,Chiplet集成得越多,算力、核(he)數也會越多越大(da)。

但(dan)大家可能(neng)忽略了(le)一點,就(jiu)是我們的SoC,把那么多核互(hu)聯起來,包括(kuo)die-to-die的Chiplet互(hu)聯,還有CPU和GPU這樣(yang)(yang)類(lei)似(si)于(yu)NVLink、CXL這樣(yang)(yang)的異構互(hu)聯,它的效率問題。

我(wo)們(men)要關注這么幾個指標(biao),包(bao)括總線的(de)時延、帶寬、一致(zhi)(zhi)性的(de)能力。可能大(da)家對一致(zhi)(zhi)性的(de)理(li)解(jie)不是(shi)(shi)(shi)特別(bie)多,它就好比部門(men)越(yue)來(lai)越(yue)多,雖(sui)然團(tuan)隊的(de)實力和規(gui)模越(yue)來(lai)越(yue)大(da),但是(shi)(shi)(shi)并不代表這么多團(tuan)隊產(chan)生的(de)有(you)效(xiao)(xiao)績效(xiao)(xiao)能夠(gou)越(yue)來(lai)越(yue)強,需要各部門(men)的(de)互聯互通、能夠(gou)目標(biao)一致(zhi)(zhi)。這個一致(zhi)(zhi)性也是(shi)(shi)(shi)一樣的(de),我(wo)們(men)有(you)那么多的(de)CPU核(he)、AI核(he),包(bao)括同構(gou)、異構(gou)的(de)核(he),怎么保證處理(li)任務的(de)一致(zhi)(zhi)性。最(zui)后是(shi)(shi)(shi)功耗,它的(de)能效(xiao)(xiao)也非(fei)常(chang)重要。

芯至科技尹文:拆解架構創新四大路徑,打造10倍性價比大模型推理芯片丨GACS 2023

當前業界(jie)在(zai)總(zong)線方面(mian)(mian)的發(fa)展,包(bao)括Die內的Ring/Crossbar總(zong)線架構,還包(bao)括最近(jin)英(ying)偉達在(zai)Grace芯(xin)片里自研開(kai)發(fa)的Scalable Coherency Fabric,都是在(zai)總(zong)線上面(mian)(mian)的一(yi)些(xie)技(ji)術探(tan)索。

剛(gang)才很多同行也介(jie)紹了die-to-die(D2D)、Chiplet、并行、UCIe等各種D2D互聯總(zong)線,怎(zen)么樣提(ti)高它的(de)(de)效率,以及我們在一(yi)個(ge)大的(de)(de)集群里面怎(zen)么樣把(ba)異(yi)構的(de)(de)芯片通過Switch互聯起(qi)來,這更多是一(yi)個(ge)系統上的(de)(de)概念。

一致(zhi)性總(zong)線(xian)最終的(de)目的(de)是為了通用(yong)和異構,就(jiu)是各種算力(li)能夠有效(xiao)互聯,來提高它的(de)有效(xiao)算力(li)。

四、芯片工程新技術突破內存墻瓶頸,極大降低帶寬成本

說完互聯墻,接下(xia)來(lai)(lai)就是大(da)(da)家談論(lun)比較多(duo)的(de)(de)內存墻。在(zai)AI芯片,我(wo)們當前的(de)(de)方案更(geng)加依賴于HBM這種大(da)(da)帶寬的(de)(de)內存。HBM跟CoWoS相(xiang)結合,在(zai)擴展(zhan)帶寬的(de)(de)時候(hou),線性(xing)擴展(zhan)帶來(lai)(lai)成本的(de)(de)極大(da)(da)增長。怎么樣把(ba)AI的(de)(de)邏(luo)輯Die跟內存Die有更(geng)緊(jin)密的(de)(de)連接,把(ba)帶寬成本降下(xia)來(lai)(lai)?

現在(zai)我們可(ke)以(yi)看到,Hybrid Bonding異(yi)構鍵合技術在(zai)快(kuai)速發展。基于Hybrid Bonding技術,我們可(ke)以(yi)實現Wafer-on-Wafer(WoW)的垂直互(hu)聯,就(jiu)像從三樓到四(si)樓可(ke)以(yi)有上萬部電梯,這樣(yang)我們會(hui)場(chang)這么多人,吞吐率就(jiu)會(hui)非常大。

我們芯(xin)至(zhi)科(ke)技(ji)和合作伙伴一(yi)起(qi),現(xian)在已經可(ke)以(yi)做到在兩個(ge)Die有70000多(duo)個(ge)pins互聯(lian)(lian),相當(dang)于(yu)(yu)有這么多(duo)部電(dian)梯互聯(lian)(lian)互通(tong),容(rong)量可(ke)以(yi)做到6GB,相當(dang)于(yu)(yu)我的(de)(de)AI邏(luo)輯(ji)Die和內存(cun)Die可(ke)以(yi)實現(xian)非常短距(ju)的(de)(de)、大帶寬的(de)(de)互聯(lian)(lian)互通(tong)。

芯至科技尹文:拆解架構創新四大路徑,打造10倍性價比大模型推理芯片丨GACS 2023

由于我(wo)們(men)可以不用那么大的(de)(de)Die,我(wo)們(men)可以極大降低WoW這(zhe)樣一個(ge)內存架構(gou)的(de)(de)成本,從計算效率來(lai)看(kan),雖然HBM的(de)(de)容量比較大,但實(shi)際上在大模型Transformer方面(mian),網絡是(shi)分層的(de)(de)。

可(ke)以看右邊的表格,剛才提(ti)到大模型(xing)未來進入行(xing)業部(bu)署更多是微調,它(ta)的模型(xing)參(can)數(shu)并沒有像ChatGPT或者GPT-4、5未來指數(shu)級的增長,單層參(can)數(shu)量可(ke)以放在WoW這(zhe)樣一個DRAM存儲空間上。在容量夠的情況下,實際(ji)上就(jiu)可(ke)以體現WoW這(zhe)樣一個大帶寬的巨大優勢。

五、圍繞三大方向構建創新架構,打造約10倍性價比優勢的大模型推理芯片

小(xiao)結一下,在(zai)AI架構創新(xin)方面(mian),作為芯(xin)片架構師(shi),我們還有很多(duo)事情(qing)可以(yi)做:

一方面,開放的指令架構。我們(men)可(ke)以(yi)重(zhong)新來認識一(yi)下(xia)RISC-V,它可(ke)以(yi)做(zuo)(zuo)CPU,大(da)(da)家可(ke)能(neng)熟知的(de)是x86指令(ling)(ling)、Arm指令(ling)(ling),RISC-V就是下(xia)一(yi)代新生(sheng)的(de)CPU指令(ling)(ling)架構。但我們(men)基于RISC-V也可(ke)以(yi)做(zuo)(zuo)SIMT的(de)架構,實現GPGPU的(de)功能(neng)。在通過RISC-V做(zuo)(zuo)GPGPU的(de)過程中(zhong),我們(men)可(ke)以(yi)最大(da)(da)地復用RISC-V這個開(kai)源指令(ling)(ling),包括它的(de)開(kai)源工具、整個軟件復用度,就可(ke)以(yi)極大(da)(da)降低(di)在做(zuo)(zuo)自定義(yi)芯(xin)片的(de)情(qing)況下(xia),我們(men)要有(you)大(da)(da)量的(de)人力成本。

第二,高效的異構互聯,在自研一(yi)致性(xing)總線方(fang)面(mian),我(wo)們更多要有(you)一(yi)個(ge)(ge)系(xi)統框(kuang)(kuang)架,怎么(me)樣把Die內的互(hu)聯、D2D Fabric、整個(ge)(ge)Chip-to-Chip的互(hu)聯納入到一(yi)個(ge)(ge)完整的一(yi)致性(xing)框(kuang)(kuang)架下,并(bing)且在物理上、在芯片工程上降低時延,提升帶寬,這是(shi)我(wo)們要發力的重(zhong)點。

第三,新型的芯片工程,在(zai)內存墻方面(mian),我們怎么樣把AI Die通過WoW、Hybrid Bonding這(zhe)樣的(de)技術(shu),把帶(dai)寬(kuan)做上(shang)去,未來是(shi)能夠(gou)替代HBM、CoWoS封裝等高成本方式的(de)最佳途徑(jing)。

所(suo)以(yi)我(wo)們團隊現在在考慮(lv),在當前的(de)大模型(xing)推理芯(xin)(xin)片架構上(shang),在軟硬件結合(he)還有芯(xin)(xin)片工(gong)程上(shang)的(de)創(chuang)新,來打造具有10倍(bei)性價比(bi)以(yi)上(shang)的(de)創(chuang)新芯(xin)(xin)片。

結語:重構計算體系結構,打造算力統一場,發展軟件大生態

中長期愿景,算力統一(yi)場。首先可(ke)以看(kan)到中間這個(ge)圖,在整(zheng)個(ge)RISC-V指令規劃基礎下,我(wo)們(men)在這個(ge)圓(yuan)圈的內部可(ke)以做很(hen)多(duo)事情。

芯至科技尹文:拆解架構創新四大路徑,打造10倍性價比大模型推理芯片丨GACS 2023

我們的DSA和通用(yong)架構,實際上是(shi)(shi)一個循環(huan),在80年代的時(shi)候,當時(shi)一個叫牧村(cun)的日本人(ren)提出的“牧村(cun)定律”,就(jiu)是(shi)(shi)從專用(yong)到通用(yong)這個循環(huan)的規律。RISC-V的整體指令架構是(shi)(shi)統一或同構的,但我們可以在微架構做很(hen)多事情,包(bao)括(kuo)SIMT、DSP、DSA的核心等,來(lai)發揮RISC-V在整個開(kai)放指令上的優勢。

另(ling)外一點,開源工(gong)具(ju)鏈,就像我剛才(cai)給大(da)家介紹的(de)(de)(de)OpenAI所做的(de)(de)(de)Triton的(de)(de)(de)例(li)子(zi)(zi),大(da)家可(ke)以多去看看,Triton在整個(ge)社區非(fei)常活躍。未來會有(you)更(geng)多像Triton這樣(yang)的(de)(de)(de)開源工(gong)具(ju)發(fa)(fa)展,結合RISC-V微觀指(zhi)令(ling)的(de)(de)(de)發(fa)(fa)展,在整個(ge)指(zhi)令(ling)、自定(ding)義(yi)算子(zi)(zi)、編譯(yi)器方面,有(you)很大(da)的(de)(de)(de)性價比提(ti)升。

從微架構(gou)異構(gou)和指(zhi)令集同構(gou)、開源工(gong)具鏈、在SoC層面的一致性總線還有(you)芯片工(gong)程方面,我們有(you)機(ji)會在未來(lai)打(da)造一個軟硬(ying)件(jian)同構(gou)的新(xin)生態。

這個新生態(tai)更(geng)加(jia)有(you)(you)利于(yu)(yu)在(zai)(zai)國(guo)(guo)內形(xing)成一個更(geng)大的、自主可控的軟件生態(tai),并且在(zai)(zai)芯片架構(gou)領域(yu)更(geng)加(jia)符合計算(suan)架構(gou)本身原生態(tai)的架構(gou),有(you)(you)助(zhu)于(yu)(yu)在(zai)(zai)計算(suan)領域(yu)幫助(zhu)我國(guo)(guo)在(zai)(zai)計算(suan)體系方面做到換(huan)道(dao)超車。

大家(jia)知道(dao)當前的(de)CPU、GPU的(de)計算(suan)(suan)架構(gou)和生(sheng)態是(shi)建立和發展(zhan)主(zhu)要在(zai)國外(wai),國外(wai)特(te)別是(shi)硅谷有(you)很多行業前輩奠定了在(zai)傳(chuan)統計算(suan)(suan)架構(gou)上面(mian)的(de)基(ji)礎。在(zai)未來(lai)算(suan)(suan)力統一場的(de)新(xin)(xin)方向,我(wo)們(men)可(ke)以做(zuo)很多自主(zhu)可(ke)控的(de)架構(gou)創新(xin)(xin)。在(zai)AI新(xin)(xin)時代新(xin)(xin)機遇的(de)引領下,希望我(wo)們(men)團隊(dui)和整個芯(xin)片行業同(tong)(tong)仁一起,能夠(gou)把算(suan)(suan)力同(tong)(tong)一場的(de)愿景不斷地(di)做(zuo)好、做(zuo)遠,共同(tong)(tong)實現計算(suan)(suan)新(xin)(xin)生(sheng)態。謝謝大家(jia)!

以上是尹文演講內容的完整整理。