實(shi)(shi)時(shi)(shi)語音(yin)(yin)識別(bie)是(shi)一種能夠將實(shi)(shi)時(shi)(shi)音(yin)(yin)頻(pin)(pin)流轉換為文字(zi)的技術,通(tong)過(guo)語音(yin)(yin)識別(bie)模型(xing)將人類語音(yin)(yin)轉化為可識別(bie)的文本形式。要實(shi)(shi)現(xian)高質量的實(shi)(shi)時(shi)(shi)語音(yin)(yin)識別(bie)并不(bu)容易,通(tong)常包含音(yin)(yin)頻(pin)(pin)獲取、音(yin)(yin)頻(pin)(pin)預處(chu)理、特(te)征(zheng)(zheng)提取、特(te)征(zheng)(zheng)分(fen)析與識別(bie)、解碼轉錄以及后處(chu)理輸出等一系(xi)列復雜的步驟(zou)。

而在我(wo)們日常(chang)生活和工作中的線上會議、多人交互等(deng)場(chang)景下(xia),需要同時(shi)處理(li)多個人的音頻流(liu),并實(shi)現超低延遲、多人并發、實(shi)時(shi)準確的語音識別,更是面臨諸(zhu)多挑戰。

首先在(zai)計算層面,由于需要同時處理多個語(yu)音數(shu)據(ju)流,并(bing)及時響應,因此需要大(da)量高(gao)性能且靈活可(ke)擴展(zhan)的(de)計算資源支(zhi)持。同時,多人并(bing)發的(de)情況下,需要傳(chuan)輸大(da)量的(de)語(yu)音數(shu)據(ju)。如(ru)果數(shu)據(ju)傳(chuan)輸延遲(chi)較(jiao)高(gao),則(ze)會影響語(yu)音識(shi)別的(de)實時性。此外,如(ru)果數(shu)據(ju)傳(chuan)輸過程中出現丟(diu)包、誤碼等問題(ti),也(ye)會對語(yu)音識(shi)別的(de)結果產生一定的(de)影響。

因(yin)此,要(yao)(yao)實現超低延遲大(da)并發實時智能語音識別(bie),不(bu)僅需要(yao)(yao)進(jin)行(xing)優化算(suan)法,以(yi)提(ti)高計算(suan)效率、降低計算(suan)資源消耗,同(tong)時還要(yao)(yao)優化數據通信協議(yi),提(ti)高數據傳輸(shu)效率。

Achronix與Myrtle.ai共(gong)同(tong)推出了超低(di)延(yan)(yan)遲大并(bing)發實時智能語音識(shi)別方(fang)(fang)案(an)。該方(fang)(fang)案(an)的硬件(jian)平臺采用(yong)基于Achronix Speedster7t FPGA的VectorPath加速(su)卡和x86架構服(fu)務器(qi)來實現,可(ke)以同(tong)時支持多達4000個RTS,在保證低(di)延(yan)(yan)遲的同(tong)時識(shi)別正(zheng)確率(lv)高于90%,且相比(bi)ASR云(yun)服(fu)務成(cheng)本(ben)大大降(jiang)低(di)。

VectorPath加速卡搭載Achronix 7nm Speedster7t FPGA,同時集成(cheng)了400G以太(tai)網接(jie)口(kou)、多(duo)(duo)個PCIe接(jie)口(kou)和(he)高帶寬GDDR6存儲器(qi)接(jie)口(kou)等(deng)一(yi)系(xi)列先進(jin)(jin)的(de)I/O接(jie)口(kou),傳輸速率可達32GT/S。Speedster7t FPGA集成(cheng)了高密度(du)機(ji)器(qi)學習處理器(qi)(MLP)陣列和(he)二維片上網絡(2D NoC)。其中,MLP除了浮點乘加運算(suan)(suan),還支持對多(duo)(duo)種(zhong)定浮點數格式(shi)進(jin)(jin)行拆分(fen)和(he)組(zu)合運算(suan)(suan),能夠為AI和(he)數據密集型計(ji)算(suan)(suan)提供ASIC級的(de)計(ji)算(suan)(suan)速度(du)。而(er)2D NoC可以沿著(zhu)行/列在FPGA結構(gou)中或向著(zhu)邊緣(yuan)接(jie)口(kou)高速移動數據,進(jin)(jin)而(er)釋放更多(duo)(duo)的(de)邏輯單元用于計(ji)算(suan)(suan)任務。

10月24日19點,Achronix聯合智猩猩策劃的「Achronix加速實時語音識別技術公開課」將開講,由Achronix資深現場應用工程師黃侖主講,主題為《超低延遲大并發實時智能語音識別加速方案》。

此(ci)次公(gong)開課,黃(huang)侖(lun)(lun)首先(xian)會(hui)從概念、應用場景、面臨的(de)問題等維(wei)度對(dui)實(shi)時智能(neng)語(yu)音(yin)識(shi)別(bie)(bie)技術進(jin)行介(jie)紹,之后(hou)他將講解超低(di)延遲大(da)并(bing)發實(shi)時智能(neng)語(yu)音(yin)識(shi)別(bie)(bie)方(fang)案(an),并(bing)對(dui)其硬件(jian)平臺中基(ji)于(yu)Achronix Speedster7t FPGA的(de)VectorPath加速卡進(jin)行重點解讀。最后(hou),黃(huang)侖(lun)(lun)還會(hui)分享超低(di)延遲大(da)并(bing)發實(shi)時智能(neng)語(yu)音(yin)識(shi)別(bie)(bie)方(fang)案(an)的(de)優勢(shi)和落地(di)案(an)例。

Achronix黃侖:超低延遲大并發實時智能語音識別加速方案|公開課預告

公開課內容

主題:FPGA加速超低延遲大并發實時智能語音識別
提綱:
1、實時智能語音識別技術概述
2、超低延遲大并發實時智能語音識別方案
3、基于Speedster7t FPGA的VectorPath加速卡解析
4、方案優(you)勢與落地案例

主講人:

黃侖, Achronix資深(shen)現場(chang)應用工程師(shi),擁(yong)有上海交通(tong)大學通(tong)信工程碩士(shi)學位,目前(qian)主要負責華東地區的(de)客戶(hu)技術(shu)支(zhi)持。于2017年(nian)加入(ru)Achronix,擁(yong)有15年(nian)以上的(de)FPGA相(xiang)關研發和市場(chang)經驗。

課程信息

直播時間:10月24日19:00
直播地點:智(zhi)猩猩直播間