
智東西(公眾號:zhidxcom)
文 | 王穎
智(zhi)東西9月11日(ri)報(bao)道,今天科大訊飛正(zheng)式發布了智(zhi)能錄音筆SR301青春(chun)版(ban),拾音距離可達10米,能夠中英文(wen)邊(bian)錄邊(bian)譯。
科大訊飛副總裁李傳(chuan)剛介紹,智(zhi)能錄音筆SR301青春版,主要(yao)適用于學生群體,設計時尚,有粉(fen)色、黑色兩(liang)款,售(shou)價999元。
訊飛智能錄音筆SR301青春版,采用3英寸(cun)觸摸屏(ping),厚12.2毫(hao)米,重110克,最(zui)長(chang)續航10小時。它配備(bei)了(le)1+4麥克風陣列,可多角(jiao)度拾音,有8GB內(nei)存。
科大(da)訊飛輪值(zhi)總裁胡郁也來到了現場(chang),介紹了科大(da)訊飛智能錄音筆(bi)三年來的(de)研發經歷,和取(qu)得的(de)成績。
一、5分鐘完成1小時錄音轉換
訊(xun)飛智能(neng)錄音筆SR301青春版,支(zhi)持語音實時轉(zhuan)文字,5分(fen)鐘內可以將1小時的(de)錄音轉(zhuan)換(huan)成文字稿。
目前市場上(shang)的錄音筆產品,大部分都是通過語(yu)音聽(ting)寫(xie)轉寫(xie)成(cheng)文字,訊飛智能錄音筆SR301青春(chun)版采用的是語(yu)音轉寫(xie),適(shi)用于較(jiao)遠距離(li)、較(jiao)長時間的人機(ji)交互,算法上(shang)也有很(hen)大提升(sheng)。
訊飛智能(neng)錄音筆SR301青(qing)春版錄音的過(guo)程中,使用者還可以(yi)通(tong)過(guo)觸屏(ping)一鍵自(zi)定義標記重(zhong)點(dian)內容,在結束錄音后(hou)通(tong)過(guo)語音搜索查(cha)找標記的重(zhong)點(dian)內容。
二、1+4麥克風陣列,拾音距離10米
訊飛智能(neng)錄音(yin)筆SR301青春版采用了(le)1+4麥克風(feng)陣(zhen)(zhen)列(lie)設(she)計,在語(yu)音(yin)功能(neng)方面,1+4的(de)(de)麥克風(feng)陣(zhen)(zhen)列(lie),能(neng)夠遠(yuan)距離降噪(zao),從多角度拾音(yin),語(yu)音(yin)錄制(zhi)也更加清晰,訊飛錄音(yin)筆SR301青春版的(de)(de)拾音(yin)距離達到了(le)10米,文字轉(zhuan)換準(zhun)確率達98%。
訊(xun)飛錄(lu)音(yin)(yin)筆(bi)(bi)SR301青(qing)春版的(de)語音(yin)(yin)識別(bie)(bie)框架,能夠(gou)同時針(zhen)對(dui)整(zheng)(zheng)句語音(yin)(yin)識別(bie)(bie)結(jie)果進(jin)行口語規整(zheng)(zheng)操(cao)作,智能過濾語氣(qi)詞(ci)、調整(zheng)(zheng)詞(ci)序(xu)。在現場嘉賓發(fa)言時,訊(xun)飛錄(lu)音(yin)(yin)筆(bi)(bi)也同時做了(le)演示(shi),現場展(zhan)示(shi)了(le)實(shi)時錄(lu)音(yin)(yin)轉(zhuan)換和智能糾(jiu)錯。
中英文(wen)(wen)的(de)邊(bian)錄(lu)(lu)邊(bian)譯功能(neng)搭載智(zhi)能(neng)翻譯引擎(qing),支持英文(wen)(wen)錄(lu)(lu)音(yin)轉(zhuan)(zhuan)換中文(wen)(wen)文(wen)(wen)字,使用TTS語(yu)音(yin)合成技術,可以直接使用耳(er)機(ji)聽雙語(yu)轉(zhuan)(zhuan)換的(de)錄(lu)(lu)音(yin)。
三、機器對語言的理解是認知智能的關鍵
科(ke)大(da)(da)訊(xun)(xun)飛(fei)(fei)輪值總裁胡郁表示(shi),今年(nian)正好是科(ke)大(da)(da)訊(xun)(xun)飛(fei)(fei)創辦(ban)的20周年(nian),科(ke)大(da)(da)訊(xun)(xun)飛(fei)(fei)在(zai)這20年(nian)里逐步認識到,人工智能正在(zai)改變世界。科(ke)大(da)(da)訊(xun)(xun)飛(fei)(fei)利用多模態(tai)識別、圖像識別、語(yu)音識別等技術(shu)進入了手機、汽車等領域。
胡郁(yu)說:“2013年,我們提出了感(gan)知智(zhi)能(neng)和(he)認(ren)知智(zhi)能(neng),并被廣泛接受。”他(ta)表示,對于人工智(zhi)能(neng)來(lai)說,實現(xian)機器對語言的理解是認(ren)知智(zhi)能(neng)的關鍵。他(ta)還在現(xian)場(chang)演示了錄(lu)音筆(bi)的語音搜索功能(neng),成功播放了春晚和(he)新聞聯播等(deng)節目(mu)。
現場,科大訊飛副總裁李傳(chuan)剛分享了訊飛智能錄音(yin)筆的(de)(de)(de)使(shi)用(yong)數據。他(ta)介紹到,72%的(de)(de)(de)用(yong)戶(hu)每(mei)周使(shi)用(yong)訊飛智能錄音(yin)筆的(de)(de)(de)頻次超過3次,50%的(de)(de)(de)用(yong)戶(hu)單(dan)次使(shi)用(yong)時(shi)長超過1小時(shi)。
結語:智能錄音筆應滿足不同場景需求
科大(da)訊飛的智(zhi)能(neng)(neng)錄(lu)(lu)(lu)(lu)音筆(bi)支持邊錄(lu)(lu)(lu)(lu)邊譯、中(zhong)英文實時互(hu)轉(zhuan)、實時重(zhong)點標注等功能(neng)(neng),可以在(zai)(zai)10米(mi)內準確拾音,1+4的麥克風(feng)陣列設計能(neng)(neng)從多角度(du)錄(lu)(lu)(lu)(lu)音,語音識(shi)別(bie)的準確性得到了很大(da)提升(sheng)。訊飛智(zhi)能(neng)(neng)錄(lu)(lu)(lu)(lu)音筆(bi)SR301青春版,在(zai)(zai)記(ji)錄(lu)(lu)(lu)(lu)效率上也(ye)有了重(zhong)大(da)提升(sheng),能(neng)(neng)在(zai)(zai)5分鐘內完成1小時錄(lu)(lu)(lu)(lu)音的文字(zi)轉(zhuan)換。
語音翻譯功能(neng)還(huan)存(cun)在(zai)語音識別(bie)慢、翻譯不(bu)準(zhun)和(he)文字轉換耗時長三大痛點(dian)。目前來看(kan),智能(neng)錄音筆在(zai)技術上(shang)仍需(xu)要(yao)不(bu)斷(duan)的突破,數據、算法方面還(huan)需(xu)要(yao)更多(duo)的研(yan)發投入才能(neng)滿足(zu)消費者(zhe)在(zai)不(bu)同場(chang)景下的需(xu)求。