智東西(公眾號:zhidxcom)
作者 | 韋世瑋
編輯 | 漠影

經(jing)歷過一年的新冠疫(yi)情影響,線(xian)上辦公(gong)和在(zai)(zai)線(xian)學習成為不少(shao)(shao)人(ren)的生活新常(chang)態(tai),這大(da)大(da)刺激了K12在(zai)(zai)線(xian)教培行(xing)業(ye),線(xian)上教育火(huo)了,不少(shao)(shao)科技公(gong)司則瞄準兒童及學生的學習剛(gang)需,推出各(ge)式各(ge)樣的軟硬件學習工具。

擁有17年AI教育布局經驗的科大訊飛,就是這股浪潮中的重要參與者之一。

目前,訊(xun)飛(fei)已推出了訊(xun)飛(fei)智(zhi)能(neng)(neng)學習機、訊(xun)飛(fei)口(kou)袋打印機等人工智(zhi)能(neng)(neng)學習輔(fu)助產品,因(yin)材施(shi)教(jiao)地幫(bang)助孩(hai)子(zi)高效(xiao)掌握知(zhi)識(shi),節省家長(chang)和(he)老師(shi)大量輔(fu)導時間。

基于(yu)系統化(hua)的AI教育布局(ju),在2020年財年中,訊飛(fei)的教育教學(xue)業務實現1.67億(yi)人民幣營收(shou),同比增長16.77%。但學(xue)無止境,訊飛(fei)在AI教育中的布局(ju)也(ye)不(bu)止于(yu)此。

去年10月,訊飛針對學生在英語生詞學習中的聽、說、讀、記全學習場景,推出了訊飛掃描詞典筆,只需筆頭在紙面上輕輕一掃,0.5秒就能查閱英文生詞,掃描識別準確率達99%,還能進行模擬真人對話練習。

據悉,這款訊飛(fei)掃描詞典筆一經首銷就售罄,足以見消(xiao)費(fei)者(zhe)對它的(de)(de)喜愛,而(er)這個成績的(de)(de)背后與訊飛(fei)在AI語音及圖像技術領域的(de)(de)長(chang)期積累息息相關。

為此,智東西與科大訊飛消費者AI學習業務部總經理翟吉博進(jin)行了深(shen)入交流(liu),在更好地了解訊(xun)飛(fei)掃描(miao)詞典筆(bi)背后(hou)的核心技(ji)術亮點的同時(shi),也進(jin)一(yi)步揭開(kai)訊(xun)飛(fei)在AI教育賽道布局(ju)的思考與邏(luo)輯。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

▲科大訊飛消費(fei)者AI學習業務部總經理翟吉博

一、AI語音技術城池的構建,中英文識別正確率達99%

訊飛掃描詞典筆(bi)的(de)背后,涵蓋了訊飛從語(yu)(yu)音到視覺,從NLP(自(zi)然語(yu)(yu)言處理)到醫學影像(xiang)、手勢識別等領域(yu)的(de)豐富AI技術。

“從用戶使用過(guo)程到(dao)后臺處(chu)(chu)理的邏輯來看,訊飛掃描(miao)詞典筆的工作本質(zhi)上是一個(ge)信息輸入輸出(chu)處(chu)(chu)理的過(guo)程。”翟吉博談到(dao),詞典掃描(miao)筆的技術鏈(lian)條是呈衰減關系(xi),需要一個(ge)端到(dao)端的完(wan)整良好體驗,每一步環節都處(chu)(chu)理好才(cai)能達(da)到(dao)符合用戶預期(qi)的效(xiao)果。

我們(men)也親自體驗了一下訊(xun)飛(fei)掃(sao)描詞(ci)典筆(bi),看(kan)看(kan)它(ta)的英文識別(bie)翻譯是不(bu)是真的那么牛。一上手,訊(xun)飛(fei)詞(ci)典筆(bi)的體積雖然比一般手寫筆(bi)大了些,但(dan)握起來手感也不(bu)錯(cuo)。

當我(wo)握住筆頭輕輕在紙面上(shang)一摁,筆頭的(de)識別(bie)(bie)燈就會(hui)亮起,接著(zhu)我(wo)就像平常做高亮記號(hao)一樣勻(yun)速(su)滑過想要(yao)識別(bie)(bie)的(de)英(ying)文(wen)段落,在我(wo)持續(xu)(xu)滑過文(wen)字的(de)同時,掃(sao)描筆屏幕上(shang)也(ye)會(hui)陸續(xu)(xu)跳躍出我(wo)識別(bie)(bie)的(de)英(ying)文(wen)內容。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

接著在我掃描(miao)結束1秒(miao)不到(dao),屏幕就已經完整(zheng)顯示我掃描(miao)的英(ying)文段落及(ji)中文翻(fan)譯(yi),同時還會(hui)有機器語音朗讀一遍(bian),可自由選(xuan)擇英(ying)美發音,從掃描(miao)到(dao)翻(fan)譯(yi)完畢的整(zheng)個(ge)過(guo)程僅需短短幾秒(miao)。

之后我在和翟吉博溝通過程中才發現,這短短幾秒的識別過程背后,其實是許多AI技術環環相扣,才將紙面上的文字呈現在小小的掃描筆屏幕上。通俗來講,這一過程大致要經歷4個步驟:

1、當我掃描(miao)(miao)英文時,訊飛掃描(miao)(miao)詞典筆(bi)會利用(yong)圖(tu)像(xiang)高速掃描(miao)(miao)技術(shu),將紙面上的(de)(de)打(da)印或手寫文字快速拍成(cheng)圖(tu)片。但這和(he)手機的(de)(de)一次性成(cheng)像(xiang)不同,前者(zhe)是基(ji)于(yu)用(yong)戶“掃描(miao)(miao)”的(de)(de)動作過(guo)程,通(tong)過(guo)前端的(de)(de)圖(tu)像(xiang)拼(pin)接算(suan)法將一幀(zhen)幀(zhen)的(de)(de)圖(tu)片拼(pin)接起來。

2、圖像(xiang)拼(pin)接完畢后,就進入轉(zhuan)文(wen)字(zi)識(shi)別過程(cheng),需利用到(dao)OCR(Optical Character Recognition,光(guang)學(xue)字(zi)符(fu)識(shi)別)技(ji)術,將圖像(xiang)中的(de)信息全部(bu)識(shi)別轉(zhuan)換成文(wen)字(zi)。

翟吉博稱,在這個過程中,訊飛OCR技術的中英文識(shi)別率準確率均能(neng)達到99%以(yi)上,對中文生僻(pi)字或形(xing)近字的識(shi)別準確率約95%以(yi)上。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

3、轉換成文(wen)本(ben)(ben)后(hou),設(she)備(bei)就(jiu)通(tong)過機器翻(fan)(fan)譯技術將英文(wen)單詞或句子(zi)翻(fan)(fan)譯為(wei)中文(wen),其中對整個文(wen)本(ben)(ben)的翻(fan)(fan)譯也涉(she)及到(dao)了機器閱(yue)讀(du)理解技術,中英翻(fan)(fan)譯效果(guo)能堪(kan)比專業八級水平。

4、完(wan)成文本(ben)翻譯并(bing)不意味著結束(shu),訊(xun)飛掃描詞典筆還需(xu)進行一些(xie)拓展功能。例如,它(ta)需(xu)要(yao)進一步學習單(dan)詞,除了中(zhong)文意思外還需(xu)掌握(wo)單(dan)詞的發音,并(bing)基于這個單(dan)詞拓展更多的相關知識(shi)點推薦給(gei)用戶,或者(zhe)幫助用戶糾正單(dan)詞讀(du)音。

這個過(guo)程(cheng)既(ji)應(ying)用(yong)到(dao)了常識推理(li)和(he)知識發現技(ji)術,也運用(yong)到(dao)了機器口語評測、聲音(yin)定位與(yu)檢測等技(ji)術。而(er)一個單詞(ci)(ci)從掃(sao)描到(dao)結(jie)果的(de)呈現,整個響應(ying)過(guo)程(cheng)只需(xu)0.5秒,速度是翻閱紙質(zhi)詞(ci)(ci)典的(de)20倍以上(shang)。如果像我(wo)一樣掃(sao)描英文段落,完成掃(sao)描后(hou)的(de)響應(ying)過(guo)程(cheng)則(ze)穩定在1秒之(zhi)內(nei)。

與此同時,訊飛(fei)掃描詞典筆還能(neng)實(shi)現離線(xian)查(cha)詞翻譯,用戶無需聯網也(ye)能(neng)使用掃描查(cha)詞、語(yu)音翻譯、跟讀評測(ce)、例句朗讀等功能(neng)。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

實際上,訊(xun)(xun)飛掃描詞典筆與訊(xun)(xun)飛其他硬件產(chan)品的(de)(de)底(di)層技術(shu)是具有通用性的(de)(de),不(bu)少核心技術(shu)的(de)(de)研發(fa)都復(fu)用了訊(xun)(xun)飛的(de)(de)核心研發(fa)平臺,即便如(ru)此,訊(xun)(xun)飛僅專注(zhu)于訊(xun)(xun)飛掃描詞典筆軟硬件研發(fa)的(de)(de)團隊(dui),也已達百人(ren)規模。

但由于訊(xun)飛掃描(miao)詞典筆(bi)交互形態的(de)不(bu)同,訊(xun)飛研發團隊也(ye)還(huan)需根(gen)據設備及使用場景的(de)特點(dian)進行技術定制,包括(kuo)前端圖片處(chu)理的(de)掃描(miao)和拼(pin)接(jie)(jie)、拼(pin)接(jie)(jie)圖片的(de)OCR識(shi)別技術。

其中(zhong),用戶(hu)在不(bu)同的(de)光照環境、掃描握持姿勢、掃描速度/軌跡等條件下,掃描出(chu)來的(de)圖片也容(rong)易產生畸(ji)變,這些都(dou)會給OCR技術帶來新的(de)挑戰(zhan)。

另(ling)一方(fang)面,訊飛掃描詞(ci)典(dian)筆的純離線處理功(gong)能也對設備芯(xin)片(pian)提(ti)出更高要(yao)求,需(xu)要(yao)在性(xing)能不及手機芯(xin)片(pian)的條件(jian)下(xia),在本地進行快速識別翻譯并(bing)保證良好效果(guo)。因此,研(yan)發團(tuan)隊(dui)也對芯(xin)片(pian)的部分算(suan)子層面和指令層面做了深度優化。

不難看(kan)出,從底層硬(ying)件到算法各個(ge)環(huan)節,訊(xun)飛掃描詞(ci)典筆已逐步(bu)構(gou)建起(qi)了(le)一座(zuo)屬于自己的AI技術城池。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

二、17年AI教育市場積累,詞典筆的誕生和軟硬件生態

“其實在教育方(fang)向,訊飛有(you)著(zhu)原來B端(duan)市(shi)場十余(yu)年的(de)積累(lei)。”翟吉博談到(dao),從(cong)最(zui)初開發訊飛輸入法(fa)等(deng)互聯網產品(pin),到(dao)2017年起瞄準智能硬(ying)件(jian)方(fang)向并推出翻譯機、錄音筆等(deng)C端(duan)產品(pin),訊飛已積累(lei)了不少從(cong)硬(ying)件(jian)研發到(dao)供(gong)應鏈布局的(de)經驗,以及在B端(duan)教育積累(lei)的(de)營銷(xiao)和(he)渠道資源(yuan)。

在翟吉博看(kan)來,如果說翻譯(yi)機、錄音筆這些垂直類(lei)產(chan)品是藍海(hai)市場,那(nei)么當下訊飛(fei)正在往競爭(zheng)(zheng)更(geng)激烈的(de)黃海(hai)市場遷移,爭(zheng)(zheng)取更(geng)大的(de)市場空間,而遷移的(de)路徑訊飛(fei)選擇了(le)AI技術與教育的(de)結合(he)。

之前訊(xun)飛在做(zuo)主打(da)跨語(yu)(yu)言溝通的翻(fan)譯(yi)機產品時發現,翻(fan)譯(yi)機的應(ying)用還存在一定的場(chang)景(jing)限制,例如在個(ge)人語(yu)(yu)言學(xue)習的場(chang)景(jing)中,不少用戶仍(reng)依賴傳統紙質詞典或手機端翻(fan)譯(yi)APP來進(jin)行單詞學(xue)習和查詢翻(fan)譯(yi),而(er)這個(ge)過程需要進(jin)行跨設備解決,在一定程度上也影響了自身的學(xue)習效率。

尤其(qi)在K12行業,大(da)多數孩子還無法隨時使用手機APP來查詞翻譯,更需要(yao)一個專用的智能(neng)硬(ying)件來解決。

因此在2020年疫情(qing)影響下,隨著在線學(xue)習(xi)(xi)導(dao)致電子設備在家庭(ting)自主學(xue)習(xi)(xi)場景中(zhong)的普及,以及家長對電子設備接受度(du)提(ti)高,消費觀念(nian)和使(shi)用觀念(nian)得到轉變,訊飛抓住機(ji)會推(tui)出了(le)訊飛掃描詞典筆,為孩子提(ti)供更(geng)高效、更(geng)低(di)成(cheng)本的查詞翻譯工具,從而大大提(ti)升學(xue)習(xi)(xi)效率(lv)。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

與此同時,針(zhen)對孩子學習(xi)的復習(xi)鞏固和課外拓展等需求(qiu),訊飛掃描詞典(dian)筆(bi)在硬件連(lian)接(jie)和內容生態方(fang)面也下了(le)不少功夫。

目(mu)前,訊(xun)飛(fei)掃描詞(ci)(ci)典筆支持生(sheng)詞(ci)(ci)本云(yun)端同步,并已和訊(xun)飛(fei)旗下的(de)學(xue)習(xi)機、打印(yin)(yin)機等(deng)設(she)備打通,方便(bian)孩(hai)子將(jiang)積累的(de)生(sheng)詞(ci)(ci)本同步到手機端,或與便(bian)攜打印(yin)(yin)機等(deng)設(she)備連接,隨時隨地復習(xi)和打印(yin)(yin)。

內容(rong)方面,訊飛掃描(miao)詞(ci)(ci)(ci)典筆(bi)覆蓋了朗(lang)文詞(ci)(ci)(ci)典等權威漢(han)英(ying)/英(ying)漢(han)詞(ci)(ci)(ci)典,還加(jia)入了不(bu)少課外拓(tuo)展的(de)聽力內容(rong),即便是K12課程也(ye)能同步跟上學習進(jin)度。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

三、積極開拓藍海市場,訊飛掃描詞典筆的創新邏輯

在翟吉博看來,目前(qian)掃描詞典筆市場本(ben)質(zhi)上是對原(yuan)來電子詞典品類的一(yi)次升級和(he)替換(huan)。

“我們小時候使用文(wen)曲(qu)星、快(kuai)易典(dian)(dian)等(deng)電子詞(ci)典(dian)(dian)上(shang)的(de)(de)基礎功能,現在的(de)(de)詞(ci)典(dian)(dian)筆都能實現。原來(lai)電子詞(ci)典(dian)(dian)在便攜性、AI能力、課本輸入效(xiao)率和成本等(deng)方(fang)面(mian)的(de)(de)不足,在詞(ci)典(dian)(dian)筆上(shang)也(ye)得到(dao)了很(hen)好的(de)(de)解決和升級(ji)。”翟(zhai)吉博(bo)談到(dao)。

從數(shu)據(ju)層(ceng)面上看(kan),原(yuan)來電子詞(ci)典市場能實現(xian)千萬(wan)級的年(nian)出貨量(liang),但隨著智能手機的普(pu)及,電子詞(ci)典的市場規模逐年(nian)衰(shuai)減,如(ru)今年(nian)出貨量(liang)估計為百萬(wan)級。

但(dan)翟吉博(bo)認(ren)為,詞典筆的(de)誕生一方(fang)(fang)面(mian)能(neng)將如今(jin)電子詞典的(de)小幾(ji)百(bai)萬(wan)級市場(chang)進行替換,另(ling)一方(fang)(fang)面(mian)也(ye)將吸引更(geng)多新用戶接受(shou)智能(neng)詞典筆這一新品類。“現(xian)在(zai)市場(chang)還處(chu)于(yu)初期階段,但(dan)如果再發展兩、三年,估計也(ye)能(neng)達到大幾(ji)百(bai)萬(wan)、千萬(wan)的(de)級別(bie)。”他說(shuo)。

盡管(guan)詞典筆(bi)市場(chang)比(bi)翻譯機、錄音筆(bi)等市場(chang)空(kong)間更大,但布(bu)局的玩(wan)家也(ye)相對更多(duo)。“這個(ge)(ge)市場(chang)的特點是消費者還處在接受、認知和教育的過程,市場(chang)也(ye)還未出現明(ming)顯巨頭,各(ge)個(ge)(ge)玩(wan)家也(ye)在并跑(pao)階段。”翟吉博認為,如何(he)快速普及更多(duo)用戶并形成(cheng)口碑,這一循環也(ye)是掃描詞典筆(bi)早期開拓市場(chang)的一個(ge)(ge)路徑。

那么,相比文曲星、漢王、有道等也在積極布局詞典筆市場的公司,訊飛的差異化優勢在哪?

翟吉博談到,從(cong)公司(si)層面(mian)看,訊飛多年(nian)積累(lei)的軟硬一體核心技術,能對智(zhi)能錄音(yin)筆(bi)、翻(fan)譯機(ji)等(deng)效率工具的體驗帶來(lai)很大(da)提升,有能力在(zai)市場中打造標桿(gan)性產品。

從(cong)產品(pin)(pin)層面看,訊飛已(yi)擁有(you)(you)了自己的一(yi)套學習產品(pin)(pin)矩陣,能(neng)夠圍(wei)繞不同學習屬性(xing)進行產品(pin)(pin)組合(he)(he),同時(shi)產品(pin)(pin)營(ying)銷上也有(you)(you)不少渠道與(yu)合(he)(he)作資源,相比文(wen)曲星、漢王更有(you)(you)優(you)勢,與(yu)有(you)(you)道也能(neng)形成相互啟發的競爭關系(xi)。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

除此之外,翟吉博認為(wei)詞典筆的(de)識別準確(que)率和響應(ying)速度是當下市場(chang)競(jing)爭的(de)兩(liang)大技術焦點。

“這兩個技(ji)術就(jiu)像蹺蹺板,想要效率(lv)又高(gao)(gao)又快是比較(jiao)難的(de)。”他(ta)談到(dao),識別準確(que)率(lv)高(gao)(gao)需要更大的(de)存儲和處理器,但(dan)成本就(jiu)上去(qu)了,甚至響應速(su)度(du)也會下降。

因此,如何平(ping)衡詞(ci)典筆(bi)的(de)(de)識別準確率(lv)和(he)響應速度,實現降本增(zeng)效的(de)(de)同時達到(dao)最佳綜(zong)合體驗,也是包括(kuo)訊飛在(zai)內的(de)(de)每一個玩家都在(zai)思考的(de)(de)問題。

在翟吉博看(kan)來(lai),未來(lai)訊飛掃描詞典筆的(de)(de)技術(shu)也會沿著這個思路迭代,一是單點技術(shu)的(de)(de)針對性優化,包括語(yu)音識別、OCR識別、語(yu)音合(he)成(cheng)、機器(qi)翻譯(yi)等技術(shu);二是各環節技術(shu)之間的(de)(de)聯動優化,形成(cheng)端(duan)到端(duan)的(de)(de)體驗(yan)提升。

“從核心能力(li)上看,未來我們也會(hui)重點精進知(zhi)識推薦功能,探索(suo)知(zhi)識圖譜技術能否連接詞(ci)典筆輸入輸出的交互(hu),以及后續(xu)深度有價值的內容(rong)信息推薦。”翟吉(ji)博說。同時,面(mian)向國際市場的多語言識別功能和特定(ding)行(xing)業人群的專業領域查詢需求,也將是(shi)訊飛(fei)持續(xu)探索(suo)的方向。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

作(zuo)為一家在AI語音領域深耕20多(duo)年的科技公司,訊(xun)飛已構建了(le)覆蓋教(jiao)、學(xue)、考、評、管五大主場景的智慧(hui)教(jiao)育全棧產品體系,智慧(hui)教(jiao)育產品也已廣泛落地國(guo)內31個省(sheng)級(ji)行(xing)政(zheng)區,與(yu)全國(guo)超3.8萬(wan)所學(xue)校達成深度合作(zuo),幫助學(xue)生更(geng)好地提升學(xue)習效率,實現因(yin)材施教(jiao)。

“教育本身是挺(ting)復(fu)雜的(de),盡管以(yi)學(xue)(xue)生為(wei)主體,但教育的(de)完整(zheng)體系(xi)包(bao)含了多種環境和角色(se),如(ru)何打通不同環境之間的(de)學(xue)(xue)習(xi)場景,為(wei)孩子提(ti)供智能個性化的(de)學(xue)(xue)習(xi)方式和建議(yi),形(xing)成完整(zheng)的(de)學(xue)(xue)習(xi)閉環,也(ye)是我(wo)們一直以(yi)來的(de)暢想。”翟吉博(bo)說。

他認為(wei),AI教(jiao)育(yu)的核心涉及(ji)了大量的教(jiao)育(yu)資源和內容,行業必須形(xing)成一個完(wan)整的產業鏈,在B端市(shi)場中才能(neng)更好地針對不同(tong)學(xue)校教(jiao)學(xue)特點(dian)、管理模式做適配,C端市(shi)場中也才能(neng)根據不同(tong)家長(chang)訴求和孩子體驗特點(dian)做提(ti)升。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

結語:K12浪潮爆發下,AI+教育融合打開創新思路

誰能想到(dao)一支(zhi)小(xiao)小(xiao)的詞典筆背(bei)后,也蘊含了大量的AI技(ji)術,從AI語音到(dao)AI圖(tu)像,從識別、翻(fan)譯再到(dao)機器閱讀理(li)解(jie)和知識推薦(jian),每一個技(ji)術細節(jie)都能看到(dao)訊飛對科技(ji)賦能教育的專注和用心。

但也正是這支詞典筆(bi),引得大量玩(wan)家(jia)積極涌入,在讓(rang)傳統電子(zi)詞典市(shi)場以新品(pin)類、新形態煥發生機的同時,也給AI教育市(shi)場的每一位玩(wan)家(jia)帶來更(geng)多(duo)挑戰。尤其是隨著(zhu)產(chan)品(pin)功(gong)能的同質化(hua)發展,如(ru)何(he)讓(rang)用戶(hu)更(geng)低(di)成本(ben)地獲得更(geng)高(gao)效、更(geng)完整的產(chan)品(pin)體驗,也是每個(ge)企業不斷提(ti)升的方向。

未來(lai),在這場越(yue)來(lai)越(yue)激烈的AI教育(yu)競賽中(zhong),AI賦能的下一個傳統品(pin)類(lei)市場會是什么?誰最終能成功脫穎而出(chu),成為真正(zheng)引領(ling)行(xing)業的風向標(biao)?我們拭目以待。