
近(jin)日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機(ji)器翻譯評(ping)測(ce)大賽上,搜狗(gou)擊敗訊飛、阿里(li)巴(ba)巴(ba), APPTEK(美國應用科技公(gong)司)、AFRL(美國空(kong)軍研究實(shi)驗室)以(yi)及(ji)KIT(德國卡爾斯(si)魯厄(e)理工學(xue)院)等(deng)國際國內多個強(qiang)勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模(mo)型)賽道冠軍,代表(biao)中國向(xiang)世(shi)界(jie)彰(zhang)顯了AI領域的技術硬實(shi)力!
表1? IWSLT大(da)賽Baseline Model賽道最終(zhong)結(jie)果(guo)
–取自(zi)IWSLT官方(fang)公布結(jie)果://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
這是搜狗繼WMT 2017機器(qi)翻譯頂級評測大賽奪冠之后,所(suo)摘(zhai)得的(de)又一翻譯領域的(de)技術桂冠。短期內連續登頂世(shi)界第一的(de)位置,充分證明了搜狗在翻譯行業特別是口語翻譯領域已(yi)位居領先地位。
IWSLT是什么比賽?
IWSLT是國(guo)(guo)(guo)(guo)際最具(ju)影響力的口語機(ji)(ji)(ji)器翻譯評測比(bi)(bi)賽(sai),從2004年開(kai)始(shi)已經舉辦了15屆(jie)。每屆(jie)比(bi)(bi)賽(sai)都吸引了世界各地機(ji)(ji)(ji)器翻譯領(ling)域的知名企業和研究(jiu)機(ji)(ji)(ji)構參與(yu),本屆(jie)比(bi)(bi)賽(sai)吸引了訊(xun)飛、阿里巴巴等國(guo)(guo)(guo)(guo)內公司(si),愛爾蘭ADAPT中心,美(mei)國(guo)(guo)(guo)(guo)約翰霍普金(jin)斯大學(xue),德國(guo)(guo)(guo)(guo)卡(ka)爾斯魯(lu)厄理工(gong)學(xue)院,芬蘭赫爾辛基大學(xue),英國(guo)(guo)(guo)(guo)愛丁堡大學(xue),美(mei)國(guo)(guo)(guo)(guo)AppTek公司(si)等多(duo)家國(guo)(guo)(guo)(guo)際知名大學(xue)、研究(jiu)機(ji)(ji)(ji)構和公司(si)參加。
表(biao)2? IWSLT2018大賽參賽情況
–取自IWSLT官方公布結果://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf
本屆IWSLT 2018的口語機器翻譯任務主要評測基于指定數據集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個賽道,其中Baseline Model賽道主要評測語音翻譯的流水線方案,輸入語音先通過語音識別系統得到語音識別結果,之后將結果送入機器翻譯系統獲得譯文,這也是業內最主流、效果最好的語音翻譯解決方案,市場上商用機器同傳、翻譯機等語音翻譯類產品幾乎都采用了類似的方法;End-to-End則是本次評測新增設的賽道,主要鼓勵參賽方探索基于神經網絡的端到端語音翻譯解決方案,希望能夠輸入語音,基于深度神經網絡模型直接輸出譯文,這種方法目前仍處于早期研究階段,受制于語音-文本平行語料難以大規模采集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評測中,在訓練集、測試集相同的情況下,Baseline Model賽道最好的系統取得了28.09的BLEU(機器翻譯質量評價指標,值越大代表翻譯質量越好),而End-to-End賽道(dao)最好的系統僅取得了19.4的BLEU,較Baseline Model賽道(dao)相(xiang)差(cha)8.69個BLEU,差(cha)距(ju)非(fei)常明顯,也證(zheng)明了Baseline Model賽道(dao)評測的算(suan)法仍是目前最可行和實用(yong)的解決方案(an)。
搜狗本(ben)次參加的(de)是Baseline Model賽(sai)道的(de)評測,并取得了第一名(ming)的(de)好成績。評測任(ren)務面向(xiang)TED演講和大會學(xue)術報告(gao)場景(jing),測試集包括來自英(ying)國(guo)、歐洲、印度等各個國(guo)家的(de)英(ying)語演講者,存在(zai)(zai)噪聲(sheng)、口(kou)(kou)音(yin)、自由表(biao)達(da)等復(fu)雜語音(yin)現象,同時(shi)語言中(zhong)存在(zai)(zai)大量領(ling)域專(zhuan)有名(ming)詞和口(kou)(kou)語化的(de)表(biao)達(da)(如:大量語氣詞、錯誤(wu)語法(fa)表(biao)達(da)等),具有極(ji)強的(de)實戰(zhan)意義和挑(tiao)戰(zhan)性。最終(zhong),搜狗提交的(de)系(xi)統(tong)BLEU值達(da)到28.09,領(ling)先(xian)排名(ming)第二(er)的(de)科大訊飛1.6個BLEU,證明了搜狗在(zai)(zai)口(kou)(kou)語機器翻譯(yi)領(ling)域強大的(de)實力。
AI賽道中持續發力,搜狗領跑語音翻譯行業
搜(sou)(sou)(sou)狗(gou)(gou)的(de)(de)(de)(de)AI戰略藍圖之中,語言是最(zui)核心的(de)(de)(de)(de)重頭戲。一直以來,搜(sou)(sou)(sou)狗(gou)(gou)都堅持著“自然交(jiao)(jiao)互(hu)(hu)+知(zhi)識(shi)(shi)計算(suan)”的(de)(de)(de)(de)人工智能核心方向,并持續深耕技術,推(tui)動技術向產品(pin)的(de)(de)(de)(de)快(kuai)速轉化,2016年,搜(sou)(sou)(sou)狗(gou)(gou)發(fa)布了自有人機交(jiao)(jiao)互(hu)(hu)解(jie)決(jue)方案-知(zhi)音引(yin)擎(qing)。擁有充足真實語料數據優勢的(de)(de)(de)(de)搜(sou)(sou)(sou)狗(gou)(gou),將語音識(shi)(shi)別(bie)與機器翻譯技術相結(jie)合,并在(zai)2016年推(tui)出了全球首款商用AI同(tong)傳系統-搜(sou)(sou)(sou)狗(gou)(gou)同(tong)傳,引(yin)領(ling)了語音翻譯技術的(de)(de)(de)(de)普及與應用。通過數百(bai)場(chang)的(de)(de)(de)(de)國際會議“實戰”,搜(sou)(sou)(sou)狗(gou)(gou)同(tong)傳獲得了無(wu)數媒體(ti)和觀(guan)眾的(de)(de)(de)(de)好評,成為當下(xia)炙手(shou)可熱(re)的(de)(de)(de)(de)“AI字幕君”。
與此(ci)同(tong)(tong)時,搜(sou)狗(gou)也推出了(le)一系列的智能(neng)硬件,將語音(yin)翻譯(yi)技術應(ying)用到(dao)(dao)了(le)更(geng)廣闊的場(chang)景之中,幫助用戶打破了(le)跨國交流時的語言困境。2018年3月(yue),搜(sou)狗(gou)推出了(le)搜(sou)狗(gou)旅行翻譯(yi)寶,具備(bei)離線翻譯(yi)功能(neng)與拍照翻譯(yi)功能(neng),讓馬化(hua)騰都為之心動,在朋友圈里(li)大打廣告。作為首(shou)款智能(neng)翻譯(yi)硬件,它支持(chi)42種語言對(dui)話翻譯(yi),解決了(le)旅游場(chang)景中用戶聽(ting)不(bu)(bu)懂(dong)、看不(bu)(bu)懂(dong)、不(bu)(bu)會說(shuo)等真實(shi)痛點。該項產品在京東平臺首(shou)發當日即告售罄,首(shou)日銷售額破千(qian)萬。與此(ci)同(tong)(tong)時,搜(sou)狗(gou)還推出了(le)錄音(yin)翻譯(yi)筆,提供錄音(yin)轉寫、對(dui)話翻譯(yi)、同(tong)(tong)聲傳譯(yi)等功能(neng),把AI同(tong)(tong)傳落地(di)到(dao)(dao)了(le)消費級產品之中,開拓了(le)語音(yin)翻譯(yi)的新航道。
眾所周知(zhi),人工智能是未來科技(ji)的(de)風向標。通過這次在IWSLT比賽中的(de)優秀成績(ji),可以看到以搜狗為代表(biao)的(de)國產科技(ji)巨頭企業,已表(biao)現(xian)出了(le)引領行(xing)業的(de)技(ji)術硬實力。