智東西(公眾號:zhidxcom)
編 | 季瑜生

導語:微軟與SwiftKey輸入共同發布可實現60余種語言實時翻譯的新輸入法版本。

智東西9月28日消息,今日微軟(ruan)宣布,微軟(ruan)已(yi)經將其翻譯(yi)(yi)APP的(de)功(gong)能(neng)集成到SwiftKey輸入(ru)法(fa)的(de)安卓版(ban)之中,并向(xiang)所有普通用(yong)戶開放。屆時,用(yong)戶將不必(bi)來回切換軟(ruan)件(jian),即可享受60余種語(yu)言(yan)實(shi)時翻譯(yi)(yi)的(de)體驗。

據(ju)了解,SwiftKey是(shi)一(yi)家于2008年(nian)(nian)創立(li)的輸入法(fa)公司,于2016年(nian)(nian)被微軟所(suo)收購,當前已有超(chao)過3億設備(bei)采用(yong)其產品。SwiftKey產品的一(yi)大亮點在于其基于SMS消息學習的混合人工智能技術,能夠預測下一(yi)個單詞(ci)的用(yong)戶(hu)打算鍵(jian)入。

不過美中(zhong)不足的(de)是,SwiftKey用戶想(xiang)要使用實時(shi)翻(fan)譯(yi)功能的(de)話,必須連網才能實現,而微軟翻(fan)譯(yi)App則支(zhi)持(chi)離線(xian)翻(fan)譯(yi)功能。

一、后來居上的SwiftKey與被徹底拋棄的Word Flow

將翻譯功能集(ji)成(cheng)到SwiftKey之(zhi)前,是微軟(ruan)對于Word Flow輸入法的徹底放棄。

作為(wei)一款微(wei)軟在2012年于Windows Phone 8中推(tui)出的輸入法,“Word Flow”在當時由(you)于其組詞成句以及情景糾正功能,加上其方便單手輸入的弧形鍵盤的產品設計讓一眾(zhong)用戶為(wei)其驚(jing)艷(yan)不已(yi)。

微軟SwiftKey輸入法加入實時翻譯功能,支持60種語言

2016年(nian),微軟還曾經在其iOS平臺中(zhong)推出了測試版的Word Flow,希望(wang)能將(jiang)這(zhe)款(kuan)Windows Phone 8的經典(dian)輸(shu)入法普及到更多(duo)的移動(dong)平臺之中(zhong)。

但僅僅過了(le)一年,微(wei)軟就宣布將Word Flow下架(jia),轉而推薦SwiftKey輸入(ru)法。

二、微軟的智能語音識別野心

不過(guo)相比SwiftKey和(he)Word Flow這些(xie)具體的(de)(de)輸入(ru)法(fa),微軟(ruan)的(de)(de)小冰似乎(hu)在(zai)語音識(shi)別和(he)人工智能市(shi)場上的(de)(de)認知度要更高(gao)一些(xie)。近幾年(nian)來,它(ta)與蘋果的(de)(de)Siri,谷歌的(de)(de)語音助(zhu)手還有(you)亞(ya)馬遜的(de)(de)Echo幾家市(shi)場對壘烜赫一時(shi)。

盡管在(zai)內(nei)容營銷方面,微軟(ruan)依靠小(xiao)冰與明星互動、寫詩等活(huo)動贏(ying)得了不小(xiao)的噱頭,但是市場(chang)上卻一(yi)直被谷歌、蘋(pin)果壓過一(yi)頭。由(you)于沒(mei)有(you)什么知名(ming)的硬件產品,讓微軟(ruan)在(zai)競爭優勢(shi)上遜色不少。

事實上微軟早(zao)已在此默默耕耘數年。

早在2016年微軟就已經使用(yong)了(le)深度(du)神經網絡技術來進行(xing)語音(yin)識別,并(bing)且在同一年完成了(le)對SwiftKey的(de)2.5億美元收購。

今年(nian)三(san)月微軟(ruan)又推出了“全雙工語音交互感官”(Full-duplex Voice Sense)技術,在(zai)業界引(yin)起轟動(dong)不小(xiao),當時微軟(ruan)還宣布已(yi)經將(jiang)這(zhe)種(zhong)技術完(wan)成了產品化(hua)的(de)落地。

那么何為“全雙工語音交互感官(guan)”技(ji)術?

“全雙(shuang)(shuang)工”是一個通訊行業(ye)的(de)專(zhuan)業(ye)術(shu)語(yu),可以允許數據(ju)在兩個方向上(shang)同時傳(chuan)(chuan)輸(shu)。與(yu)“全雙(shuang)(shuang)工”對應的(de)是傳(chuan)(chuan)統的(de)“半雙(shuang)(shuang)工”,在語(yu)音識(shi)別(bie)上(shang)指的(de)就是智能系(xi)統只有在說話人(ren)將一句話講完后(hou)才能實現分析理(li)解,而“全雙(shuang)(shuang)工”則可以實時預測講話者接(jie)下來要說的(de)內容形成實時回應,或許可以借此實現長程(cheng)語(yu)音交互。

在(zai)搭載“全雙工語音交互(hu)感官”技術的設備(bei)上,用戶(hu)不需要每次交互(hu)都說喚(huan)(huan)醒詞(ci),可以實現(xian)一次喚(huan)(huan)醒連(lian)續(xu)對話,當(dang)前這項技術已經在(zai)微軟(ruan)小冰的產品線中落地,未來(lai)還將實現(xian)更(geng)多產品線的覆蓋。

而(er)這(zhe)些,都只不過是微軟在智能語音識別領域野心顯露出的冰山一角(jiao)。

來源:Engadget