
車東西(公眾號:chedongxi)
文 | Origin
4月16日,第十八屆上海車展正式(shi)開(kai)幕。當數以萬計的觀眾涌入會(hui)館(guan),一睹千余輛展車的風采之(zhi)時,一家AI公司,也(ye)加快了“上車”的步(bu)伐。
4月17日,語音交(jiao)互(hu)AI公司(si)思必(bi)馳,與國內大型(xing)第(di)三方車聯網公司(si)博泰簽署戰(zhan)略合(he)作協議,建立語音AI私(si)有云平臺(tai),為更多(duo)車企(qi)賦能。
▲思必馳(chi)與(yu)博(bo)泰簽署(shu)戰略(lve)合(he)作協議
這(zhe)次合作的(de)背(bei)景(jing),是此次上海(hai)車展上,超過8成的(de)新車型,都搭(da)載了(le)智能語音(yin)交互技術。車載語音(yin)交互技術的(de)市場潛力(li)顯露(lu)無(wu)疑。
這家在(zai)人工智能(neng)創業領(ling)域頗有名(ming)氣,要如何在(zai)愈發(fa)興(xing)盛的(de)(de)(de)車載智能(neng)語音交互市(shi)場開拓(tuo)更大的(de)(de)(de)發(fa)展前景(jing),思必馳能(neng)為這個領(ling)域帶來(lai)什么差異化的(de)(de)(de)價(jia)值?
車東西與思(si)必馳(chi)副(fu)總裁雷雄國進行了一番深度交流(liu),他向(xiang)車東西繪出了思(si)必馳(chi)智能(neng)語音交互(hu)技術的上車路線。
▲思必馳(chi)副總(zong)裁雷雄(xiong)國(guo)
一、從后裝到前裝 思必馳語音交互上車的技術底氣
提及思(si)必馳,對(dui)智(zhi)能(neng)家(jia)居或AI有(you)興(xing)趣的(de)人應該不會(hui)陌生,這家(jia)以AI語(yu)音(yin)交互(hu)(hu)技(ji)(ji)(ji)術(shu)(shu)為出發點(dian)的(de)公司,在語(yu)音(yin)交互(hu)(hu)技(ji)(ji)(ji)術(shu)(shu)席卷(juan)各類消費電(dian)子產品的(de)浪(lang)潮(chao)中貢(gong)獻(xian)了重要(yao)力量。智(zhi)能(neng)音(yin)箱(xiang)、智(zhi)能(neng)電(dian)視、對(dui)話機器人····它們(men)背后(hou)都有(you)思(si)必馳的(de)身影。為人熟知的(de)小愛同學(xue)、天(tian)貓精(jing)靈(ling)、華(hua)為音(yin)箱(xiang),關鍵的(de)語(yu)音(yin)交互(hu)(hu)技(ji)(ji)(ji)術(shu)(shu)提供者,正是思(si)必馳。
想象(xiang)力更大(da)的(de)車載(zai)語音市場(chang),其(qi)實思(si)必(bi)馳也(ye)早已開始布局。思(si)必(bi)馳語音交互(hu)上(shang)車之路(lu),是從后裝渠道開始的(de)。在早兩年的(de)后裝智能(neng)車機(ji)、智能(neng)后視鏡熱中(zhong),思(si)必(bi)馳向大(da)量的(de)硬件(jian)設備(bei)商輸(shu)出(chu)了語音交互(hu)的(de)技術方案,合(he)作伙(huo)伴包(bao)括車蘿卜、360、飛歌、小米70邁、盯(ding)盯(ding)拍、兜(dou)風出(chu)行、易(yi)圖(tu)等等。其(qi)中(zhong),思(si)必(bi)馳投資的(de)車蘿卜,目前在國內HUD領域排名第一,2019年主(zhu)推AR-HUD。
在大量硬件設備(bei)合作(zuo)伙伴(ban)的產(chan)品輸出下,雷雄國告訴(su)車東西,思必馳在后裝(zhuang)車載(zai)語音交互市場(chang)的占(zhan)有率達到70%。
而近兩年,智能語(yu)(yu)(yu)音交互(hu)技(ji)(ji)術的(de)進一步成(cheng)熟,突破了以(yi)往車(che)載(zai)語(yu)(yu)(yu)音技(ji)(ji)術命(ming)令(ling)式交互(hu)的(de)局限(xian)。語(yu)(yu)(yu)音交互(hu)的(de)體驗(yan)得以(yi)大(da)大(da)改善,它(ta)成(cheng)為新(xin)車(che)型產品(pin)力(li)的(de)重(zhong)要(yao)組(zu)成(cheng)部分。這使得車(che)載(zai)語(yu)(yu)(yu)音交互(hu)技(ji)(ji)術從后裝(zhuang)走向前裝(zhuang),成(cheng)為不可(ke)阻擋的(de)大(da)趨勢。
車企有需求,思必馳有技術,從后裝走向前裝理所應當。但趨勢歸趨勢,這條路并沒有那么容易走。雷雄國向車東西表示,后裝市場主要是思必馳向合作伙伴輸出技術方案,而在前裝市場,車廠會提出更多的技術指標,就車載的場景來說,有三大關鍵問題必須解決:
1、車內聲場環境復雜,包括風噪、胎噪、背景回聲在內的各種噪聲加大語音的采集識別難度。
2、車內網絡環境復雜,汽車高速行駛過程中網絡連接質量通常較差,語音交互技術過多依賴云端的話體驗會很差。
3、車內人車交互的主體從駕駛員拓展到了前排乃至后排乘客,傳統只針對駕駛員的語音交互方案無法滿足車內其他人的需求,或者會在駕駛員語音交互過程中受到其他乘客干擾。
針對這三個問題,思必馳提(ti)出了自己的解決方案。
對車(che)內聲場環境復雜的(de)問(wen)題,雷(lei)雄國告訴車(che)東西,思(si)(si)必馳通過(guo)后裝(zhuang)設備采集到(dao)的(de)數據發揮了很大作用。思(si)(si)必馳在(zai)后端(duan)建立(li)了一套大型的(de)自動化數據處理(li)模型,以及(ji)訓練、測試(shi)的(de)流程,讓思(si)(si)必馳的(de)語音交互算法在(zai)各(ge)種實際的(de)噪(zao)聲環境中不斷(duan)訓練、強化,保(bao)證(zheng)語音識別的(de)準(zhun)確(que)性。
對車(che)內網(wang)絡(luo)經(jing)常處于弱(ruo)網(wang)狀態的(de)問題,思(si)必(bi)馳(chi)(chi)則有意識地降低了(le)對云端(duan)設施的(de)依賴。具體(ti)包括:通訊錄、控制系統操作(zuo)、導航、音樂等常用功能(neng)的(de)語(yu)(yu)音控制,思(si)必(bi)馳(chi)(chi)將(jiang)其做(zuo)在了(le)本地(車(che)輛端(duan)),不必(bi)依賴網(wang)絡(luo);本地的(de)數(shu)據,與云端(duan)數(shu)據更新(xin)保持(chi)快速同步,并(bing)且會根據用戶的(de)畫像做(zuo)個性化的(de)數(shu)據更新(xin);此外在語(yu)(yu)音指令的(de)置信度和(he)網(wang)絡(luo)延(yan)時的(de)判定方面(mian),思(si)必(bi)馳(chi)(chi)也(ye)進行了(le)大量優化工(gong)作(zuo)。這些工(gong)作(zuo)的(de)結(jie)果是,在沒有網(wang)絡(luo)的(de)情況下,思(si)必(bi)馳(chi)(chi)提供的(de)技術方案也(ye)能(neng)支持(chi)關鍵任務的(de)操作(zuo)。
對于(yu)車內(nei)多(duo)主(zhu)體(ti)的(de)交互(hu)(hu)難(nan)題(ti),思必馳則推(tui)出多(duo)音(yin)區(qu)方(fang)案,進行聲(sheng)源定位,在不同音(yin)區(qu)內(nei)精準(zhun)識別不同對象的(de)語音(yin)。目前,思必馳能夠提供(gong)雙音(yin)區(qu)、四(si)音(yin)區(qu)、六音(yin)區(qu)的(de)交互(hu)(hu)方(fang)案,其中既包(bao)括更多(duo)靠軟件算法實現的(de)單麥克(ke)風方(fang)案,也有(you)使用多(duo)麥克(ke)風搭配軟件的(de)軟硬一(yi)體(ti)化解決方(fang)案。
▲思必馳多音區方(fang)案樣例
在(zai)這些解決方案之外,思必(bi)馳還做了(le)大量的(de)工作,比(bi)如對語音進行“清洗(xi)”的(de)信號處理算法(fa)優化、語義(yi)理解算法(fa)的(de)優化、喚醒+識別同步技術的(de)開發(fa)、大型(xing)知識庫的(de)建設等(deng)等(deng)。
這些全面優化語音交(jiao)互體驗的(de)技術工作到(dao)位,才有車企(qi)選擇(ze)買單。雷雄國稱,雖然前裝的(de)技術標準指標更(geng)高,開發周(zhou)期更(geng)長(chang),但(dan)好(hao)在確(que)定性更(geng)高——換句話(hua)說,收入更(geng)有保(bao)障。
車東西了解到(dao),思必馳目前(qian)已經與20余(yu)家車企建立了合作,客(ke)戶包括吉(ji)利、長城、一汽大眾、北汽、小鵬汽車等等。
車東西還了(le)解到,思(si)必(bi)馳(chi)能夠拿到眾多車企的訂單,除了(le)技術(shu)作(zuo)保障(zhang),思(si)必(bi)馳(chi)的態度也很(hen)重要。
二、“讓車企有選擇” 開放模式打動車企
車企(qi)在(zai)與供應(ying)商合作的(de)(de)過程(cheng)中,往往會(hui)考慮“選擇權”,供應(ying)商過于強勢是主機廠的(de)(de)大忌(ji)。而(er)作為智能語音技術供應(ying)商,思必(bi)馳的(de)(de)開(kai)放(fang)態(tai)度,則讓(rang)合作伙伴們(men)很放(fang)心。
思必馳的開放首先(xian)體現在內容生(sheng)態(tai)上(shang)。
思必馳引入了來自廣泛互(hu)聯網(wang)、移動互(hu)聯網(wang)的第(di)三方內(nei)容服(fu)務(wu)(wu),包括(kuo)BATJM等。雷雄(xiong)國稱,目前思必馳已經接(jie)入200余(yu)家企(qi)業的內(nei)容與服(fu)務(wu)(wu)。
在廣(guang)泛對接全網資(zi)源的(de)(de)情況下,思必馳基于其(qi)DUI開(kai)放平(ping)臺,開(kai)發了100余個(ge)高(gao)可用的(de)(de)車載語音交(jiao)互技能,讓車內的(de)(de)語音交(jiao)互有(you)了更高(gao)的(de)(de)便利性與可玩(wan)性。
而在與(yu)車企的合作過程中,思必馳(chi)也秉持著(zhu)這(zhe)種開放性。
雷雄國向車(che)(che)(che)(che)東西表(biao)示,思(si)必(bi)馳將自身的(de)車(che)(che)(che)(che)載(zai)語(yu)(yu)(yu)(yu)音(yin)交(jiao)互(hu)技術(shu)方案打包成了“天琴語(yu)(yu)(yu)(yu)音(yin)助手(shou)”,這(zhe)是一個全鏈路的(de)語(yu)(yu)(yu)(yu)音(yin)交(jiao)互(hu)產品,集成思(si)必(bi)馳150余項高可用的(de)車(che)(che)(che)(che)載(zai)語(yu)(yu)(yu)(yu)音(yin)技能,支持(chi)聲紋識別、多音(yin)區、離(li)線(xian)交(jiao)互(hu)、方言識別、車(che)(che)(che)(che)載(zai)客(ke)服(fu)、快捷命令、OTA升(sheng)級等能力,為(wei)車(che)(che)(che)(che)企(qi)提供智(zhi)能語(yu)(yu)(yu)(yu)音(yin)交(jiao)互(hu)的(de)全套支持(chi)。
▲思必馳全新(xin)車(che)載語音交互系統:天琴助手
不過,如果(guo)車企(qi)不想(xiang)全要也(ye)沒關系,思(si)必(bi)馳也(ye)能通過SDK的形式(shi),為(wei)車企(qi)以及Tier-1提供(gong)單點語音技術支持。
思(si)必(bi)馳(chi)(chi)這種讓車企“有得選”的(de)(de)開(kai)放(fang)性(xing),甚至滲透(tou)到(dao)了非常細節的(de)(de)技術(shu)中(zhong)。上(shang)文提到(dao)的(de)(de)思(si)必(bi)馳(chi)(chi)多音區解決(jue)方(fang)(fang)案,雷雄國(guo)告訴車東西,就近(jin)場而(er)言,一(yi)枚麥克風(feng)+軟(ruan)件(jian)算(suan)法(fa)的(de)(de)“純(chun)軟(ruan)方(fang)(fang)案”,和多枚麥克風(feng)+軟(ruan)件(jian)算(suan)法(fa)的(de)(de)“軟(ruan)+硬方(fang)(fang)案”,在單純(chun)的(de)(de)識別效果上(shang)差(cha)距并不是十分顯著(zhu)。純(chun)軟(ruan)的(de)(de)方(fang)(fang)案可能成本更低,但是無法(fa)滿足(zu)車廠(chang)的(de)(de)高(gao)級需求(qiu),例(li)如說話人的(de)(de)位(wei)置確(que)認、身份(fen)識別、更針對(dui)性(xing)的(de)(de)車內消噪(zao)處理等。同時還要(yao)考慮和設備的(de)(de)主控芯片(pian)的(de)(de)配(pei)合,以追求(qiu)最高(gao)的(de)(de)性(xing)價(jia)比(bi)、達到(dao)最好的(de)(de)效果。
思(si)必馳提供兩(liang)種不同方案,主要目的(de)在于(yu)滿足車企不同的(de)開發(fa)需求。
當思必馳對車企的(de)需求已經考慮到如此細致(zhi)的(de)程度的(de)時候,車企當然會歡(huan)迎這樣用心的(de)語音(yin)交互供(gong)應商。
三、與博泰合作加速“上車” 車規級AI芯片正研發
理解(jie)了(le)思必(bi)馳的(de)開(kai)放(fang)性,對思必(bi)馳與博泰(tai)的(de)合作也就不(bu)難理解(jie)了(le)。
博泰作(zuo)為國內最大(da)的車(che)(che)聯(lian)網公司之(zhi)一,其態度(du)也是高度(du)開(kai)放(fang),并且在(zai)BAT強勢(shi)入局車(che)(che)聯(lian)網之(zhi)時緊緊站在(zai)了(le)車(che)(che)廠一邊。這使得博泰對車(che)(che)廠的需求、車(che)(che)聯(lian)網的產品理解(jie)很深,也積累了(le)眾多(duo)車(che)(che)企合作(zuo)伙伴(ban)
在思必馳(chi)與博(bo)泰的戰略合(he)作發布會上(shang),博(bo)泰CEO應宜倫透露,為了搭建(jian)這(zhe)一語音AI私有(you)云平臺(tai),去年下半年雙方開始接觸(chu),組建(jian)了百人團(tuan)隊。
雷雄國告訴車(che)(che)東西(xi),思必馳與博泰的(de)(de)合(he)作根據各(ge)自所長(chang)進行(xing)了分工,思必馳更多提(ti)供(gong)核心(xin)的(de)(de)語音AI技術,博泰則圍繞(rao)車(che)(che)聯網產(chan)品進行(xing)打磨,調用第三(san)方服務。雙方共同搭建一(yi)個(ge)平臺,去為車(che)(che)企服務。
而思必(bi)馳(chi)(chi)與(yu)博泰共同搭建的(de)(de)語(yu)音AI私(si)有云平臺,對(dui)思必(bi)馳(chi)(chi)語(yu)音技術上(shang)車有著新的(de)(de)意義——以(yi)往車企在車聯網的(de)(de)合(he)作中總是顧慮數(shu)據與(yu)差異化(hua)的(de)(de)功(gong)(gong)能點被第三方的(de)(de)公司取(qu)得。這一語(yu)音AI私(si)有云平臺建立后(hou),車企既可以(yi)通(tong)過它調用各種語(yu)音交互能力,又能通(tong)過數(shu)據的(de)(de)隔離保(bao)證數(shu)據的(de)(de)安全與(yu)功(gong)(gong)能的(de)(de)差異化(hua)。
可以(yi)說,思(si)必馳的(de)開放態(tai)(tai)度給了車企更(geng)多選擇,與(yu)博泰(tai)合作建立這(zhe)一私有云平臺,則解(jie)決(jue)了車企接入車聯網生態(tai)(tai)的(de)一大痛點。可以(yi)預見(jian)的(de)是,思(si)必馳在前裝(zhuang)領域的(de)上車步伐(fa),將在這(zhe)一私有云平臺的(de)幫助(zhu)下進一步加速。
當然,思必(bi)馳對車載語音交(jiao)互前裝市場(chang)的(de)思考,也不止(zhi)于此(ci)。
雷雄國還向(xiang)車(che)東(dong)西(xi)透露,思必馳(chi)已經在(zai)今年年初發布的(de)(de)AI語(yu)(yu)音芯(xin)片(pian)“TH1520”基(ji)礎上,規劃了(le)車(che)規級AI芯(xin)片(pian)。這款芯(xin)片(pian),車(che)載語(yu)(yu)音交互體(ti)驗尤其是本(ben)地化功能(neng)的(de)(de)體(ti)驗將會得到提升(sheng)。
此(ci)外,在車(che)內語(yu)音(yin)、視(shi)覺、手勢(shi)等多(duo)模態(tai)交互越來越主流的形勢(shi)下(xia),思必(bi)馳(chi)也將其(qi)目光從語(yu)音(yin)識(shi)別、自(zi)然語(yu)言理解(jie)等領域向(xiang)多(duo)模態(tai)交互方向(xiang)拓展(zhan)。
思必馳方面告訴車東西(xi),他們依托于上海交通大學-蘇州(zhou)人(ren)工(gong)智能研究(jiu)院(yuan),正在開展多模態的人(ren)工(gong)智能交互研究(jiu)。
結語:不斷進化的語音AI公司
在(zai)人工智能(neng)技術被廣泛(fan)認(ren)知的今天,其不斷學習、快速進化的特點成為它被廣泛(fan)應用的關鍵優點。
而(er)從事語(yu)音人(ren)工智能技術開發的思必馳,也擁有這樣的特點,這家(jia)公司(si)在短短數(shu)年內,將(jiang)其智能語(yu)音交互技術從智能終端走向多維企(qi)業服務(wu),汽車領域(yu)又成功(gong)地從后裝走向前裝。
思必(bi)馳不(bu)僅在單點技術積累上不(bu)斷(duan)進步,對市場(chang)的理(li)解也(ye)在迅速加深,如(ru)今其技術維度或即將(jiang)迎來拓展。
就像AI在不斷(duan)(duan)進(jin)化(hua)的(de)(de)過程中應用的(de)(de)場景不斷(duan)(duan)拓(tuo)展(zhan),思(si)必馳在不斷(duan)(duan)進(jin)化(hua)的(de)(de)過程中,也贏(ying)得了越來(lai)越多的(de)(de)機會。