智東西(公眾號:zhidxcom)
文 | 寓揚

一年一度的(de)(de)(de)MWC上海已經落下帷幕,在為期3天的(de)(de)(de)展覽中,我們發現今年的(de)(de)(de)主題仍然圍(wei)繞5G、物聯網(wang)、AI展開。

5G將提(ti)供(gong)更(geng)大(da)的(de)帶寬(kuan),推(tui)動通(tong)信(xin)、車聯網(wang)、無人(ren)機、VR、智慧城(cheng)市等進(jin)一步發展。物聯網(wang)則進(jin)一步落地(di)場景應用,以NB-IoT(窄(zhai)帶物聯網(wang))為代表的(de)連接技(ji)術已真正實現落地(di)商用。AI開始“潤物細無聲”,融入各個場景。

MWC上海(hai)期間,智東西走訪了(le)(le)眾多企業,并與(yu)聯發(fa)科技副總經理(li)(li)暨(ji)智能設備事業群總經理(li)(li)游人(ren)杰(jie)進行(xing)溝(gou)通,對(dui)于智能語音的發(fa)展(zhan)、下一個家庭(ting)消費爆(bao)品在哪里(li)、語音創業公司做芯片等問題有了(le)(le)更深(shen)的認知與(yu)判斷。

深度:2000萬智能音箱戰火不滅,VR第二春要爆發!

(聯發科技副總(zong)經理(li)暨智能(neng)設備事(shi)業群(qun)總(zong)經理(li)游人杰)

過去(qu)聯發科為(wei)人(ren)所知的更多是手機芯片,這(zhe)也(ye)其在移動互聯網時代的主戰(zhan)場(chang)(chang)(chang)。而游人(ren)杰所負責的智能(neng)設備事業群(qun)可以稱(cheng)為(wei)聯發科的“第二戰(zhan)場(chang)(chang)(chang)”,其領導(dao)的事業群(qun)也(ye)是物(wu)聯網領域的重(zhong)要力量之一。典(dian)型的就是,盡管智能(neng)音箱保持著爆(bao)炸式的增長,聯發科依然占據這(zhe)個市場(chang)(chang)(chang)60%~70%的市場(chang)(chang)(chang)份額。

一、智慧家庭走向語音與視覺的融合

游人杰談到家庭終端設備的(de)演(yan)變。十年前我們想要看(kan)電(dian)影,那(nei)時電(dian)視沒有(you)網絡(luo),需(xu)要使用(yong)DVD播放(fang)器(qi),去租碟片才能觀看(kan)。這是階段可以稱為isolated(孤立的(de)),沒有(you)網絡(luo)連接。

深度:2000萬智能音箱戰火不滅,VR第二春要爆發!

大概5年前,我們(men)的家(jia)庭(ting)進入到第二個(ge)階段connected(連接),通(tong)過影(ying)(ying)像串(chuan)流服務(wu),我們(men)可以(yi)將視(shi)頻通(tong)過高速(su)帶寬網絡傳(chuan)送到電視(shi)上,來(lai)看電影(ying)(ying)。

一直到去(qu)年,智能音箱的(de)盛行,家庭(ting)也進入(ru)(ru)到第三(san)階段AI integrated,AI融入(ru)(ru)家庭(ting)。隨(sui)著AI算法的(de)成熟(shu),智能音箱依托AI在云(yun)端做語義的(de)辨識,聽懂用(yong)戶的(de)意(yi)圖,AI+語音就誕生(sheng)了(le)。

他認(ren)為(wei),AI+語音只是(shi)AI落地智(zhi)慧(hui)家(jia)庭的第一步(bu),“相信不久的將來,或許是(shi)今年,AI+vision(AI+視覺)會開始盛行”。

“未來的趨勢無外(wai)乎就是,AI+voice/vision(語音(yin)或者視(shi)覺)的組合”,游人杰(jie)進一步對智(zhi)慧(hui)家庭的未來預測道。

他認為結合AI的技術,未來(lai)家用(yong)機器(qi)(qi)人會(hui)進入(ru)家庭,但它(ta)要(yao)(yao)具備(bei)三個因素(su):第(di)一要(yao)(yao)能夠用(yong)語音做人機交互的界面;第(di)二要(yao)(yao)可以(yi)做影像(xiang)識(shi)別,比如通過攝(she)像(xiang)頭(tou)等傳感(gan)器(qi)(qi),它(ta)就(jiu)可以(yi)知道(dao)你家庭的樣子(掃地機器(qi)(qi)人);第(di)三在具備(bei)了(le)語音、影像(xiang)的功能后(hou),機器(qi)(qi)人還要(yao)(yao)有(you)智慧的學習,變得更加智能化。

“這(zhe)是(shi)未來家庭會發生(sheng)的改(gai)變,去年(nian)是(shi)(家用(yong))機器人的元(yuan)年(nian)”,他預測(ce)到(dao)。

考慮(lv)到(dao)聯(lian)發科(ke)的(de)語音(yin)芯(xin)片在智(zhi)能音(yin)箱中(zhong)占有60%~70%的(de)市場(chang)份額,全球超50%的(de)智(zhi)能家(jia)庭(ting)聯(lian)網(wang)設備(bei)由(you)聯(lian)發科(ke)WiFi芯(xin)片驅動,可(ke)見聯(lian)發科(ke)在物(wu)聯(lian)網(wang)芯(xin)片尤其是(shi)家(jia)庭(ting)市場(chang)扮演著重要角(jiao)色。而游人杰此言也(ye)指明了,語音(yin)交互下一階段會積極擁(yong)抱視(shi)覺(jue)AI能力,語音(yin)與視(shi)覺(jue)的(de)融合(he)才是(shi)語音(yin)交互或者說人機(ji)交互的(de)未來(lai),而家(jia)庭(ting)場(chang)景中(zhong)承載這一載體的(de)則是(shi)家(jia)用機(ji)器人。

二、VR兩三年內走向爆發

基于(yu)這(zhe)樣(yang)(yang)的認知和思考,圍繞家庭的智能終端(duan)產品要給用戶(hu)帶(dai)來(lai)什(shen)么樣(yang)(yang)的體(ti)驗呢?游人杰認為,無外(wai)乎這(zhe)三(san)點,舒適、安全、娛樂(le),聯(lian)發科也將基于(yu)這(zhe)三(san)點來(lai)布局家庭產品線。

深度:2000萬智能音箱戰火不滅,VR第二春要爆發!

這(zhe)幾點并(bing)不(bu)難理(li)解,所謂舒適就是(shi)生活更(geng)加智能化、便(bian)捷(jie)化,當你(ni)回到家(jia)打開門的(de)那一刻起,溫度、濕度、燈(deng)光等都是(shi)你(ni)想要的(de),而(er)這(zhe)離不(bu)開對家(jia)庭各種智能設備的(de)控制。

“智(zhi)能(neng)音箱就扮演了智(zhi)能(neng)家庭的控制中(zhong)心(xin)”,顯然相對于家庭場景的中(zhong)心(xin)到底是(shi)(shi)誰這一問題,在他看(kan)來就是(shi)(shi)智(zhi)能(neng)音箱。

而安全(quan)核(he)心的一塊(kuai)就是通過(guo)攝像機去做識別,比(bi)如通過(guo)攝像頭來進行家庭成員的情緒識別,判斷心情狀態。這意味著芯(xin)片(pian)需要(yao)具備(bei)更加強(qiang)大的算力(li)。

家庭同時也(ye)是(shi)一個娛樂(le)的(de)中心。當(dang)智東西問道家庭的(de)下(xia)一個爆品會是(shi)什么(me)時,游人(ren)杰稱會是(shi)VR/AR。他認(ren)為,“目前來看是(shi)VR/AR,是(shi)AI+視覺(jue)”。

當智東(dong)西問道這一(yi)現(xian)象多久才會(hui)到來,他稱(cheng)未來2~3年VR/AR會(hui)大(da)量爆發(fa)甚至普及。他舉例到,“以(yi)前(qian)VR眼鏡帶個15分鐘就會(hui)頭暈,但是現(xian)在可以(yi)帶1~2個小時,已經可以(yi)看一(yi)部電影(ying)了。”

而智東西在(zai)MWC上(shang)海期間,也深刻感(gan)受到VR設(she)備(bei)(bei)的火熱,從芯片公(gong)司、運營商到硬(ying)件設(she)備(bei)(bei)廠商的站臺上(shang)都會展(zhan)示其產品(pin)或技(ji)術在(zai)VR設(she)備(bei)(bei)上(shang)的應(ying)用(yong)。展(zhan)會上(shang)HTC vive用(yong)一(yi)個龐大(da)的站臺展(zhan)示自身的VR設(she)備(bei)(bei),其中還(huan)包括(kuo)多人對(dui)戰游戲,據員工介紹目(mu)前VR設(she)備(bei)(bei)已支(zhi)(zhi)持2V2對(dui)戰,支(zhi)(zhi)持3K高清視頻(pin)。似乎VR的發展(zhan)也到了一(yi)個臨界(jie)點,將要(yao)破土而出(chu)。

深度:2000萬智能音箱戰火不滅,VR第二春要爆發!

游人杰(jie)近一步指(zhi)出(chu),5G時(shi)代或者AI時(shi)代的來臨,這些都(dou)即(ji)將發生,聯發科會針對VR推出(chu)專門(men)設計(ji)的芯片,并且芯片本身特(te)別強(qiang)調低延(yan)遲,同時(shi)讓(rang)電池(chi)的使用(yong)時(shi)間多兩倍以上,讓(rang)用(yong)戶的體驗(yan)更(geng)好(hao)。

三、今年國內智能音箱市場規模2000萬臺

智能音箱迅猛的(de)發展(zhan)使之成為一(yi)個熱議的(de)話題。今(jin)年年初,游(you)人杰告訴智東西,最初他預測今(jin)年智能音箱市場(chang)規模(mo)應(ying)該會在5000萬(wan)左右,但(dan)隨著亞馬遜與谷歌市場(chang)的(de)競爭以及海外市場(chang)的(de)開拓,他指(zhi)出從(cong)當時(shi)的(de)局(ju)勢來看市場(chang)達到(dao)6000萬(wan)臺不是問題。

而在年中這樣一個(ge)時間節點,當智(zhi)東(dong)西(xi)再(zai)次(ci)問及(ji)他對(dui)(dui)全球智(zhi)能音(yin)箱市(shi)場的預期(qi)時,“全球至少6000萬以上(shang)”,他回答(da)到。從“不是問題”到“至少”,盡(jin)管6000萬臺的大數字沒變,但也(ye)呈現他對(dui)(dui)這一市(shi)場預期(qi)更加(jia)看好。

今年年初(chu),他(ta)針對國內(nei)(nei)市(shi)(shi)場(chang)預測(ce)到,國內(nei)(nei)市(shi)(shi)場(chang)規(gui)模(mo)預計至少10倍增長,市(shi)(shi)場(chang)規(gui)模(mo)將超過1000萬(wan)。而(er)此(ci)次再問及時,他(ta)稱國內(nei)(nei)市(shi)(shi)場(chang)規(gui)模(mo)將會達到1500萬(wan)~2000萬(wan)。這意味著國內(nei)(nei)智能音箱市(shi)(shi)場(chang)的強勁爆發。

深度:2000萬智能音箱戰火不滅,VR第二春要爆發!

當談到(dao)智能語(yu)音/語(yu)音芯片接下來的具體走(zou)勢時,他認為當智能音箱作為一個最基本的產(chan)品普及(ji)時,會呈現兩個趨勢:

第(di)一(yi)是產(chan)品(pin)(pin)會朝兩個方向走(zou),一(yi)個是產(chan)品(pin)(pin)往更(geng)低價(jia)、功能更(geng)簡單走(zou);另外一(yi)個是產(chan)品(pin)(pin)往高階走(zou),會加入屏幕、攝像頭等,會有更(geng)強的AI能力。

第二是語音演(yan)變成一個人機(ji)交互的(de)界面,進入各種家庭設備,都可以用(yong)語音來連接和控制。

這(zhe)兩(liang)點可以看(kan)做智(zhi)能(neng)(neng)(neng)(neng)音(yin)(yin)箱(xiang)或者智(zhi)能(neng)(neng)(neng)(neng)語(yu)(yu)音(yin)(yin)在縱(zong)向(xiang)(xiang)與(yu)橫向(xiang)(xiang)兩(liang)個(ge)方向(xiang)(xiang)的(de)發展(zhan)趨勢(shi),縱(zong)向(xiang)(xiang)就(jiu)是智(zhi)能(neng)(neng)(neng)(neng)音(yin)(yin)箱(xiang)產品(pin)本身品(pin)類的(de)多元(yuan)化,根據不(bu)同的(de)場景與(yu)定(ding)位主打不(bu)同的(de)產品(pin);橫向(xiang)(xiang)就(jiu)是智(zhi)能(neng)(neng)(neng)(neng)語(yu)(yu)音(yin)(yin)交互能(neng)(neng)(neng)(neng)力(li)從智(zhi)能(neng)(neng)(neng)(neng)音(yin)(yin)箱(xiang)擴散(san)到其他家居(ju)產品(pin)中,比如今年電視的(de)語(yu)(yu)音(yin)(yin)化就(jiu)是一個(ge)很好的(de)例證(zheng)。

此外,他(ta)的(de)話中(zhong)也暗示,帶屏智能音(yin)箱(xiang)也會是今(jin)年或(huo)者接下(xia)來的(de)一(yi)個重點產品。聯發科目前已經有(you)一(yi)款針對帶屏音(yin)箱(xiang)的(de)芯片方(fang)案,游人(ren)杰(jie)透露(lu)道,明年會推出下(xia)一(yi)代芯片解決方(fang)案MT8168,它會提供更強的(de)AI能力。

四、語音公司做芯片背后的算盤

近期短短2個月(yue)間,云知聲、Rokid、思必馳三家語(yu)音(yin)(yin)公(gong)司(si)(si)(si)或發布語(yu)音(yin)(yin)芯片,或公(gong)布語(yu)音(yin)(yin)芯片進展(zhan),語(yu)音(yin)(yin)技(ji)術創業公(gong)司(si)(si)(si)做(zuo)芯片已形(xing)成一股熱潮(chao)。前(qian)有(you)(you)云知聲CEO黃(huang)偉“語(yu)音(yin)(yin)公(gong)司(si)(si)(si)不做(zuo)芯片必死無疑(yi)”,后有(you)(you)Rokid CEO 祝(zhu)銘(ming)明“語(yu)音(yin)(yin)公(gong)司(si)(si)(si)做(zuo)芯片毋庸置疑(yi)”,而思必馳CEO高始興(xing)則稱是“順勢而為”。

有(you)趣(qu)的是(shi)(shi),思必馳也(ye)是(shi)(shi)聯發科投資(zi)的一家(jia)公司。此前(qian)智東西就將這一問題(ti)拋給思必馳CEO高始興(xing),為(wei)何有(you)聯發科的語音(yin)芯(xin)片可以使用的情(qing)況下,還有(you)推(tui)自有(you)芯(xin)片。他(ta)稱,“思必馳打(da)造語音(yin)芯(xin)片跟聯發科并不沖突(tu)”,主要(yao)為(wei)了產(chan)品在功耗、性(xing)能、成本(ben)上更具優(you)勢。

而今天智東西又將這一問題拋(pao)給了游人杰(jie),如何看待語音創(chuang)業(ye)公司做芯片(pian)?

在他看(kan)來,每一家語音公(gong)(gong)司(si)的算(suan)法都不同,需要對芯(xin)(xin)片(pian)硬件(jian)架構做耦合(he),才能夠產(chan)生(sheng)更好的效果與效能,這是語音創業公(gong)(gong)司(si)做AI芯(xin)(xin)片(pian)的一個主要原因。

他(ta)進一(yi)步(bu)指出,像科(ke)大訊飛、思(si)必馳(chi)做語音芯片(pian)更主要(yao)在于做DSP(數字信號(hao)處(chu)理)。目前用CPU、AP芯片(pian)(應用處(chu)理器芯片(pian))來(lai)做的方(fang)案,功耗比較高(gao)。

在(zai)(zai)語音芯(xin)片上(shang),聯發科也與思必馳搭配,使用(yong)思必馳的(de)(de)算法。“其(qi)實在(zai)(zai)市(shi)場是相(xiang)互合作的(de)(de)”,他近一步解釋道(dao),當思必馳把基于DSP的(de)(de)部分做好后,就可以減(jian)輕MCU(微(wei)控制單元(yuan))的(de)(de)算力,聯發科就可以用(yong)MCU來做更多的(de)(de)服務。

他又以聯(lian)發(fa)科(ke)(ke)投(tou)(tou)資的匯(hui)頂科(ke)(ke)技為例談到,最初聯(lian)發(fa)科(ke)(ke)投(tou)(tou)資了匯(hui)頂科(ke)(ke)技,當(dang)匯(hui)頂科(ke)(ke)技在手機(ji)指紋(wen)識別芯片做的很好(hao)的時(shi)候,聯(lian)發(fa)科(ke)(ke)就(jiu)不(bu)再做這塊,“當(dang)合作伙伴有競爭力時(shi),為什么要自己(ji)做”,他風趣地打(da)比方(fang)道(dao),聯(lian)發(fa)科(ke)(ke)就(jiu)像(xiang)一只母雞(ji),可以用投(tou)(tou)資的方(fang)式(shi),帶(dai)動更多小(xiao)雞(ji)的發(fa)展。

而在(zai)物聯網(wang)這個市場(chang)(chang),隨(sui)著語音交(jiao)互的(de)爆發,這會是一個很廣闊的(de)市場(chang)(chang)。游(you)人(ren)杰談到,目前智(zhi)能音箱是基于AP芯(xin)片來(lai)打造的(de), 未(wei)來(lai)帶屏(ping)后需要(yao)(yao)(yao)更強的(de)計算力(li),就(jiu)需要(yao)(yao)(yao)GPU的(de)支持。再擴展到IoT設備(bei),則主要(yao)(yao)(yao)用的(de)是基于MCU芯(xin)片打造的(de)。

“物(wu)聯網(wang)市(shi)場(chang)(chang)是很(hen)廣泛的,基本很(hen)難(nan)找到一家去主導,聯發科技也不會(hui)像智能(neng)音(yin)箱市(shi)場(chang)(chang)擁有(you)60%以(yi)上的市(shi)場(chang)(chang)份額”,游人杰此言意(yi)味著(zhu)在物(wu)聯網(wang)這個廣闊的市(shi)場(chang)(chang),創業公司(si)也會(hui)存在很(hen)多(duo)機遇(yu),物(wu)聯網(wang)這個市(shi)場(chang)(chang)也不可(ke)能(neng)一家獨大。

聯發科可以用投資的方式來覆蓋更多的應用場(chang)景,并(bing)于合作伙伴形成合力,占領更多市場(chang)。

結語:智慧家庭兩個爆發點

通過MWC上海展會上的觀(guan)察與游人杰的溝通,我們也更加清晰地看到,家庭(ting)智能終(zhong)端以(yi)及(ji)(ji)智能語音(yin)未(wei)來可(ke)能的發展趨勢。一(yi)方面智能語音(yin)以(yi)及(ji)(ji)智能音(yin)箱(xiang)會進(jin)一(yi)步(bu)爆(bao)(bao)發,另一(yi)方面VR也可(ke)能會在(zai)未(wei)來兩三年內實現爆(bao)(bao)發。

正如游人杰結合上游芯片(pian)端所(suo)作出的(de)預測,一方面全(quan)球智(zhi)能音(yin)(yin)箱至少6000萬臺銷量,國內智(zhi)能音(yin)(yin)箱將達到2000萬左右的(de)市場規模,智(zhi)能音(yin)(yin)箱將進一步(bu)快速增長(chang),并實(shi)現(xian)AI+語音(yin)(yin)/視覺(jue)的(de)融合。

此外(wai),我(wo)們(men)可以更加深(shen)刻(ke)的(de)(de)(de)感(gan)受(shou)到(dao)AI在(zai)芯片與(yu)終端設備的(de)(de)(de)融合,而這(zhe)些交(jiao)織在(zai)一起,無論是(shi)當下的(de)(de)(de)智能音箱,還是(shi)即將走向(xiang)爆發的(de)(de)(de)VR眼鏡,都(dou)推(tui)動我(wo)們(men)生活的(de)(de)(de)變革(ge)。


每日一頭條

趨勢·深度·犀利·干貨,最專業的行業解讀

深喉爆(bao)料、投稿(gao):guoren@sanyasheying.cn

深度:2000萬智能音箱戰火不滅,VR第二春要爆發!