
智東西(公眾號:zhidxcom)
作者?|?程茜
編輯?|?漠影
我(wo)們的(de)(de)生活(huo)、工作(zuo)正在被越來(lai)越多的(de)(de)設(she)備連(lian)接起(qi)來(lai),從家庭中大大小小的(de)(de)智(zhi)能(neng)家居設(she)備,到每天佩戴的(de)(de)智(zhi)能(neng)手表(biao),以及出行工具汽車(che)的(de)(de)智(zhi)能(neng)化、網(wang)聯化。與此同時(shi),這些設(she)備也正在通(tong)過音頻或視(shi)頻的(de)(de)實時(shi)互動方(fang)式,最終使得人、設(she)備和家庭、工作(zuo)場(chang)景無縫連(lian)接起(qi)來(lai)。
就在上周末(mo),聲(sheng)勢浩大的(de)中(zhong)國家電(dian)及(ji)消費電(dian)子博覽會(AWE)落下帷幕,可(ke)以看出,這場家電(dian)盛宴中(zhong),越來越多的(de)智能(neng)家居設備在互(hu)動(dong)中(zhong)都(dou)需要(yao)音視(shi)頻技術的(de)支持,并讓用(yong)戶擁有酷炫、沉浸(jin)式的(de)互(hu)動(dong)體驗。
多了一塊屏(ping)幕的冰箱、有語(yu)音交互能(neng)力的電視……都預(yu)示著擁有“眼(yan)睛(jing)”和“耳朵”已經成(cheng)為(wei)智能(neng)家居設備的硬指標。
作(zuo)為全球(qiu)實時互(hu)動(dong)API平(ping)臺開創者(zhe)和引領者(zhe)的聲(sheng)網,同樣看到(dao)了這一趨勢(shi)。在AWE同期的GTIC 2023全球(qiu)AIoT智能家居(ju)峰會(hui)上,聲(sheng)網IoT負責(ze)人侯(hou)云憶以《聲(sheng)網實時互(hu)動(dong):開啟智能家居(ju)「真互(hu)動(dong)」時代(dai)》為主題進行了演講。
▲聲網(wang)IoT負責人(ren)侯云憶
那么(me),智能(neng)家居的(de)(de)(de)“真互(hu)動”時代到底是(shi)什么(me)?在(zai)(zai)這(zhe)一(yi)背景下,聲(sheng)網(wang)在(zai)(zai)其中扮演了什么(me)樣的(de)(de)(de)角色?實時互(hu)動技術(shu)又(you)將為智能(neng)家居行業帶來哪些(xie)新(xin)的(de)(de)(de)變量?我(wo)們(men)試圖從(cong)聲(sheng)網(wang)的(de)(de)(de)布局中找到這(zhe)些(xie)問題的(de)(de)(de)答(da)案。
一、以人為中心,跨越距離、空間和設備限制
智能家居(ju)設備的邊界正在以人(ren)為中心不(bu)斷向外延伸,而交互屬(shu)性(xing)更強、用戶(hu)感知(zhi)度(du)更高的實時互動技術正在這之中迸發出旺盛的生命力。
侯云憶說,幾(ji)乎每個(ge)(ge)家(jia)(jia)庭里都會(hui)有三(san)到(dao)五個(ge)(ge)音視(shi)頻設備,而這些設備正在從家(jia)(jia)庭這個(ge)(ge)物理空間(jian)內向(xiang)外(wai)拓展,根據用戶需求連接到(dao)更多的應(ying)用和(he)終端上。而這些硬(ying)件設備也正在被實時互動賦予新的形態、角(jiao)色和(he)定位。
作為(wei)用戶智(zhi)慧(hui)家(jia)庭(ting)的(de)(de)(de)入(ru)口(kou),擁有視頻畫(hua)面(mian)(mian)的(de)(de)(de)智(zhi)能(neng)(neng)(neng)門鎖(suo)已經成為(wei)這一(yi)行(xing)業的(de)(de)(de)標配。這都得益于視頻畫(hua)面(mian)(mian)帶給智(zhi)能(neng)(neng)(neng)門鎖(suo)的(de)(de)(de)新變量,不(bu)同的(de)(de)(de)設(she)(she)備(bei)通過同一(yi)屏(ping)幕畫(hua)面(mian)(mian)進行(xing)了連接,并且智(zhi)能(neng)(neng)(neng)門鎖(suo)的(de)(de)(de)角(jiao)色定位已經從(cong)簡單(dan)的(de)(de)(de)監(jian)控、門鈴功(gong)能(neng)(neng)(neng),圍繞著用戶的(de)(de)(de)需求不(bu)斷滲透至人們生活的(de)(de)(de)方(fang)方(fang)面(mian)(mian)面(mian)(mian),如今,這一(yi)設(she)(she)備(bei)已經與用戶的(de)(de)(de)智(zhi)能(neng)(neng)(neng)手機、家(jia)中的(de)(de)(de)智(zhi)慧(hui)屏(ping)、智(zhi)能(neng)(neng)(neng)汽車的(de)(de)(de)終端(duan)設(she)(she)備(bei)實(shi)現(xian)了跨(kua)場景(jing)、跨(kua)設(she)(she)備(bei)的(de)(de)(de)互聯互通。
▲華為(wei)智(zhi)(zhi)能(neng)門鎖(suo)Pro可(ke)以與智(zhi)(zhi)能(neng)手(shou)機(ji)、智(zhi)(zhi)慧(hui)屏相連接(圖(tu)源(yuan):華為(wei)官網)
此(ci)外,人們對智(zhi)能(neng)家居(ju)設備遠程互動(dong)和情感連(lian)接的需求正在日益增長。以智(zhi)能(neng)攝(she)像(xiang)頭為例,除監控(kong)這一基本功能(neng)外,搭載(zai)音視頻技術(shu)的智(zhi)能(neng)攝(she)像(xiang)頭可以化(hua)身人們聯(lian)系(xi)遠程朋友(you)、親(qin)屬的工具(ju),其作(zuo)用已經從簡單的監控(kong)安全(quan)升級(ji)至情感連(lian)接和提供陪(pei)伴服(fu)務(wu)。
亞馬(ma)遜此前發布的家庭(ting)助理機器(qi)(qi)(qi)人(ren)Astro,更是通過音視頻(pin)為原先(xian)冷冰冰的機器(qi)(qi)(qi)人(ren)賦予了“機器(qi)(qi)(qi)人(ren)家庭(ting)管(guan)家”的角色。
▲亞(ya)馬遜家庭助理(li)機器人(ren)Astro支持遠程(cheng)視(shi)頻通話(圖源:亞(ya)馬遜)
事實上(shang)(shang),實時互動(dong)帶來的(de)新變(bian)量不止于此,一(yi)些屏幕出(chu)現在(zai)了(le)(le)很多(duo)意想不到(dao)的(de)場(chang)景中(zhong)。侯云(yun)憶稱,在(zai)智能(neng)教(jiao)(jiao)育賽道上(shang)(shang),各類搭載屏幕的(de)臺燈、桌子等(deng)新設(she)備層(ceng)出(chu)不窮,這些與學(xue)生(sheng)學(xue)習息息相關的(de)硬件設(she)備,通過音視頻增(zeng)加了(le)(le)一(yi)鍵連線家長、老師,輔助教(jiao)(jiao)學(xue)等(deng)增(zeng)值服務,使其在(zai)教(jiao)(jiao)育場(chang)景下成為能(neng)輸出(chu)高(gao)質量內容且有(you)高(gao)粘性需求的(de)品類。
可以(yi)看出(chu),實時互動(dong)技術正在(zai)以(yi)人(ren)為(wei)中心,從用(yong)戶的(de)不(bu)同(tong)需求、不(bu)同(tong)場景出(chu)發(fa),拓展硬件(jian)設備的(de)形態的(de)同(tong)時賦予其連(lian)接(jie)用(yong)戶家庭情感的(de)紐帶。
綜(zong)上,這些(xie)硬(ying)件設備角色的(de)延伸(shen),也預示著兩大趨(qu)勢。侯云憶認為,首先,智能(neng)硬(ying)件設備正在(zai)從單品智能(neng)向場景(jing)智能(neng)以及以人為本的(de)終端(duan)互聯邁進,其次,能(neng)多(duo)人多(duo)端(duan)實時(shi)交互的(de)屏幕,正在(zai)使得這些(xie)設備從工具化身為人與人之間(jian)情感連(lian)接的(de)角色。
智能硬件角色轉變的背后,是實時音視頻技術的發展。侯云憶認為,早期的智能設備通過P2P技術只能達到即時預覽、能看能聽,而目前這些智能設備之所以能化身以人為中心的情感連接和陪伴,是因為進入了“真互動”時代,聲網為這個行業定義的“真互動”就是全球端到端400ms級別以下的超低延遲,可以在全球任意終端、任意形式、任意規模實現隨時隨地互動無界的交互。
可見,以人為(wei)核心的(de)“真互動(dong)”時代正在向(xiang)智能(neng)家居滲透,并逐漸(jian)成為(wei)標配。
基于這(zhe)樣的(de)(de)思考(kao),聲(sheng)網(wang)的(de)(de)IoT解決(jue)方案已(yi)經布局(ju)了(le)(le)面向智能穿戴、家(jia)居和(he)(he)出(chu)行領(ling)域等(deng)共40+的(de)(de)品類(lei)設(she)備(bei)(bei)。基于這(zhe)些(xie)場景和(he)(he)設(she)備(bei)(bei),聲(sheng)網(wang)提(ti)供了(le)(le)包括實時(shi)音視頻、媒體加速和(he)(he)可靠信令等(deng)PaaS服務,幫(bang)助(zhu)這(zhe)些(xie)設(she)備(bei)(bei)提(ti)供遠程實時(shi)監控(kong)、視頻通話和(he)(he)遠程應急協作等(deng)服務和(he)(he)功(gong)能。
二、首創全球軟件定義實時網,刷新互動體驗天花板
可(ke)以看出,實時(shi)互(hu)動技術廣泛應用于(yu)智能家居設(she)(she)備已經成為必然(ran)趨勢(shi),這(zhe)也在硬件設(she)(she)備廠商之間達成了共識。但其對于(yu)硬件設(she)(she)備廠商而言并不(bu)是一件容易的(de)事,它們不(bu)僅要從頭(tou)開(kai)始研發(fa),還需要考慮開(kai)發(fa)難度(du)(du)、部署難度(du)(du)、運維難度(du)(du)以及(ji)這(zhe)背(bei)后(hou)的(de)成本。
“我們希望設備廠商在硬件(jian)不增(zeng)加成本的(de)情(qing)況下,通(tong)過聲網(wang)(wang)的(de)IoT解決方案,在網(wang)(wang)絡(luo)、音(yin)頻和視頻幾個方面,能夠(gou)突破網(wang)(wang)絡(luo)限(xian)制(zhi)、平臺限(xian)制(zhi)和設備限(xian)制(zhi)做到互聯互通(tong),讓(rang)本身的(de)低端設備也可以做到高端體驗(yan),使用(yong)戶能獲取高質(zhi)量互動體驗(yan)。”侯云(yun)憶透露。
作為在實時互動領域的專業玩家,聲網深耕在實時音視頻領域數年,并一直圍繞物聯網設備和場景去不斷優化實時互動用戶體驗。依托于聲網自研的全球軟件定義實時網—SD-RTN,可以讓硬(ying)件(jian)設備突(tu)破網絡限制,即(ji)使在(zai)弱網的情況下,也能保障80%丟包下音(yin)視頻通(tong)話流暢(chang)。
在面(mian)向(xiang)場景的深(shen)度適(shi)(shi)配上,聲網的智能(neng)人居(ju)解決方案適(shi)(shi)配了(le)安(an)卓、鴻蒙(meng)、LiteOS、小米VelaOS等主流操作系統(tong),以(yi)及(ji)為硬件廠商提供(gong)了(le)軟硬一(yi)體(ti)以(yi)及(ji)官方適(shi)(shi)配的SDK,如有樂鑫科技(ji)、BEKEN等能(neng)滿(man)足低功耗音視頻設(she)備場景的品牌(pai),也有英偉達等面(mian)向(xiang)高性能(neng)計(ji)算的解決方案組合(he)。
此(ci)外,智能家居設備(bei)的碎片化特征,導致設備(bei)形態、種類豐富多樣,想要提(ti)升用(yong)戶的使用(yong)體驗,聲網(wang)(wang)解決方案(an)需要考慮(lv)到更多智能硬件設備(bei)的需求。侯云憶稱,聲網(wang)(wang)目前是整個行業里RTC廠(chang)商(shang)當中覆(fu)蓋(gai)平臺(tai)以及能夠做到互聯互通終(zhong)端最全、最多的廠(chang)商(shang),其解決方案(an)能覆(fu)蓋(gai)手機、音箱(xiang)、小(xiao)程序、智慧(hui)屏等多個終(zhong)端。
值得一提(ti)的是(shi),聲網的解決方案同時支持對接第三方生態,能夠實現主流Amazon Alexa和Google Assistant在海外的協議互(hu)通。
“過去硬(ying)(ying)件(jian)本身的(de)(de)(de)性(xing)能可能決定(ding)了用戶體驗的(de)(de)(de)上(shang)(shang)限,我們希望幫(bang)助伙(huo)伴,在不(bu)(bu)增(zeng)加(jia)硬(ying)(ying)件(jian)和不(bu)(bu)增(zeng)加(jia)云端(duan)算力(li)的(de)(de)(de)情況下,能夠突破硬(ying)(ying)件(jian)使用的(de)(de)(de)上(shang)(shang)限。”侯云憶介(jie)紹,以視(shi)頻(pin)(pin)門鈴或者門鎖(suo)的(de)(de)(de)場景為例,當硬(ying)(ying)件(jian)資源不(bu)(bu)足或者帶寬不(bu)(bu)夠、網絡差的(de)(de)(de)情況下,畫(hua)面的(de)(de)(de)畫(hua)質會變差,但通過客戶端(duan)的(de)(de)(de)視(shi)頻(pin)(pin)增(zeng)強方式,基于深度學(xue)習(xi)的(de)(de)(de)自研超分算法,可以支持1.5倍(bei)、2倍(bei)、3倍(bei)的(de)(de)(de)移動端(duan)實時(shi)超分,幫(bang)助硬(ying)(ying)件(jian)從360P增(zeng)加(jia)到720P,提升畫(hua)質清(qing)晰(xi)度。
不僅(jin)如(ru)此,聲(sheng)網的(de)(de)多項音視(shi)頻黑(hei)科技不斷(duan)刷(shua)新用(yong)戶(hu)互動體(ti)驗天(tian)花板,有專為實時互動打造的(de)(de)自研高(gao)清語音引擎, 視(shi)頻增強策略(lve)、實時美聲(sheng)算法、AI降噪和回聲(sheng)消(xiao)除能力(li)等技術(shu),讓用(yong)戶(hu)擁有更(geng)高(gao)保真(zhen)、更(geng)趣(qu)味、更(geng)高(gao)清畫(hua)質的(de)(de)音視(shi)頻體(ti)驗。
在實時互動這(zhe)條路上(shang),聲網不斷深耕打磨自己的技術,進(jin)一步讓音視頻技術賦能于硬件設備上(shang)。其和智能家(jia)居硬件廠(chang)商的角色也(ye)正印證了這(zhe)句俗語(yu):讓專業的人做專業的事。
三、實時互動生態能力凸顯,不斷突破硬件能力邊界
當一個趨勢成(cheng)為行業共識(shi)的時候(hou),參與(yu)者(zhe)的相(xiang)互碰撞必(bi)然會產(chan)生新(xin)的火花(hua)。
聲網去年推出(chu)靈隼物聯(lian)網云平臺至(zhi)今(jin)已近一年時間,在這個過程中,實時互動與智能家(jia)居設備碰撞出(chu)的火(huo)花也越(yue)來越(yue)多。
智能家居產業上(shang)游(you),更多的芯片(pian)廠(chang)(chang)商正在將實時(shi)互動作為產品規劃標配。侯云憶認為,這(zhe)也體現了上(shang)游(you)廠(chang)(chang)商對音視頻的重視程度在不斷提高。
此(ci)前,芯片和(he)模組原(yuan)廠很(hen)少關(guan)注其(qi)(qi)產品會較多出現在哪些細分場(chang)景(jing)或哪些硬(ying)件(jian)設備中,但隨著實時互動技術的(de)成熟,智(zhi)能家(jia)居在其(qi)(qi)中的(de)參與(yu)度越(yue)來越(yue)高。與(yu)此(ci)同時,聲網(wang)作為軟件(jian)提供商與(yu)上游玩家(jia)進行(xing)軟硬(ying)件(jian)結合的(de)過程中,也開始探(tan)索新(xin)的(de)使用場(chang)景(jing)。
一定程度上,這一產(chan)業模式也會(hui)(hui)推(tui)動應(ying)用(yong)端設備(bei)的創新與(yu)迭代(dai),智(zhi)能家(jia)居玩(wan)家(jia)會(hui)(hui)去競爭實時互動領域的差(cha)異化能力,例(li)如一些互動性更強的寵物機器(qi)人、割草機器(qi)人等。當這一技術成為基(ji)準后(hou),其在智(zhi)能家(jia)居設備(bei)上體現出的能力也更具多(duo)樣性。侯(hou)云憶補充(chong)說,雖(sui)然很(hen)多(duo)品類的布局(ju)在他(ta)們預(yu)期之內,但開發者(zhe)拓展過(guo)程中(zhong)給了他(ta)們很(hen)多(duo)驚喜(xi)。
在(zai)這個過程中,聲網(wang)的靈(ling)隼物聯(lian)網(wang)云(yun)平(ping)臺更像撬動實時(shi)互動在(zai)智能家居領域應用的關鍵(jian)樞(shu)紐,真正讓這一技術在(zai)上中下(xia)游之間“開始游動”,使得整(zheng)個產(chan)業鏈開始關注這件事。
而置身(shen)其中(zhong)的參與者聲網的感受也更(geng)為深刻(ke)。2020年,聲網和小天才合(he)作落地(di)了(le)(le)全球(qiu)首個RTOS兒(er)童電話(hua)(hua)手(shou)表,成為業內獨家(jia)實現RTOS平臺量產實時(shi)互動全功能(neng)(neng)服務的企(qi)業。侯(hou)云憶透露,聲網解決方案為兒(er)童手(shou)表提供了(le)(le)音視頻通話(hua)(hua)能(neng)(neng)力(li),擴展了(le)(le)它的場景,也就(jiu)是(shi)“用軟件去(qu)提高兒(er)童手(shou)表這類低功耗設備的能(neng)(neng)力(li)上限(xian)” 。
這些經驗(yan)的積(ji)累,也成為聲網(wang)不斷探索新場(chang)景,并轉(zhuan)化為自己在智能家居領域積(ji)累的技術優勢。
目前(qian),聲網已經和國內(nei)智(zhi)能攝像(xiang)頭、智(zhi)能門鈴、智(zhi)能門鎖等行業的頭部玩(wan)家(jia)(jia)達成合作,在(zai)軟件的加持下,讓(rang)實時互動技(ji)術的優(you)勢更(geng)廣泛的體(ti)現在(zai)智(zhi)能家(jia)(jia)居設備中(zhong)。
面向(xiang)未(wei)來(lai),生(sheng)成式AI技(ji)術(shu)強大(da)的(de)(de)內容生(sheng)成、理(li)解、推理(li)能(neng)力也(ye)帶給了人機交(jiao)互更大(da)的(de)(de)想象空(kong)間,與此同時,大(da)模型(xing)加持(chi)下的(de)(de)設備(bei)(bei)能(neng)更懂人、更理(li)解人,那么人對基于此的(de)(de)智能(neng)家居(ju)設備(bei)(bei)黏性也(ye)一定會(hui)被提高。侯云憶認(ren)為,前(qian)沿技(ji)術(shu)的(de)(de)加持(chi)下未(wei)來(lai)可穿戴(dai)設備(bei)(bei)、家庭機器人等設備(bei)(bei)的(de)(de)需(xu)求(qiu)將會(hui)爆發,這(zhe)一趨勢對于這(zhe)其中實時互動(dong)能(neng)力的(de)(de)建設等都會(hui)有巨大(da)的(de)(de)推動(dong)作用。
結語:實時互動正在與智能家居擦出火花
各類前沿技(ji)術(shu)的(de)(de)出現與(yu)快速發展正(zheng)在賦予智能家(jia)居新的(de)(de)想象(xiang)空(kong)間,同時,實時互動技(ji)術(shu)的(de)(de)出現為(wei)智能家(jia)居玩家(jia)帶來更(geng)多擁有差異化競(jing)爭(zheng)優勢(shi)的(de)(de)可能性。不過,這(zhe)離不開以(yi)聲網為(wei)代表的(de)(de)專(zhuan)業玩家(jia)的(de)(de)技(ji)術(shu)支(zhi)撐。
當下,我們已(yi)經看到實時(shi)互動在智能(neng)家居設(she)備(bei)(bei)之中(zhong)的(de)(de)必要性,被賦予“眼睛”和“耳朵”的(de)(de)硬件設(she)備(bei)(bei)正頻(pin)繁(fan)出現(xian)在我們的(de)(de)生活(huo)中(zhong),硬件設(she)備(bei)(bei)承載的(de)(de)信息密度正在不斷提升(sheng),并且(qie)視頻(pin)、音頻(pin)、圖片等多模(mo)態信息的(de)(de)大量(liang)輸入輸出。
正(zheng)如(ru)侯云憶所說,聲網的愿景是希望實時(shi)互(hu)動可(ke)以像(xiang)水和空氣一樣無(wu)處不在。實時(shi)互(hu)動技術未(wei)來可(ke)能(neng)讓(rang)智能(neng)家居設備的形(xing)態、用戶體驗等方面(mian)都產(chan)生質的飛(fei)躍。