智東西(公眾號:zhidxcom)
作者 | 云鵬
編輯 | 漠影

在今天的AI大模型時代,AI和終端場景要如何結合才能真正為我們的生活帶來便利?這是當下每一(yi)家科技巨頭都在(zai)思(si)考和(he)面對的(de)問題。

在大模型落地(di)千行百業的大潮之下(xia),智能手機作為(wei)(wei)與普通消費者(zhe)生活最為(wei)(wei)貼近的產(chan)品,也(ye)在快速卷入AI革命的浪(lang)潮中。

iOS版、安卓版ChatGPT的先后發布讓更多人可以接觸到大模型帶來的技術紅利,而語音助手與大模型的結合也成為科技巨頭們正在爭奪的關鍵高地。

一(yi)邊谷歌計劃徹底重塑其智能(neng)語音助手,將大(da)模型(xing)(xing)能(neng)力(li)融(rong)入,另一(yi)邊蘋果(guo)Siri也曾被多(duo)次曝光將融(rong)入大(da)模型(xing)(xing)相(xiang)關(guan)能(neng)力(li),微軟的Copilot則已經(jing)完成對(dui)Cortana的替代。

終端設備中的AI迎來一場大模型革命,已成大勢所趨。一直被消費者詬病不夠“智能”的語音助手,究竟要如何借助大模型變得“更智能”?

就在8月4日,華為率先交出了一份(fen)答(da)卷。

在華為盤古L0基座大模型的基礎上,華為針對終端消費者場景構建了大量的場景數據與精調模型后的L1層對話模型,并將該模(mo)型用(yong)在了智慧助手(shou)小藝(yi)中,全新的小藝(yi)在今(jin)年(nian)華為開發者大會上(shang)正式亮相。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

基于此,華為也成為國內率先將大模型能力融入智慧助手并面向消費者落地的科技公司。

用華為的話來說,在大模型的加持下,小藝變得“更聰明、更能干、更貼心”了(le)。基于華為(wei)大模(mo)型和AI技術(shu)的進步,小藝(yi)迎來了(le)一次顛覆性的智能化革新(xin),而(er)這些新(xin)體(ti)驗,也將進一步擴展至華為(wei)“1+8”的產(chan)品生態中(zhong)。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

大模型的融入究竟能給如今的智慧助手們帶來怎樣的“進化”?華為是(shi)如(ru)何克服重重行(xing)業此(ci)前未(wei)能(neng)突(tu)破的難題將大(da)模型成功落地在終端中的?小藝掀(xian)起(qi)的智能(neng)語音助手新革命又將對(dui)產業有著怎(zen)樣深遠的影響?

可以確定的是,讓智慧助手給我們每個人的日常生活真正帶來便利和樂趣,華為把這件事又往前推了一大步。

一、語言理解力暴漲,人人化身玩機達人,小藝變得更聰明了

從大(da)模(mo)型(xing)進入大(da)眾視野的第一天起,一個討論(lun)就從未停息:由大(da)模(mo)型(xing)驅動的聊(liao)天機器人是否會取(qu)代(dai)手機上的智慧(hui)助手?

今天,從華為給出的答案來看,兩者絕非替代關系,由大模型賦能的智慧助手能夠帶來的體驗革新,可以說讓許多曾經的“想象”真正走入了“現實”。智慧助手(shou)越來越像你真正(zheng)的管家(jia)、朋友,人工智能(neng)的“智能(neng)化(hua)”邁入了新的階(jie)段。

縱觀小藝的升級,最直觀的體現就是:小藝真的變“聰明”了,它知道我在說什么、能夠更精準地讀懂我話里的意思了。

比(bi)如我(wo)(wo)可以直接跟(gen)小(xiao)(xiao)藝說,“能(neng)(neng)不能(neng)(neng)把手機壁紙設(she)置成實時天(tian)氣?”此(ci)時小(xiao)(xiao)藝就能(neng)(neng)明白我(wo)(wo)是想要全景天(tian)氣壁紙。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

對于再復雜一(yi)點的場景,比如今晚我(wo)想請人(ren)吃飯,就可以直接跟小(xiao)藝(yi)說,“找一(yi)家附近(jin)評分高(gao)的海鮮餐廳(ting),最好有(you)適合四個人(ren)的優惠(hui)套餐”,此時(shi)小(xiao)藝(yi)可以準確理解我(wo)的意圖,并直接調用(yong)美團服務給(gei)我(wo)找到相關餐廳(ting)。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

當我(wo)隨手拍一個海(hai)報(bao),針(zhen)對海(hai)報(bao)圖片,就(jiu)可以用自然交(jiao)流的(de)方(fang)式去(qu)問小藝(yi)相關的(de)信息并獲取服務,比如我(wo)可以跟小藝(yi)說,“我(wo)想參加技(ji)術(shu)論壇(tan),導航去(qu)圖上的(de)地(di)址”,此時小藝(yi)就(jiu)可以準確(que)識別海(hai)報(bao)中的(de)地(di)址信息并打開導航App進行導航。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

在大模型能力的加持下,小藝還可以處理更加復雜的場景編排任(ren)務,幫我們(men)創造專(zhuan)屬于自己(ji)的(de)特殊場景。

如果喜(xi)歡運(yun)動健身,我可以讓小藝創(chuang)建一個“晨跑場景(jing)”,要求為“每周一到周五(wu)早(zao)上(shang)6點半為我播報當天(tian)天(tian)氣,6點半到7點我會跑步,當我戴上(shang)藍牙耳機(ji)的時候,就(jiu)播放收(shou)藏的歌曲,并把手機(ji)設置為靜音模式(shi)”。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

這一系列看似復雜的操作,都可以通過這“一句話的時間”讓小藝直接設置完成。

可以說,在“更聰明”的小藝的幫助下,我們不再需要一項項地查看玩機技巧和大量的功能說明,每個人都可以成為“玩機達人”,因(yin)為我們只需要問小藝就可以了(le)。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

小藝這種能(neng)力的提升,讓很多(duo)智能(neng)手(shou)機具(ju)有(you)的強大功能(neng),可以簡(jian)單便捷地、通過(guo)語(yu)音口(kou)述的方式(shi)被用戶所接觸到(dao)。

縱觀小藝在“更聰明”層面的諸多升級,我們能清晰地看到,大模型能力的融入,搬開了阻礙用戶養成智慧助手使用習慣的最大絆腳石之一——不夠自然的對話、無法隨心所欲的自然交流。

想要真正讓智能語音助手從好玩、新奇走向好用,甚至成為一種“習慣動作”,優秀的語言理解和交互能力是必不可少的。大模型讓智能語音助手真正能夠讀懂、聽懂我們,其易用性的提升是極為顯著的。

二、數千字文章秒生摘要,圖文多模創作不在話下,小藝更能干了

除了自然語言理解能力的跨越式迭代,大模型加持下的小藝在生產力方面效率提升也十分可觀,這也是大模型應用的強項之一,智能語音助手終(zhong)于(yu)可以參與到我們平時工(gong)作的具體內容中來了。

比如(ru)當我們在一些內容資(zi)訊App上看到一篇(pian)文章(zhang),就可(ke)以問小藝,“這篇(pian)文章(zhang)主要講了什么”,此時小藝就可(ke)以快速對文章(zhang)內容進行重點總(zong)結并生成簡短的(de)摘(zhai)要。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

根據華為在開發者大會上的演示,對于一篇3000多字的文章,一次輸入給模型,模型可以在幾秒之內完成對文章的總結。

我們(men)還可以進一(yi)步針(zhen)對這(zhe)篇文(wen)章的內容去(qu)延(yan)伸問(wen)(wen)一(yi)些(xie)問(wen)(wen)題,小藝(yi)都(dou)可以從文(wen)章中找到(dao)相關信息組成簡潔(jie)明了(le)的答案呈現給我們(men)。

不僅是文章、新聞,小(xiao)藝甚(shen)至還可以讀論文,可以說,在(zai)大模型能力的(de)加持下,每個人都(dou)有機會(hui)在(zai)小(xiao)藝的(de)幫助下不斷地提升(sheng)自己的(de)能力。

除了理解文章,小藝還可以“寫文章”。當我(wo)要和一個初次見面的合(he)作伙伴開會(hui)時(shi),我(wo)可以(yi)直(zhi)接跟(gen)小藝口(kou)述會(hui)議(yi)的時(shi)間、邀請的公司人(ren)員以(yi)及討論內容,小藝就會(hui)幫我(wo)寫一封會(hui)議(yi)邀請的郵(you)件。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

據了(le)解,目前小藝已(yi)經學習(xi)了(le)上(shang)百種的文案風(feng)格,包括各類書(shu)信、公文、商業文案、祝福語、故事(shi)、工作總結等。

其實不只是文字,對于圖片的生成和創作,小藝同樣拿手。

比如在特(te)定的節日(ri),我只要把相關主題、風(feng)格告訴小藝(yi),小藝(yi)就可以根據我的照片(pian),一鍵生(sheng)成一張屬于我的創意(yi)卡片(pian)。借(jie)助多模態大模型技術,小藝(yi)無(wu)疑可以幫我們(men)更好地使(shi)用(yong)手(shou)機(ji)里(li)的大量(liang)影像(xiang)素(su)材。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

縱觀小藝在辦公生產力方面的提升,可以說小藝已經不僅是生活中懂我的朋友,更是我們工作中的得力助手。大模型能力的融入顯著促進了智慧助手生產效率的提升。

在當下這(zhe)個快(kuai)節(jie)奏的時代,小藝快(kuai)速提供靈(ling)感、輔(fu)助(zhu)創作、節(jie)省時間(jian)獲取(qu)關鍵信(xin)息的這(zhe)一(yi)系列能力,都顯得十分“需(xu)求對口(kou)”。

大模型讓智能語音助手從“需要”變為“必要”,從“能用”變為“好用”,實用性得到了顯著提升。

三、從通用到“專屬”,AI也可以更有溫度

在大模型的加持下,小藝在各方面的能力都有了長足進步,而當我們將時間線拉長,我們還能看到“進化”后的小藝帶來的更深層價值。

隨著小藝與我們相處的時間越來越長,我們和小藝不斷地交流,小藝就會變得越來越懂我們,給出的建議也會更加貼心和個性化,從一個通用智慧助手變為我的“專屬貼心管家”。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

比如我(wo)(wo)在開會時有一(yi)些(xie)待辦事項(xiang),可以(yi)通(tong)過“隨口(kou)描述(shu)”的方(fang)式(shi)讓小藝記錄下來(lai),小藝可以(yi)對我(wo)(wo)口(kou)述(shu)的內容進行理解(jie),并將這些(xie)重要事項(xiang)提煉出來(lai),放(fang)在日歷或者備忘錄中。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

這還沒完,等過(guo)一段(duan)時(shi)間(jian),如果我還要(yao)根據上次(ci)開(kai)(kai)會(hui)的(de)(de)(de)待辦事(shi)項,再(zai)次(ci)與合(he)作(zuo)伙伴開(kai)(kai)會(hui),我就可以讓(rang)小藝根據之前(qian)記錄(lu)的(de)(de)(de)信息直接寫(xie)出一封新的(de)(de)(de)會(hui)議邀請郵(you)件。

當然,對(dui)于生(sheng)(sheng)活中的(de)(de)一些(xie)重要時(shi)刻,比(bi)如父母(mu)的(de)(de)生(sheng)(sheng)日,小藝可以幫我(wo)記住,并(bing)且在提(ti)醒的(de)(de)同時(shi),為我(wo)提(ti)供更多的(de)(de)服務推(tui)薦,比(bi)如餐廳的(de)(de)選擇、禮物(wu)的(de)(de)購買建(jian)議(yi),這(zhe)些(xie)服務可以一觸直達對(dui)應的(de)(de)App。

此外,當(dang)我們出差時,如果我是(shi)一個喜歡美食的(de)人,小(xiao)藝(yi)就(jiu)(jiu)會(hui)幫我推薦一些當(dang)地的(de)美食,如果小(xiao)藝(yi)此前知道我喜歡旅(lv)游,它就(jiu)(jiu)會(hui)給(gei)我介紹一些當(dang)地的(de)景點。

當小藝對我們更了解的時候,小藝提出的建議也會更加個性化,有(you)更高的概率契合(he)我們(men)當下(xia)的實際(ji)需求。

值得一提的是,小藝相關的個性化數據和學習都是在端側進行的處理的,從而保證數據的安全和隱私。在華為看來,安全與隱私保護是他們在所有AI場景設計和體驗創新中遵循的第一原則。AI不能無中生有,更不能被濫用,AI是輔助而不是替代,AI是增強而不是虛構。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

正如華為所思考的一樣,在AI技術高速發展的當下,用更負責任地態度去做更透明的AI,審慎創新善用AI,必然是所有科技企業都應堅持的方向。

四、重構大模型與智慧助手,顛覆體驗離不開硬核技術創新

不論是更聰明、更能干的小藝,還是更個性化、更貼心的小藝,抑或是語音交流更加逼真、更有溫度的小藝,大模型正讓智能語音助手變得更加易用、實用、好用,從根本上解決用戶使用語音助手中遇到的諸多“頑疾”,帶來體驗上的“質變”。

而在這種(zhong)質變的背后,華為在硬(ying)核技術層面的積累(lei)和創(chuang)新(xin)無(wu)疑是關鍵支撐。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

實際上,華為從底層就重構了大模型與智慧助手的整個協作系統,摒棄了過去多個系統獨立構建的“割裂”模式,讓大模型成為智慧系統的大腦,以大模型為核心,無縫利用大模型的高階能力,對系統進行全面增強。

這一架構方向挑戰(zhan)巨(ju)大,此前業(ye)界沒有(you)成熟(shu)的(de)商用(yong)案例,但(dan)華(hua)為仍然(ran)決定做“第一個吃螃(pang)蟹的(de)人”。

為此(ci)華為構(gou)(gou)造了各場景下的語料數據,并設計了能讓(rang)系統理解、可執行的模(mo)型輸出,同時華為給大模(mo)型注入了可信(xin)的結構(gou)(gou)化、非(fei)結構(gou)(gou)化知識(shi)(shi),讓(rang)大模(mo)型能夠學習到通識(shi)(shi)、邏輯關系。

具體來看,華為在預訓練、設備操控以及端云協同方面的突破都可圈可點。

首先,預訓練的能力強不強,是對各家內功的真正考驗。在預訓練中,華為構建大量的不同類型表達的語料庫,讓大模型在預訓練的階段中就成為精通各類表達的大師。

同時,華為從一開始就希望小藝向著“更智能的私人助理”這一方向去進(jin)化(hua)。為(wei)此華為(wei)將大(da)模(mo)型(xing)的(de)能力(li)進(jin)行細化(hua)拆解,在此基礎上構建完整的(de)測試(shi)數據集,并(bing)使用能力(li)樹指導(dao)數據構建和(he)大(da)模(mo)型(xing)能力(li)構建。

在設備操控方面,如何利用大模型進行設備控制,實現真正的智能化設備控制,是用戶體(ti)驗能否實(shi)現跨越式升級的關鍵。

為(wei)(wei)此,華為(wei)(wei)將設備控(kong)制中(zhong)大模(mo)型(xing)生成文(wen)本(ben)的格式做(zuo)到了(le)幾乎百分百的遵從(cong)度,讓(rang)中(zhong)樞系統(tong)高(gao)效解(jie)析和對接。同時為(wei)(wei)了(le)解(jie)決場景(jing)復(fu)雜的挑(tiao)戰,華為(wei)(wei)詳細梳理消費者場景(jing)制定工具使用說明書,讓(rang)大模(mo)型(xing)“先(xian)學習(xi)再上崗”。

針對大(da)模(mo)型(xing)高昂推理成(cheng)本和(he)推理時延(yan)的難(nan)題,華(hua)為設計了(le)多套完(wan)全不同的工具調用(yong)范式,將工具調用(yong)等待(dai)時間加(jia)速了(le)一倍。

從最終落地結果來看,小藝所使用的大模型,可以很好地覆蓋對話、出行旅游、設備操控、吃穿住行等各類終端消費場景,其知識范圍、事實性、實時性以及安全合規等多方面都得到了針對性優化和(he)增強。

最后在端云協同方面,個性化數據處理需要端側模型,端側算力和功耗的限制又使得云側模型不可或缺。云側和端側要如何分配任務、協同配合,是對廠商技術的考驗。華為在大模型端云協同領域積累的技術能力,讓個性化體驗得以實現。

據了解,針對消費者在不同設備不同場景下的需求,華為小藝背后的大模型擁有端側和云側等形態。在小藝與大模型的結合中,端側大模型會先對用戶請求和上下文信息做一層預處理,再將預處理后的需求發送到云側,從而最大化地發揮“端側模型快”和“云側模型強”的優勢。

從重構大模型與智慧語音助手的協同關系,到克服諸多大模型落地終端場景面臨的技術挑戰,華為還是那個我們熟悉的華為,技術創新能力仍然是華為最硬的底牌。

五、打通軟硬全鏈條,讓大模型成為“系統級”能力,全場景生態加速落地

正如我們開頭所說,AI和終端場景要如何結合才能真正為我們的生活帶來便利,是當下終端側AI技術落地應(ying)用需要回答的(de)關鍵問(wen)題。

華為小藝的一系列技術、能(neng)力升級(ji),讓我們(men)看(kan)到了大模型如(ru)何(he)更加貼近消(xiao)費(fei)者的使用場(chang)景,大模型的應用如(ru)何(he)“更接地氣”?小藝可以說做(zuo)了一個很好的示范(fan)。

華(hua)為從用(yong)(yong)戶體驗出發(fa),用(yong)(yong)技術解(jie)決問(wen)題,將傳統語(yu)音助手在體驗上的(de)“不(bu)可能”變成了可能。

相比OpenAI的(de)ChatGPT、谷歌的(de)Bard這些生成式AI聊(liao)天機器人,華為的(de)小藝是在HarmonyOS操作系統層面,為華為終端用戶(hu)提供(gong)語音(yin)對話、圖文識別(bie)、服務(wu)建議、設備智慧能(neng)力開(kai)放和設備互(hu)聯管(guan)理的(de)應用。

從硬件、軟件、系統到應用層全鏈條的打通,華為讓大模型成為“系統級”能力,這是其他產品所無法比擬的,也是華為的核心優勢之一。

從云端(duan)服務器中的(de)芯片,到終端(duan)設備(bei)中的(de)鴻(hong)蒙操作系(xi)統(tong)和鴻(hong)蒙應用生態,華為這種全(quan)棧式(shi)技術能力(li)是小藝與大模型結合(he)如(ru)此高效且(qie)順利的(de)關鍵支(zhi)撐。

華為相關AI專家告訴智東西,系統級的入口跟操作系統結合地更加緊密,跟生態的互聯也做到了系統生態底層,這種互聯才是真正高效的。

與此同時,華為小藝基(ji)于華為鴻蒙生態形(xing)成的(de)優勢(shi)也是其獨特競爭力。

目前華為的(de)(de)各類(lei)終端產品面向(xiang)全場(chang)(chang)景(jing)布(bu)局,其中“1+8”這幾類(lei)核心產品小藝都(dou)已完成(cheng)覆蓋,未(wei)來(lai)結合全場(chang)(chang)景(jing)設(she)備的(de)(de)業(ye)務(wu)形態,華為能夠將擁有大模型能力(li)的(de)(de)小藝部署到(dao)消費者全場(chang)(chang)景(jing)體驗上。

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

基于小藝的大模型能力在華為全場景業務生態中全面落地,已經只是時間的問題了。

結語:大模型掀起語音助手進化潮,華為已先行一步

此次基于(yu)大模型技(ji)術,小(xiao)藝掌握了(le)更(geng)多技(ji)能,從更(geng)自然流暢的(de)(de)(de)對話(hua)交互到更(geng)高效(xiao)便捷的(de)(de)(de)生產力應(ying)用(yong),從更(geng)懂(dong)你的(de)(de)(de)主動服務到更(geng)有溫度的(de)(de)(de)個(ge)(ge)性化服務,華(hua)為(wei)已經成為(wei)科技(ji)巨頭中將大模型與(yu)端(duan)側用(yong)戶體驗結(jie)合的(de)(de)(de)最為(wei)緊(jin)密(mi)的(de)(de)(de)一(yi)個(ge)(ge)。

目前,華為(wei)全新的(de)小藝智慧助手(shou)將在今(jin)年8月底開(kai)放(fang)邀請測試,并于(yu)晚(wan)(wan)些時候(hou)在搭(da)載HarmonyOS 4.0及以上操作系統的(de)部分機型中通過(guo)OTA升級,具體(ti)升級計劃會稍晚(wan)(wan)公布(bu)。

真正讓大模型服務于普通消費者,讓每個人享受到生成式AI帶來的體驗革新,這是(shi)小藝對于產業和用戶最大的價值所在。

面向未(wei)來,大模型(xing)與智能(neng)語(yu)音助手的結合(he)必將更加緊密,隨著后續各路科技巨頭的跟(gen)進,智能(neng)語(yu)音助手的“進化”浪潮將勢不(bu)可擋。未(wei)來還會有(you)哪(na)些新的應用(yong)場景、新的應用(yong)形態和功能(neng)涌(yong)現出來,都令(ling)人(ren)充滿想象空(kong)間。