智東西(公眾號:zhidxcom)
作者 |? 程茜
編輯 |? 心緣

智東西2月27日報道,昨夜,亞馬遜生成式AI版智能助手Alexa終于現身!這也是Alexa自2014年發布至今,近11年后的首次重大更新

升級后的Alexa被叫做Alexa+,可以與用戶自然對話,還能記住家庭不同成員的個人習慣提供個性化建議,完成制定旅行計劃、提煉郵件重點等各種復雜的任務。彭博社知名記者馬克·古爾曼將Alexa+稱作“加強版的ChatGPT語音模式”,令人印象深刻(ke)。他還提到蘋果在這個領域落后了很(hen)遠(yuan)。

亞馬遜Alexa史詩級重生!注入大模型靈魂,6億智能家居設備狂歡

現場(chang)演示(shi)中(zhong),Alexa+可以根(gen)據(ju)用(yong)戶指令自(zi)(zi)如切換播放設備,讓(rang)音樂、視(shi)頻在不(bu)同房間流轉;能(neng)與(yu)家庭(ting)中(zhong)的(de)安防攝像(xiang)頭聯動,自(zi)(zi)主調出與(yu)用(yong)戶指令相關(guan)的(de)視(shi)頻片段,如“遛狗了嗎”等;可以完成各種復雜(za)指令,如根(gen)據(ju)家庭(ting)成員的(de)習慣選擇(ze)餐(can)廳、預(yu)定餐(can)廳,叫出租(zu)車去機場(chang)接客人,然后實時同步出租(zu)車信息(xi)等。

Alexa+的能力是基于亞馬遜Bedrock平臺來訪問最先進的大語言模型,其中既包括亞馬遜自己的Nova模型,也涵蓋了AI獨角獸Anthropic的模型。截至目前,亞馬遜在全球已售出超過6億臺搭載Alexa的設備。

不過,該服務并沒有立刻推出,將于未來幾周內開始在美國推出,隨后在未來幾個月內開始在Echo Show 8、10、1521等設備中推出。其費用是每月19.99美元Prime會員可免費使用(yong)(Prime會員費用(yong)是(shi)每(mei)月14.99美(mei)元(yuan)或每(mei)年139美(mei)元(yuan))。

值得一提的是(shi),這也是(shi)亞(ya)(ya)(ya)馬(ma)遜(xun)(xun)設備(bei)業務主(zhu)管(guan)Panos Panay首(shou)次主(zhu)持亞(ya)(ya)(ya)馬(ma)遜(xun)(xun)相關硬件(jian)活動,他于2023年從Dave Limp手(shou)中接管(guan)了亞(ya)(ya)(ya)馬(ma)遜(xun)(xun)的硬件(jian)部(bu)門。

一、生成式AI加持,Alexa化身舞臺操控師、家庭全職保安、郵件整理專家、兒童陪伴專家

生成式AI版的智能助手Alexa+有幾大核心升級:自(zi)然對話、個性化交互、完成復雜任務、更聰明

首先在對話方面,它可以理(li)解上下(xia)文含義與用戶進行自然、流暢的(de)對話。其次(ci)(ci),隨著使用次(ci)(ci)數(shu)增加,Alexa+可以了解到用戶家(jia)庭中不同成員(yuan)的(de)飲食偏好、習(xi)慣、過(guo)敏(min)等(deng),從而(er)為其提供更加個性化(hua)的(de)答案。此外,Alexa+可以完成從制(zhi)定約會(hui)計劃、到購買禮品、安排旅(lv)行等(deng)復雜任務。

正(zheng)式演示的時候,Alexa+身(shen)兼數職(zhi),化身(shen)舞(wu)臺操控師、家庭(ting)全職(zhi)保安、郵件整理專(zhuan)家、兒(er)童陪(pei)伴專(zhuan)家……

發布時,Panay周(zhou)圍(wei)擺放(fang)了數(shu)臺Echo Studio設(she)(she)備,他(ta)先給出指令:“開始播(bo)放(fang)Lady Gaga的《Shallow Ground》”,然(ran)(ran)后告訴Alexa+在左邊和(he)右邊播(bo)放(fang)音樂,其會(hui)自動(dong)改變播(bo)放(fang)歌曲(qu)的設(she)(she)備。然(ran)(ran)后他(ta)說(shuo)“把音樂移(yi)到(dao)電視上”,Alexa就(jiu)自動(dong)將播(bo)放(fang)設(she)(she)備切換至Fire TV。

Panay接著說(shuo):“你能(neng)直接跳到電影中的那個場景嗎?”然后Alexa會自動(dong)將電視(shi)上的電影轉移(yi)到播放歌曲的設備中。

▲Alexa+根據指令(ling)控(kong)制音樂播放(視頻來(lai)源:Tom’s Guide)

Alexa+還可以與(yu)Ring的(de)安防攝(she)像(xiang)頭聯動。當(dang)演(yan)示人(ren)員(yuan)詢問(wen):“Alexa,我家周圍今天發生了些什么事(shi)?”Alexa就會將攝(she)像(xiang)頭拍(pai)到的(de)關鍵信息(xi)進(jin)行截(jie)取(qu)呈現。然后,Panay問(wen)“是否有(you)人(ren)遛過他的(de)狗”,Alexa就截(jie)取(qu)了他家狗被(bei)遛的(de)片(pian)段,以及狗跳上亞(ya)馬遜的(de)送(song)貨卡車、被(bei)司機投喂的(de)鏡頭。

亞馬遜Alexa史詩級重生!注入大模型靈魂,6億智能家居設備狂歡

還(huan)有(you)一項新的Alexa+功(gong)能。用戶(hu)可(ke)以與其共(gong)享電子郵件、產品手冊、食譜、學習材料等各種文件,Alexa+會從這些文檔中提取和(he)調用相關信息(xi),為(wei)用戶(hu)提供摘要并根據特定請求將事件添加到日歷中。

亞馬遜Alexa史詩級重生!注入大模型靈魂,6億智能家居設備狂歡

有(you)兩項針(zhen)對兒童的(de)(de)Alexa+新功(gong)能(neng):提(ti)問(wen)、編故事。孩子(zi)們可以向(xiang)Alexa+提(ti)出各種關于地理、生物等(deng)方面(mian)的(de)(de)問(wen)題,智能(neng)助(zhu)手會(hui)通過對話(hua)的(de)(de)方式進行回答;第二項功(gong)能(neng)是編故事,孩子(zi)給出指令后(hou),Alexa+會(hui)向(xiang)孩子(zi)提(ti)出其他問(wen)題,以幫助(zhu)填(tian)寫(xie)故事情(qing)節。

二、瀏覽器、App、智能音箱無縫銜接,能自主鏈接外部網站

為了方便用(yong)戶使用(yong),亞(ya)馬(ma)遜(xun)為Alexa+推(tui)出了全新用(yong)戶界(jie)面,并且正在推(tui)出alexa.com網站和新的移(yi)動應用(yong)程序。

亞馬遜Alexa史詩級重生!注入大模型靈魂,6億智能家居設備狂歡

在使用(yong)過程中,用(yong)戶不(bu)會受(shou)設(she)備切(qie)換(huan)限(xian)制,能在Echo設(she)備、應用(yong)程序和Web瀏覽(lan)器連續體驗,Alexa+可以記住對話(hua)上下文,不(bu)同設(she)備切(qie)換(huan)也不(bu)會影響對話(hua)效果。

開發人(ren)員可(ke)以通過API直(zhi)接(jie)集(ji)成(cheng)(cheng)。例如,當用戶想要預訂(ding)晚餐時(shi),Alexa+會完成(cheng)(cheng)訂(ding)餐、接(jie)客(ke)人(ren)、訂(ding)車等一(yi)系列(lie)工作。它(ta)首先會直(zhi)接(jie)與(yu)美國在線(xian)訂(ding)餐平臺OpenTable連接(jie),然后Alexa+會提供(gong)叫(jiao)Uber去(qu)機場接(jie)人(ren)的(de)預估費用以及到達時(shi)間(jian)、發送短信給客(ke)人(ren)同(tong)步Uber的(de)信息。

如果沒(mei)有外部化(hua)的(de)API,Alexa+也能夠鏈接到亞馬遜合作(zuo)伙伴(ban)的(de)網站(zhan)來完(wan)成(cheng)任(ren)務。演示人員演示了一(yi)個廚(chu)房的(de)緊(jin)急情(qing)況。

他提出指令(ling):“Alexa,我的Miele烤箱不工作(zuo)。你能派人過來嗎?”Alexa+提供了多個電器維(wei)修服務(wu)平(ping)臺,然后(hou)在演示人員選擇了一個之后(hou),Alexa通過Thumbtack網站與這些平(ping)臺取得聯系。

亞馬遜Alexa史詩級重生!注入大模型靈魂,6億智能家居設備狂歡

現場,他(ta)們(men)展示(shi)了(le)Alexa+與音樂(le)生成(cheng)工具Suno的集(ji)成(cheng),用(yong)戶(hu)可以(yi)將簡單的請求轉化為完整的歌(ge)(ge)曲,包括人聲,歌(ge)(ge)詞和樂(le)器。他(ta)宣布了(le)新的Alexa AI Multi-Agent SDK的預覽,該SDK將允許品牌與Alexa一起展示(shi)他(ta)們(men)Agent。

亞馬遜Alexa史詩級重生!注入大模型靈魂,6億智能家居設備狂歡

最后,演示人員展示了Alexa+未來的(de)(de)一(yi)項功(gong)(gong)能,該(gai)功(gong)(gong)能將(jiang)使用戶在對話中(zhong)創建(jian)和編輯購(gou)物(wu)清單(dan)、根據飲食偏好修改清單(dan),并向Amazon Fresh訂單(dan)添加(jia)物(wu)品(pin)等。現場演示人員給(gei)出的(de)(de)指(zhi)令不僅僅是配(pei)料,他在說話的(de)(de)過程(cheng)中(zhong)多(duo)次停頓或者增加(jia)、改變(bian)指(zhi)令,如“我需(xu)要(yao)香蕉面包的(de)(de)所有東(dong)西,除了香料”,“將(jiang)一(yi)加(jia)侖牛(niu)奶改為兩加(jia)侖”,“添加(jia)更多(duo)雞蛋”、“還(huan)有一(yi)個孩子要(yao)來吃晚飯”等。

此外,亞馬遜與數十家新聞和體育媒體合作,使得Alexa+能獲(huo)取到最新的新聞和信息。

三、根據特定任務自選模型,讓Alexa擁有實操能力

研發人員提到,Alexa+可以利用亞馬遜Amazon Bedrock平臺來訪(fang)問最先進的(de)大語言模(mo)型(xing),其中既包括亞馬遜自己的(de)Nova模(mo)型(xing),也涵蓋(gai)了AI獨角獸Anthropic的(de)模(mo)型(xing),其采用了一種與模(mo)型(xing)無關的(de)系(xi)統,使(shi)得Alexa+能夠針對任何特定任務選擇最佳的(de)模(mo)型(xing)。

Panay談到了亞(ya)馬遜對(dui)Alexa的終極期待。

聊天機器人本身無法幫助用戶完成訂購商品等任務,亞馬遜需要Alexa與周圍事物產生連接并實際采取行動。Panay把(ba)它比作(zuo)一(yi)個管(guan)弦樂隊:每個樂器(qi)都可以獨立工作(zuo),但需要一(yi)個指揮把(ba)它們組合(he)在一(yi)起。

此外,亞馬遜CEO?Andy?Jassy還提到,亞馬遜使用AI來解決真實的客(ke)戶(hu)問(wen)題已經25年了(le),但最近(jin)隨著生成式(shi)A的出現(xian)情況發(fa)生了(le)變化。他談到了亞馬遜的三層AI體(ti)系:

底層是(shi)亞(ya)馬遜(xun)自研(yan)芯(xin)片為模(mo)型訓練(lian)提供更高性價比(bi),以及使用亞(ya)馬遜(xun)的(de)SageMaker AI來(lai)構建、訓練(lian)和部署機器學(xue)習模(mo)型;中層是基(ji)于針對AI生成的(de)圖像和文本的(de)云(yun)服務Amazon Bedrock,讓(rang)多個AI協(xie)同工(gong)作(zuo);頂層(ceng)是用(yong)于(yu)由第三方公司構(gou)建的生成式AI應用(yong)程序(xu),這主要針對兩個(ge)方面:成本規(gui)避和(he)客戶體(ti)驗。

結語:亞馬遜加速尋找生成式AI時代Alexa新變量

去年(nian)9月,亞馬遜就公開了(le)搭載大模型的(de)Alexa新能力,呈現出引入大語言模型,語音助手、智能家居設備等(deng)智能終端將更(geng)(geng)準(zhun)確地(di)理解用戶的(de)指令和需求的(de)潛力,從而實現智能終端更(geng)(geng)加(jia)智能化、人性化,滿足更(geng)(geng)自然、更(geng)(geng)流暢的(de)交(jiao)互體驗。

自2014年推出(chu)以來,亞馬遜已向Alexa投入了數(shu)十億(yi)美元(yuan)。但多年來Alexa缺乏(fa)革(ge)命性(xing)的升級,使(shi)得諸多用戶的使(shi)用頻率降(jiang)低,在AI時(shi)代(dai)這(zhe)一現象尤(you)其明顯。如今,這一發布11年(nian)之久的(de)(de)智能(neng)助手終于迎來重磅更(geng)新,并呈(cheng)現出更(geng)強大(da)的(de)(de)功能(neng)和更(geng)豐富的(de)(de)應用場景(jing),對個人生活、智能(neng)家居、教育、娛樂等多個領域或許都將(jiang)產(chan)生更(geng)深遠的(de)(de)影響。