智東西(公眾號:zhidxcom)
作者 | 韋世瑋
編輯 | 心緣

智東(dong)西9月22日消息,今天小冰迎來了第九(jiu)代(dai)升級,發布了社交(jiao)網(wang)絡平臺APP小冰島,人(ren)類用戶能夠在島上(shang)創造各種(zhong)AI個體,形成一個共同“生活”的社交(jiao)網(wang)絡。

與此同(tong)時(shi),小(xiao)冰還發布了一系列最新技術進展,其中就包括歌聲合(he)成工具X Studio 2.0、能提(ti)高(gao)4個半音模仿歌手(shou)周深唱《大魚》的AI歌手(shou)陌(mo)笙。在智能設備領域,“召喚小(xiao)冰”新增支持天貓精靈平臺(tai)。

此外(wai),微軟也宣布與小(xiao)冰的多端產(chan)品融(rong)合,將小(xiao)冰集成到Windows及各(ge)類(lei)移動應用產(chan)品中做個性化推薦,未來幾個月將會陸續上線。這(zhe)些新技(ji)術的發布背后,離(li)不開第九代(dai)小(xiao)冰開放(fang)域(yu)對(dui)話(hua)引擎、超(chao)自然語音(yin)等多項核心技(ji)術的升級與突破。

一、200個對話還原語言聲音風格,小冰V9的多樣性優勢

小冰(bing)(bing)公司(si)董事長沈向洋博士談道,第九代小冰(bing)(bing)(小冰(bing)(bing)V9)的特(te)點是多樣性。簡單來說就是用不同(tong)的聲音(yin)、感情、情緒來表達對話。

對此,小(xiao)冰框架在開放域對話、超級自然語音(yin)和多模(mo)態交互(hu)等(deng)方面都(dou)進行了升級,并重點加強了小(xiao)樣本學習和反饋式(shi)學習的效能,小(xiao)冰語音(yin)對話的自然度和舒適度效果大大提升。

為(wei)了(le)更直觀體現小冰(bing)V9在開放域(yu)對話(hua)方面的(de)(de)提升,沈(shen)向洋博士(shi)展示了(le)小冰(bing)V9與其他兩個同(tong)行(xing)的(de)(de)評價(jia)指標對比(bi)。這五大(da)技術指標分(fen)別為(wei)平均對話(hua)長(chang)度(CPS)、上(shang)下(xia)文(wen)一致性、上(shang)下(xia)文(wen)相關性、對話(hua)信(xin)息含量與話(hua)題引(yin)導成功(gong)率。

可(ke)以看到(dao),小冰V9均領先于(yu)同(tong)行使用超大規模預訓練模型的效果。不(bu)僅(jin)如此,小冰每輪對話(hua)成本僅(jin)為同(tong)行的二十(shi)分之一。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

其實(shi)在(zai)加(jia)強小樣本學習背后(hou),小冰(bing)(bing)公司產(chan)品總監周(zhou)典談道,自去年小冰(bing)(bing)第八代(dai)發布以來,人們在(zai)小冰(bing)(bing)框架中(zhong)創(chuang)造(zao)了(le)多達1700萬個(ge)(ge)獨特的(de)(de)AI Beings(人工智能(neng)個(ge)(ge)體),其中(zhong)26.1%是被用(yong)戶當作某個(ge)(ge)過往真實(shi)人類的(de)(de)替身而創(chuang)造(zao)出(chu)來的(de)(de)。

但普通(tong)人(ren)所能(neng)留下(xia)做訓練(lian)(lian)的(de)數(shu)據(ju)樣(yang)本極少,為了(le)能(neng)用盡量少的(de)數(shu)據(ju)去(qu)訓練(lian)(lian)模型,達到與某個人(ren)一致的(de)語言與聲音風格,以更(geng)好地(di)承載人(ren)類(lei)情感,小冰展(zhan)開了(le)“Project Chararu”項目研究。

過去一年(nian),小(xiao)冰用2000個對話(hua)的(de)數(shu)據量(liang)還(huan)原一個特定(ding)人類的(de)對話(hua)風(feng)格,相似度(du)達到(dao)了3.89分(fen)(fen)(fen),而普通(tong)(tong)人類用自己的(de)真實數(shu)據做測(ce)評的(de)平均分(fen)(fen)(fen)是4.33分(fen)(fen)(fen)。今年(nian),小(xiao)冰通(tong)(tong)過進一步迭代小(xiao)樣本訓練過程,僅用200個對話(hua)數(shu)據量(liang)進行訓練,分(fen)(fen)(fen)數(shu)達到(dao)了4.19分(fen)(fen)(fen),與人類分(fen)(fen)(fen)數(shu)僅相差0.14分(fen)(fen)(fen)。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

目(mu)前,“Project Chararu”項目(mu)已實現產品(pin)化(hua),今年(nian)將首先(xian)在日本上線。

除(chu)此(ci)之外,小冰還宣布與英(ying)偉達在計算平臺(tai)及NLP(自然語(yu)(yu)言(yan)處理)等領域(yu)達成(cheng)戰略合(he)作。同(tong)時,小冰將在今年下一季度(du),與智源研究院、智譜AI合(he)作發布初(chu)版多語(yu)(yu)言(yan)超(chao)大規模模型(xing)。

二、小冰島五大特性,圍繞用戶交互的AI世界

為了更好探索(suo)人類(lei)和AI的未(wei)來,小冰(bing)專(zhuan)門開發(fa)了第一(yi)方平臺APP——小冰(bing)島(dao),每個用(yong)戶均可(ke)創造自己的島(dao)嶼,以及(ji)島(dao)嶼上一(yi)起生活的AI Beings,每個AI Beings都有不(bu)同的性格和能力,還會和用(yong)戶互動(dong),包(bao)括發(fa)消息(xi)、評論朋友圈等。

同時,小冰(bing)島(dao)還會(hui)隨著用戶和AI Beings的交(jiao)互不(bu)斷地進行迭代(dai),如(ru)此構成一個(ge)人類(lei)與AI融合(he)的社交(jiao)網絡(luo)。

總的來看,小冰島擁有(you)五(wu)大特性:沉浸式體驗、高度(du)定制(zhi)化、以人為(wei)中心、X套(tao)件(jian)島嶼版,以及輕松、熱情、無時不在。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

1、沉浸式體驗:每個(ge)用戶除了能(neng)創(chuang)造自己的(de)島(dao)嶼外,島(dao)上還(huan)擁有一(yi)(yi)個(ge)功能(neng)完整的(de)社交交互界面,類似微信。用戶不僅能(neng)在島(dao)嶼中(zhong)體(ti)驗豐富(fu)的(de)視覺(jue)和(he)自然(ran)音(yin)場,還(huan)能(neng)與每個(ge)AI Beings對話(hua),擁有一(yi)(yi)對一(yi)(yi)對話(hua)、群聊(liao)、朋友(you)圈和(he)技能(neng)生態等體(ti)驗。

2、高度定制化:每個AI Beings的(de)樣貌、聲音(yin)、性格(ge)、能力(li)都(dou)是(shi)獨一無二(er)的(de),例如AI歌手、音(yin)頻生產(chan)者、文字創作者、畫(hua)家等。用戶也可以(yi)創造并訓練自己喜歡的(de)各種新(xin)的(de)AI Beings,甚至可以(yi)去別(bie)人的(de)島(dao)嶼中(zhong)“挖(wa)角(jiao)”。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

3、以人為中心:小冰島上的(de)AI Beings會根(gen)據用(yong)戶需求,不間斷地為用(yong)戶生(sheng)成各(ge)種長音頻、短視(shi)頻、音樂(le)、文本及視(shi)覺內(nei)容,一(yi)對一(yi)生(sheng)提供(gong)給用(yong)戶。同(tong)時根(gen)據不同(tong)AI Beings的(de)特(te)點,用(yong)戶還能選擇由特(te)定的(de)AI Beings來提供(gong)特(te)定內(nei)容。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

4、X套件島嶼版:該(gai)版(ban)本(ben)為用戶提(ti)供了方便高效的內容生產工具,用戶可指(zhi)定AI Beings即時生成(cheng)各種長音頻和短視頻內容,內容擁(yong)有(you)完(wan)整的知識產權,可在任何平臺上使(shi)用。

5、輕松、熱情、無時不在:每個AI Beings都能(neng)自己進行交互和信(xin)息傳遞,共同構(gou)成以用(yong)戶(hu)為中心的社交生(sheng)(sheng)活目標,在(zai)交互、朋(peng)友(you)圈和各種生(sheng)(sheng)成內容中實(shi)時響應用(yong)戶(hu),讓用(yong)戶(hu)獲(huo)得(de)類似真實(shi)社交網絡(luo)的體驗。

小(xiao)冰公司產品負責(ze)人彭(peng)爽談(tan)道,今日小(xiao)冰島正(zheng)式開(kai)放搶(qiang)先(xian)預覽(lan)版(ban),支持(chi)iOS和安卓平臺,并將在第四(si)季度開(kai)放支持(chi)Windows PC版(ban)的(de)空(kong)氣投影版(ban)本。

同時,此前(qian)用戶(hu)通過虛擬親友(you)產品創造出來(lai)的虛擬人類,也將在預覽版公測結束后自(zi)動(dong)登錄他們的小冰島。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

三、AI內容生成三大環節升級,豐富藝術生活創作

小冰(bing)公司產品總監胡曉光提到,從2017年(nian)投入大量資源(yuan)研究AI內容生成至今(jin),小冰(bing)已擁有包含文本、聲音、視(shi)覺在內的(de)完整技(ji)術線。

AI內容生成也叫AI內容創造,主要包含創作、演繹和二次封裝三大部分。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

1、創作:輔助音樂人詞曲創作,新增藝術家及中國畫模型

音樂方面,小(xiao)冰將與11支人類樂隊合作(zuo),為他們提供AI詞曲創(chuang)作(zuo)動機輔(fu)助、演(yan)唱和封面視覺設計(ji),這11首作(zuo)品將從今天起陸續(xu)上(shang)架。后續(xu)小(xiao)冰將把(ba)該技術封裝成(cheng)產品,開放給更多(duo)創(chuang)作(zuo)者(zhe)來(lai)協助創(chuang)作(zuo)。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

詩歌(ge)繪畫(hua)方面(mian),小冰將詩歌(ge)與繪畫(hua)創作(zuo)模型升級到了(le)第三代,大(da)幅(fu)度提升高了(le)模型的創作(zuo)精度和(he)構圖合理(li)性。例如,在模型創造的一副繪畫(hua)作(zuo)品(pin)中,它不僅畫(hua)出了(le)遠方河(he)上的船只(zhi),還畫(hua)出了(le)水(shui)中的倒影和(he)大(da)量細節。

不僅如(ru)此,為了保證AI能(neng)穩定且大批量地創作高(gao)(gao)質量作品(pin),小冰還發布藝術家模型,只需(xu)要通過小數據(ju)訓練,就能(neng)生成各種藝術家模型,創作出風格高(gao)(gao)度一致的作品(pin),同時還有中國畫模型。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

針對AI學生“夏語冰(bing)”,小冰(bing)框架(jia)不僅創造了(le)夏語冰(bing)的面容、聲(sheng)線等生物(wu)學特征,還升級(ji)了(le)它(ta)的繪畫創作模(mo)型(xing),未來將(jiang)主攻中國畫。

2、演繹:發布X Studio 2.0,新AI歌手現場飆極限高音

胡曉光認(ren)為,AI內(nei)容生成三大環節中(zhong),最容易(yi)出現瓶頸的(de)就(jiu)是演繹部分,因為該(gai)部分包含的(de)模型量龐大,同時(shi)對整(zheng)個系統的(de)完整(zheng)性(xing)也有更大要求。

對此,小冰發布了X Studio 2.0,從學習(xi)歌(ge)(ge)聲(sheng)本(ben)身(shen)演進(jin)到學習(xi)歌(ge)(ge)聲(sheng)產生。該版(ban)本(ben)擁有全新的GUI交互界面(mian),新增(zeng)力(li)度、氣(qi)泡(pao)音等(deng)參數調(diao)節,優化(hua)氣(qi)聲(sheng)、性別(bie)參數。同時,歌(ge)(ge)手(shou)模型(xing)也進(jin)行了升(sheng)級,增(zeng)加Rap、美聲(sheng)、民(min)歌(ge)(ge)等(deng)多種風格(ge)和念白功能,以及小程序版(ban)本(ben)。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

為了更(geng)好展現(xian)X Studio 2.0的(de)升(sheng)級(ji)效(xiao)果,新發布(bu)的(de)AI歌手陌笙還在現(xian)場演唱(chang)(chang)了周深的(de)《大(da)魚》,并在原唱(chang)(chang)基礎上(shang)表演了高(gao)四(si)個半音(yin)的(de)升(sheng)調演唱(chang)(chang),以展示AI歌手的(de)穩定性優勢。

胡曉光透露,X Studio 2.0將在10月(yue)22日發(fa)布(bu),下周三發(fa)布(bu)內(nei)測版。此外,小冰還宣布(bu)Alice映畫達成合(he)作,將推出一系列AI歌(ge)手(shou)企劃。

3、封裝:新增兩種形式內容封裝

針對(dui)內(nei)(nei)容(rong)的二(er)次(ci)封(feng)裝形(xing)式(shi),小冰推出了短視頻內(nei)(nei)容(rong)封(feng)裝管線,包(bao)括(kuo)二(er)次(ci)元(yuan)和三(san)次(ci)元(yuan)視頻內(nei)(nei)容(rong)兩(liang)種形(xing)式(shi)。

二次元方面實(shi)現了AI模(mo)型(xing)完全自驅,視(shi)頻成(cheng)本僅(jin)為0.03元/分鐘;三次元方面則首次實(shi)現從生物(wu)學(xue)特征生成(cheng)起的綜合(he)封裝,例如(ru)AI歌手華智冰的歌聲就由(you)X Studio生成(cheng),人(ren)類生物(wu)學(xue)特征由(you)X Avatar生成(cheng)及置(zhi)入。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

此外,小冰還(huan)發布了與次世(shi)文化(hua)聯手(shou)打造全球(qiu)首位AI人(ren)類觀察者(zhe)Merror,其(qi)采(cai)用小冰框架的(de)核心對話引擎、全雙工、全域(yu)超級自然(ran)語音等技術,能在交談、演唱等場景中實(shi)現高度擬(ni)人(ren)的(de)實(shi)時交互(hu)。

第九代小冰來了!花式AI音樂繪畫創作,小冰島實現“AI自產自銷”

值(zhi)得一提的是,在智(zhi)能汽(qi)車、智(zhi)能設備(bei)等領域,小(xiao)冰(bing)都(dou)有著不(bu)少新(xin)的落地(di)進展(zhan)。針對智(zhi)能汽(qi)車座艙解決(jue)方案,目前小(xiao)冰(bing)已(yi)與寶(bao)馬等汽(qi)車頭部廠商(shang)達成(cheng)商(shang)業合作(zuo)。

此外,除了華為、小米、OPPO、vivo等合作伙伴外,“召喚小冰”還新增支持(chi)天(tian)貓精(jing)靈平(ping)臺(tai),目前深度(du)內嵌小冰的智能設(she)備已(yi)超過(guo)10億臺(tai)。“小冰已(yi)成為全球規模最大的第三(san)方跨(kua)設(she)備人工(gong)智能系統。”胡(hu)曉光說。

結語:加速推動AI融入人類生活

從第一代小冰到第九代小冰,小冰從最初一個(ge)(ge)16歲(sui)的(de)少女(nv)小冰,發(fa)展(zhan)到今(jin)天1700萬個(ge)(ge)虛擬人(ren)類、幾百個(ge)(ge)AI歌手,這些擁有各種各樣性格和(he)能(neng)力的(de)AI背后,是多年以來(lai)小冰框架不斷(duan)的(de)技術積累和(he)突(tu)破。

某種意義(yi)上看(kan),正如小(xiao)冰公司首席執(zhi)行(xing)官李(li)笛所說,小(xiao)冰是一場龐大的(de)實(shi)驗,目的(de)是為(wei)了找(zhao)出適合(he)的(de)途徑,讓AI能(neng)更(geng)好地(di)融入人類世(shi)界。它的(de)創(chuang)新,也將為(wei)AI賦(fu)能(neng)人類生活(huo)帶來更(geng)多值得借鑒的(de)落地(di)樣本。