
智東西(公眾號:zhidxcom)
編輯 | GenAICon 2024
2024中國生成式(shi)AI大會于4月18-19日在北(bei)京舉行,在大會首日的主會場(chang)開幕式(shi)上,昆侖萬(wan)維董事長(chang)兼CEO方漢以(yi)《從天(tian)工SkyMusic音樂大模型談SOTA紅利》為題發表演講(jiang)。
方漢強調了“技術領先”在AI領域的重要性,不同于互聯網時代產品的商業模式導向,大模型時代技術導向才能帶來市場上的領先優勢,吸引大量用戶并獲取紅利。
OpenAI在AI創企中的地位,本質上是其文本大模型的SOTA(當前技術指標第一)能力帶來的。對于當前的AI創業者,在圖像、視頻、音樂等任何賽道,只要能取得SOTA,就能通過技術優勢獲得大量用戶,后續再通過產品創新、商業模式創新把用戶固化在平臺上,形成自己的護城河。
在AGI和AIGC領域,昆侖萬維研發出了天工3.0模型,包含音樂大模型SkyMusic和全球最大規模的開源MoE大模型。其中音樂大模型SkyMusic就處于音樂領域的SOTA地位。
SkyMusic音樂(le)(le)大(da)模型支持多(duo)種(zhong)方(fang)言輸出,具有(you)辨識度(du)的(de)自(zi)然(ran)人聲、降(jiang)低音樂(le)(le)創(chuang)作(zuo)門檻和成本等,便于內容行(xing)(xing)業發(fa)展。基于音質、自(zi)然(ran)度(du)和理解度(du)方(fang)面的(de)優勢,即(ji)使是沒有(you)音樂(le)(le)背(bei)景(jing)的(de)普(pu)通(tong)人也能夠利用該技(ji)術進行(xing)(xing)音樂(le)(le)創(chuang)作(zuo),而這(zhe)也將(jiang)極(ji)大(da)地擴展音樂(le)(le)創(chuang)作(zuo)的(de)可能性和范圍(wei)。
此外(wai),天(tian)工(gong)3.0大模型數學、推理(li)、代(dai)碼等方(fang)面(mian)能(neng)(neng)力(li)大幅提升,同(tong)時(shi)具有多輪(lun)搜索與綜合工(gong)具的調用能(neng)(neng)力(li),將帶來內容行業的爆發,同(tong)時(shi)也將促進文化平權(quan)和(he)打破(po)壟斷,讓每個人更(geng)好地塑(su)造(zao)和(he)表(biao)達自(zi)我(wo)。
以下為方漢的演講實錄:
SOTA其實是一個學術上用得非常多的專有名詞,全稱是“State of the Art”,這個比較拗口,其實是當前技術指標第一的(de)意(yi)思。這本來是在機器(qi)學(xue)習領域用來評估模(mo)型的(de)一個技術(shu)(shu)指(zhi)標(biao),原本是個學(xue)術(shu)(shu)詞,為什么會(hui)備(bei)受關注?
一、在垂類領域拿到SOTA,才能將技術紅利轉化市場紅利
縱觀這一波大模型的投資以及創業浪潮,可以發現一個明顯的現象。在上一波移動互聯網,所有創業公司的CEO或者Leader基本上都是產品或者是商務背景,也就是說移動互聯網是商業模式和產品模式的創新,而這一波AI創業的大潮,所有AI公司的CEO基本上都是技術背景。
為什么呢?因為在AI領域技術遠遠超過產品商業模式,技術的領先才能帶來業務上的紅利。
舉幾個(ge)例子,首先不可(ke)避免要談到(dao)這(zhe)個(ge)行業的(de)第一名,OpenAI。OpenAI為(wei)什(shen)么(me)現在(zai)估(gu)值這(zhe)么(me)高,為(wei)什(shen)么(me)全(quan)世界(jie)對它這(zhe)么(me)期許?因(yin)為(wei)本質上在(zai)ChatGPT之后,它在(zai)文本大模型上的(de)SOTA地位(wei)一直非(fei)常穩固(gu)。直到(dao)Claude 3出(chu)來之后,才第一次(ci)有大模型可(ke)以(yi)接近GPT-4的(de)位(wei)置,所以(yi)它趕忙拋出(chu)Sora,這(zhe)是在(zai)視頻生成(cheng)領域的(de)SOTA。也(ye)就是說在(zai)最泛化的(de)通用人工智(zhi)能、文本大模型領域,OpenAI的(de)SOTA紅(hong)利非(fei)常明顯(xian)。
但是我(wo)們看圖像生成賽道,DALL·E 3出(chu)來得非常早(zao),但是很快(kuai)像Midjourney、Stable Diffusion出(chu)來之后(hou),這(zhe)些中(zhong)小(xiao)(xiao)型的創(chuang)業公司獲取大量的用戶,遠遠超(chao)過(guo)OpenAI的DALL·E 3。為什么?就是因為DALL·E 3沒有達到SOTA。SOTA被Midjourney以及后(hou)面的一(yi)些中(zhong)小(xiao)(xiao)創(chuang)業公司拿(na)到,用戶肯定會(hui)選擇中(zhong)小(xiao)(xiao)公司的產(chan)品,而不會(hui)選擇其他公司的產(chan)品。
也就是說在任何一個領域,對于我們所有的創業者和后來者,只要你能在這個領域拿到技術指標上的第一,你就能夠獲取大量的用戶。在(zai)獲取大量用戶(hu)之后,才可以用你的產品模(mo)式(shi)、商業模(mo)式(shi)把這些(xie)用戶(hu)固(gu)化在(zai)你的平(ping)臺上。
從長期來看(kan),只(zhi)要新的大模型和新的競(jing)爭者沒有明顯的代際壓制的話,你仍(reng)然能(neng)夠繼續靠(kao)這(zhe)些(xie)用戶獲取紅利。就像Midjourney V6出(chu)來之后,它的SOTA地位已經(jing)不是很穩固了(le),但(dan)是用戶基礎仍(reng)然很堅實。
前面是我的一些背景介紹,當然中國企業因為進入大模型賽道,其實大家都蠻晚的,但是我們在全球的競爭中心仍然是堅持技術第一,我們一定要在某個垂類領域拿到SOTA之后,才能夠由技術上的紅利,轉化為用戶和市場上的紅利。
二、以天工大模型為底座,形成六大業務矩陣
首先給大家(jia)匯報一下昆侖萬維是從(cong)什(shen)么時候開始做AGI和AIGC這件事情。
我們是2020年(nian)GPT-3出(chu)來的(de)(de)時候就(jiu)成立了一支(zhi)團隊做文(wen)本大(da)模(mo)型的(de)(de)預訓練工作,2021年(nian)開(kai)始做音樂(le)大(da)模(mo)型的(de)(de)生成預研工作,當然我們也走過很(hen)多彎路,比如音樂(le)大(da)模(mo)型一開(kai)始走的(de)(de)符號(hao)生成,再轉到(dao)端(duan)到(dao)端(duan)。現在所(suo)有垂直賽道(dao)到(dao)終(zhong)局(ju)一定是端(duan)到(dao)端(duan)。
2022年12月,我們發布了中國首個開源文本大模型,當(dang)時海外的(de)(de)各種開(kai)源大模(mo)型也沒出來,這(zhe)是(shi)來自中國企業的(de)(de)第一(yi)個(ge)基于中文的(de)(de)13B開(kai)源文本(ben)大模(mo)型。
2023年4月17日,我們發布了天工1.0;8月23號發布了國內首個AI搜索“天工AI搜索”。今年4月17日,我們發布天工3.0,包含首個中國的音樂AIGC賽道的SOTA,也就是SkyMusic音樂生成模型,以及4000億參數的全球最大規模的開源MoE大模型。

目前我們有六大業務矩陣,包括AI大模型、AI搜索、AI音樂、AI視頻、AI社交和AI游戲。
雖然矩(ju)陣這么多(duo),但我(wo)(wo)們目標(biao)非常(chang)清晰。首先我(wo)(wo)們一定要(yao)(yao)做底座模型(xing)(xing)——天工大(da)模型(xing)(xing),從原(yuan)來的(de)文本大(da)模型(xing)(xing)到(dao)現在的(de)MoE大(da)模型(xing)(xing),再到(dao)下一代多(duo)模態大(da)模型(xing)(xing),我(wo)(wo)們一定要(yao)(yao)在底座大(da)模型(xing)(xing)上持續去(qu)演(yan)進。
為什么?因為現(xian)在有一(yi)個明(ming)顯(xian)的(de)現(xian)象,所有垂(chui)直賽道的(de)各種(zhong)垂(chui)類模型,不(bu)管音頻(pin)、音樂、視頻(pin)、圖像還是(shi)3D模型其實(shi)都嚴(yan)重(zhong)依(yi)賴于底座(zuo)文本大(da)模型的(de)能力(li),如果底座(zuo)文本大(da)模型能力(li)不(bu)行,各種(zhong)垂(chui)類模型能力(li)上限比較低。
社交、音樂、游戲和視頻都屬于AIGC垂類賽道,我們認為在這些垂類賽道上只要進行持續和長期的投入,就一定可以達到SOTA,從而獲取市場上的領先優勢。
三、中國首個音樂AIGC上的SOTA,近2000萬首全量音樂數據集
首先給大家介紹一下天工音樂大模型SkyMusic,這個現在已經對全量用戶開放了,大家在App Store和應用商店搜索“天工”,“天工”里面有一個音樂的type,大家可以立刻去使用,這是中國第一個音樂AIGC上的SOTA。
這(zhe)是我們把剁(duo)椒魚頭的(de)菜譜做成一首歌的(de)案例演(yan)示,是用(yong)粵語演(yan)唱出來的(de)。
這是天工(gong)AI音樂(le)和龐博(bo)聯合(he)的案例,我們(men)把龐博(bo)寫的詞做成了一首歌。
下面說一下技術指標,目前SkyMusic和Suno V3版本相比,在人聲、BGM音質、人聲自然度、發音可懂度方面都已經擊敗了Suno。我們相信在下一個(ge)版本里面可以(yi)把這個(ge)差距(ju)繼續拉大。
AI音樂(le)大(da)模型,自2021年開始(shi)研發到現在走過(guo)三年歷(li)程,我(wo)們(men)技術路(lu)線也在不斷地演進(jin)。去年8月份Sora沒(mei)有出(chu)來,我(wo)們(men)就已(yi)經轉向Diffusion Transformer架(jia)構(gou)(gou),因為(wei)這個架(jia)構(gou)(gou)是最(zui)為(wei)Scale up的一(yi)種架(jia)構(gou)(gou)。
我們的數據集包含將近兩千萬首全量的音樂數據集,并且經過三年多的清洗和處理,其數據質量是有保障的。我們采用類DiT架構做了SkyMusic音樂大模型的(de)(de)研發,目前這個大模型還只是我們的(de)(de)第一個版(ban)本,后續在實驗室(shi)版(ban)本會實現更多(duo)的(de)(de)功能。

下(xia)面(mian)介紹一下(xia)我們(men)有(you)哪些(xie)非常(chang)獨(du)特(te)的優(you)勢。
用過Suno的(de)都知道(dao),你選擇的(de)是(shi)文本標簽和(he)風格。我(wo)們現在(zai)的(de)制作(zuo)方(fang)法是(shi),上傳一(yi)(yi)首你喜歡聽的(de)歌(ge),甚至(zhi)你自己(ji)錄的(de)一(yi)(yi)個旋(xuan)律,我(wo)們都能(neng)根據(ju)這個生成音(yin)(yin)(yin)樂。這其實更像傳統的(de)音(yin)(yin)(yin)樂工(gong)作(zuo)者創作(zuo)音(yin)(yin)(yin)樂的(de)一(yi)(yi)個邏輯,很多音(yin)(yin)(yin)樂工(gong)作(zuo)者先在(zai)腦海(hai)或(huo)者嘴巴哼出(chu)一(yi)(yi)段(duan)曲子,然后寫(xie)下來(lai),根據(ju)這個再做主歌(ge)、副歌(ge)、編曲的(de)工(gong)作(zuo),SkyMusic示例音(yin)(yin)(yin)源生成音(yin)(yin)(yin)樂的(de)能(neng)力(li)非常強。
第二,我們支持單一語種方言的輸出能力。目前中(zhong)文版(ban)本已經支(zhi)持四川話、粵語、北京話、天(tian)津話、上海話等多種方言版(ban)本,這個對于用戶(hu)來說是非常(chang)有意(yi)義的。
最后是更具辨識度的自然人聲。人(ren)(ren)聲(sheng)的(de)音源質量,以及對于(yu)各種(zhong)人(ren)(ren)群,女聲(sheng)、男聲(sheng)、幼兒聲(sheng)和成人(ren)(ren)聲(sheng),SkyMusic都(dou)有非常好(hao)的(de)一個泛(fan)化。
當做到技術上的SOTA時,怎么把技術上的SOTA轉為產品上的紅利?
我們認為所有的AIGC,包括音樂創作(zuo)的大模型出來后,首(shou)先極大降低(di)了(le)音樂創作(zuo)門檻。
就(jiu)(jiu)像(xiang)我發(fa)的(de)朋友圈,“人(ren)人(ren)皆(jie)可(ke)以歌(ge)明志”。以前我們(men)做(zuo)一(yi)(yi)(yi)首歌(ge)的(de)邏輯是(shi)什么?首先要(yao)從四五歲就(jiu)(jiu)開始學(xue)(xue)鋼琴、學(xue)(xue)樂理、學(xue)(xue)樂譜。我自(zi)己的(de)孩子在(zai)鋼琴方面(mian)可(ke)能(neng)花(hua)了七八年才考到一(yi)(yi)(yi)個(ge)專業級別,這個(ge)訓(xun)練時間很長。如(ru)果(guo)他(ta)能(neng)成為(wei)一(yi)(yi)(yi)個(ge)作曲家,可(ke)能(neng)還(huan)(huan)要(yao)在(zai)大學(xue)(xue)里面(mian)再學(xue)(xue)四年,學(xue)(xue)完四年之后這還(huan)(huan)只是(shi)作曲,作完曲還(huan)(huan)要(yao)編曲,編曲完還(huan)(huan)要(yao)找歌(ge)手演(yan)唱、找錄音棚來錄。我們(men)在(zai)市場上錄一(yi)(yi)(yi)首歌(ge)從頭到尾,哪怕用最(zui)簡化的(de)配置、最(zui)普(pu)通的(de)設備也(ye)要(yao)兩(liang)萬人(ren)民幣左右(you)。
這就導致了整個音樂創作,實際上僅僅依靠一個人是沒有能力創作歌曲的,但是有了SkyMusic大模型之后,所有人只要花1分鐘時間,只要你有歌詞,就能生成一首完整的歌曲,極大降低了音樂創作的(de)門檻和造福全體(ti)內(nei)容行(xing)業。
以(yi)前大(da)家知道所謂的配(pei)(pei)樂(le)全(quan)是拿現有(you)的曲子往視頻內容(rong)上(shang)配(pei)(pei),今(jin)天(tian)可以(yi)把這(zhe)個話題(ti)極(ji)大(da)泛(fan)化,比如今(jin)天(tian)的主題(ti)演(yan)(yan)講,可以(yi)給(gei)每(mei)一(yi)位主題(ti)演(yan)(yan)講者配(pei)(pei)一(yi)首歌(ge),比如微博上(shang)每(mei)一(yi)個大(da)V給(gei)他們寫一(yi)首關于(yu)他們的歌(ge)曲,這(zhe)個對于(yu)全(quan)體的內容(rong)行業都非常便利。
最后,SkyMusic證明中國研發也可以在垂直領域取得全球的SOTA,從而(er)讓中國(guo)企業在全球的AIGC市(shi)場(chang)上去和國(guo)外的同行正面(mian)競(jing)爭(zheng),獲取我們應有(you)的市(shi)場(chang)份額。
四、4000億參數開源MoE大模型天工3.0,拉低全領域創作門檻
下面介紹一下天工3.0,我們4月17日開啟公(gong)測的(de)(de)4000億(yi)參(can)數(shu)的(de)(de)全(quan)球最大(da)規(gui)模(mo)(mo)的(de)(de)開源MoE大(da)模(mo)(mo)型,目前(qian)性能已經全(quan)部超(chao)越xAI發布的(de)(de)3140億(yi)參(can)數(shu)的(de)(de)MoE大(da)模(mo)(mo)型Grok-1。這(zhe)是(shi)天工3.0 400B參(can)數(shu)的(de)(de)MoE大(da)模(mo)(mo)型的(de)(de)技(ji)(ji)術(shu)底座,目前(qian)在(zai)MMBench推(tui)理能力測試中標(biao)藍色(se)的(de)(de)是(shi)處(chu)于領(ling)先的(de)(de)技(ji)(ji)術(shu)指(zhi)標(biao),我們在(zai)這(zhe)個技(ji)(ji)術(shu)指(zhi)標(biao)上還(huan)是(shi)遙(yao)(yao)遙(yao)(yao)領(ling)先的(de)(de)。
天(tian)工3.0,功(gong)能(neng)全面升級,它(ta)更聰明,模型的技術知識能(neng)力(li)提升超過20%;數學、推理(li)、代碼(ma)、文(wen)創能(neng)力(li)提升30%;內(nei)容創作(zuo)(zuo)(zuo)能(neng)力(li),包括能(neng)搜索、能(neng)寫作(zuo)(zuo)(zuo)、能(neng)閱讀、能(neng)聊天(tian),能(neng)夠(gou)語音對話,能(neng)夠(gou)文(wen)生(sheng)圖,能(neng)夠(gou)給你作(zuo)(zuo)(zuo)詞(ci)作(zuo)(zuo)(zuo)曲。
給(gei)大(da)(da)家(jia)演示(shi)一(yi)下多輪搜索(suo)與綜合(he)工具的(de)調用(yong)能力。圖(tu)中問題是(shi)成(cheng)(cheng)都(dou)迪士尼怎么去,成(cheng)(cheng)都(dou)迪士尼實(shi)際(ji)上(shang)是(shi)一(yi)個(ge)(ge)梗,它(ta)是(shi)成(cheng)(cheng)都(dou)的(de)一(yi)個(ge)(ge)小區,并不是(shi)真正的(de)迪斯(si)尼樂(le)園。這時候通過搜索(suo)和大(da)(da)模(mo)型結合(he)就判斷出來成(cheng)(cheng)都(dou)迪士尼實(shi)際(ji)上(shang)是(shi)一(yi)個(ge)(ge)網絡梗,但它(ta)還是(shi)把怎么去成(cheng)(cheng)都(dou)迪士尼這個(ge)(ge)小區規劃做出來。當你(ni)問到上(shang)海(hai)迪士尼天(tian)(tian)氣時候,大(da)(da)模(mo)型又(you)生成(cheng)(cheng)一(yi)張天(tian)(tian)氣卡(ka)片(pian),告訴你(ni)今天(tian)(tian)上(shang)海(hai)迪士尼下雨,最后再調用(yong)文生圖(tu)給(gei)你(ni)生成(cheng)(cheng)一(yi)張圖(tu)片(pian)。
第二個(ge)研究模式,做研究需要寫大綱、寫知識圖譜(pu)和思(si)維導(dao)圖,而天工3.0在自(zi)(zi)動搜(sou)索之后(hou)不僅僅能生(sheng)(sheng)成表格,而且可以(yi)迅速生(sheng)(sheng)成大綱和自(zi)(zi)動生(sheng)(sheng)成腦(nao)圖,最后(hou)自(zi)(zi)動生(sheng)(sheng)成腦(nao)圖,可以(yi)即貼即用(yong)。
智能體廣場可以構建超強的(de)AI智能(neng)體,去幫(bang)助你(ni)完成相應的(de)工(gong)作(zuo)。例如造一個(ge)智能(neng)體,幫(bang)助研究小(xiao)米汽車和特斯拉汽車的(de)一個(ge)差(cha)別,進(jin)行大量(liang)搜索(suo)獲取大量(liang)資料后,模型開始生成文圖俱備的(de)對比表格,對于做文案工(gong)作(zuo)的(de)同(tong)學非(fei)常關鍵(jian)。
五、昆侖萬維新使命:實現AGI,讓每個人更好地塑造和表達自我
昆侖萬維作為一家中國的互聯網企業,現在的戰略是All in AGI與AIGC。我們在2023年宣布了公司的新使命:實現通用人工智能,讓每個人更好地塑造和表達自我。
為(wei)什么要做這樣一個使命的(de)(de)修正?因為(wei)實現通(tong)用(yong)人工(gong)智(zhi)(zhi)能(neng),本質上(shang)是(shi)基(ji)于文本大模型把人類所有(you)的(de)(de)知識壓(ya)縮到我們(men)的(de)(de)通(tong)用(yong)大模型里面(mian),這樣是(shi)通(tong)向(xiang)通(tong)用(yong)人工(gong)智(zhi)(zhi)能(neng)的(de)(de)必(bi)經(jing)之(zhi)路。
但是(shi)大家知道通(tong)用人工智能在(zai)現(xian)實中(zhong)的(de)落地是(shi)有先后之分的(de),什么樣的(de)場景會更容易(yi)落地?
其實也比(bi)較(jiao)簡(jian)單,有(you)人(ren)開玩笑說,大(da)模(mo)型剛(gang)出來(lai)的時候大(da)家都覺得所有(you)做生(sheng)產工作的同(tong)學會(hui)最早失(shi)業,所有(you)做創意藝術的同(tong)學應該是(shi)位置(zhi)是(shi)最穩(wen)固的。但實際上經過這(zhe)段時間(jian)的發展,大(da)家可以(yi)看到(dao),所有(you)做文藝創作的同(tong)學失(shi)業概率會(hui)更大(da)一些,也就是(shi)說在內容生(sheng)成領域,其實AI的落地更容易。
很簡單,因(yin)為內(nei)容(rong)(rong)生(sheng)成領域(yu)容(rong)(rong)錯率(lv)極高,用(yong)戶對于內(nei)容(rong)(rong)錯誤(wu)忍耐度非常高。我(wo)(wo)們(men)可以(yi)容(rong)(rong)忍我(wo)(wo)們(men)畫上、視頻的(de)(de)人(ren)多(duo)一(yi)(yi)根手指頭、少一(yi)(yi)根手指頭。但是(shi)我(wo)(wo)們(men)工作中,你哪(na)怕小數點后面少一(yi)(yi)位,這都是(shi)巨大(da)的(de)(de)生(sheng)產(chan)事故。也就是(shi)說在容(rong)(rong)錯率(lv)高的(de)(de)內(nei)容(rong)(rong)賽道(dao),這一(yi)(yi)波大(da)模(mo)型和人(ren)工智能的(de)(de)發揮空(kong)間是(shi)非常大(da)的(de)(de)。
我(wo)們(men)在(zai)人工智能、AIGC領域,研究(jiu)目的(de)就(jiu)(jiu)是(shi)(shi)降低創作(zuo)的(de)門檻。不(bu)管是(shi)(shi)文(wen)生(sheng)圖、文(wen)生(sheng)視頻、文(wen)生(sheng)音樂、文(wen)生(sheng)音效還是(shi)(shi)文(wen)生(sheng)3D資產,本質上就(jiu)(jiu)是(shi)(shi)移除所有前序我(wo)們(men)所需要(yao)的(de)長(chang)期的(de)專業訓(xun)練,而讓任何(he)一個人覺得(de)只要(yao)你會講故事,就(jiu)(jiu)可以創造出(chu)相應的(de)內(nei)容來(lai)表(biao)達(da)你自己(ji)。
這會帶(dai)來什么樣的(de)影響?首(shou)先(xian)大家知道創作(zuo)內(nei)(nei)容的(de)成本(ben)極(ji)大降(jiang)(jiang)低了,創作(zuo)內(nei)(nei)容的(de)門檻降(jiang)(jiang)低了。我們(men)知道創作(zuo)內(nei)(nei)容方面只要門檻降(jiang)(jiang)低,創作(zuo)內(nei)(nei)容的(de)人數會急劇(ju)膨脹。
舉個例(li)子,我小時候(hou)拍視頻(pin)(pin)都是電視臺記者(zhe)(zhe)扛幾十(shi)公(gong)斤的攝像機拍,這時候(hou)創作者(zhe)(zhe)非常(chang)少。但是智能手機出現之后把拍攝者(zhe)(zhe)變(bian)成全(quan)中國十(shi)幾億人(ren),人(ren)人(ren)可以拍視頻(pin)(pin),結(jie)果就是短視頻(pin)(pin)行業(ye)的巨大(da)發(fa)展。這一(yi)波AI把全(quan)領域的創作門檻(jian)都拉低了,結(jie)果是什么?整(zheng)個內(nei)容行業(ye)會迎來一(yi)個巨大(da)的爆發(fa)。同(tong)時,它還(huan)帶(dai)來另(ling)外一(yi)個文(wen)化平權和打破(po)壟斷(duan)的作用。
為什么?我(wo)(wo)在非(fei)洲待了蠻長時間(jian),在尼(ni)日利亞(ya)的(de)(de)(de)時候,了解(jie)到尼(ni)日利亞(ya)拍一(yi)部在院線上線電影(ying)的(de)(de)(de)平均(jun)成本是兩萬(wan)美金(jin)(jin)到二十萬(wan)美金(jin)(jin)之(zhi)間(jian),這樣拍出(chu)(chu)(chu)來(lai)的(de)(de)(de)片子和中國(guo)(guo)四五(wu)億人民幣(bi)拍出(chu)(chu)(chu)來(lai)的(de)(de)(de)《流浪地球》、美國(guo)(guo)四五(wu)億美金(jin)(jin)拍出(chu)(chu)(chu)來(lai)的(de)(de)(de)“漫(man)威”系列電影(ying)相(xiang)比,是毫無(wu)競爭力的(de)(de)(de)。但是在我(wo)(wo)們下(xia)一(yi)代AIGC技術出(chu)(chu)(chu)來(lai)之(zhi)后,我(wo)(wo)們認(ren)為全世界所有的(de)(de)(de)弱勢(shi)文化(hua)的(de)(de)(de)人都可以用非(fei)常低廉的(de)(de)(de)成本,創造(zao)出(chu)(chu)(chu)媲美歐(ou)美強(qiang)勢(shi)文化(hua)的(de)(de)(de)內容。
這(zhe)樣的(de)(de)(de)結果是(shi)什么?每(mei)個(ge)弱勢(shi)文化的(de)(de)(de)族(zu)群都(dou)可以通過AIGC技術(shu)來產(chan)生(sheng)適合自己民族(zu)的(de)(de)(de)文化、產(chan)生(sheng)適合自己小(xiao)語(yu)種的(de)(de)(de)文化,這(zhe)個(ge)對于全(quan)世(shi)界的(de)(de)(de)文化平(ping)權是(shi)非常有(you)意(yi)義的(de)(de)(de)。這(zhe)也就是(shi)第二條,讓每(mei)個(ge)人更好塑造和(he)表達自我,這(zhe)也是(shi)研發(fa)人員在文生(sheng)音樂、文生(sheng)視頻、文生(sheng)小(xiao)說、文生(sheng)漫(man)畫等內容創作(zuo)領域持續(xu)不(bu)斷迭代改(gai)進的(de)(de)(de)一個(ge)終極(ji)目的(de)(de)(de)。
以上是方漢演講內容的完整整理。