昆仑万维方汉：将技术红利转为市场红利，拿到垂直领域SOTA是前提丨GenAICon 2024

智東西（公眾號：zhidxcom）
編輯 | GenAICon 2024

2024中國生成式(shi)AI大會于4月18-19日在北(bei)京舉行，在大會首日的主會場(chang)開幕式(shi)上，昆侖萬(wan)維董事長(chang)兼CEO方漢以(yi)《從天(tian)工SkyMusic音樂大模型談SOTA紅利》為題發表演講(jiang)。

方漢強調了“技術領先”在AI領域的重要性，不同于互聯網時代產品的商業模式導向，大模型時代技術導向才能帶來市場上的領先優勢，吸引大量用戶并獲取紅利。

OpenAI在AI創企中的地位，本質上是其文本大模型的SOTA（當前技術指標第一）能力帶來的。對于當前的AI創業者，在圖像、視頻、音樂等任何賽道，只要能取得SOTA，就能通過技術優勢獲得大量用戶，后續再通過產品創新、商業模式創新把用戶固化在平臺上，形成自己的護城河。

在AGI和AIGC領域，昆侖萬維研發出了天工3.0模型，包含音樂大模型SkyMusic和全球最大規模的開源MoE大模型。其中音樂大模型SkyMusic就處于音樂領域的SOTA地位。

SkyMusic音樂(le)(le)大(da)模型支持多(duo)種(zhong)方(fang)言輸出，具有(you)辨識度(du)的(de)自(zi)然(ran)人聲、降(jiang)低音樂(le)(le)創(chuang)作(zuo)門檻和成本等，便于內容行(xing)(xing)業發(fa)展。基于音質、自(zi)然(ran)度(du)和理解度(du)方(fang)面的(de)優勢，即(ji)使是沒有(you)音樂(le)(le)背(bei)景(jing)的(de)普(pu)通(tong)人也能夠利用該技(ji)術進行(xing)(xing)音樂(le)(le)創(chuang)作(zuo)，而這(zhe)也將(jiang)極(ji)大(da)地擴展音樂(le)(le)創(chuang)作(zuo)的(de)可能性和范圍(wei)。

此外(wai)，天(tian)工(gong)3.0大模型數學、推理(li)、代(dai)碼等方(fang)面(mian)能(neng)(neng)力(li)大幅提升，同(tong)時(shi)具有多輪(lun)搜索與綜合工(gong)具的調用能(neng)(neng)力(li)，將帶來內容行業的爆發，同(tong)時(shi)也將促進文化平權(quan)和(he)打破(po)壟斷，讓每個人更(geng)好地塑(su)造(zao)和(he)表(biao)達自(zi)我(wo)。

以下為方漢的演講實錄：

SOTA其實是一個學術上用得非常多的專有名詞，全稱是“State of the Art”，這個比較拗口，其實是當前技術指標第一的(de)意(yi)思。這本來是在機器(qi)學(xue)習領域用來評估模(mo)型的(de)一個技術(shu)(shu)指(zhi)標(biao)，原本是個學(xue)術(shu)(shu)詞，為什么會(hui)備(bei)受關注？

一、在垂類領域拿到SOTA，才能將技術紅利轉化市場紅利

縱觀這一波大模型的投資以及創業浪潮，可以發現一個明顯的現象。在上一波移動互聯網，所有創業公司的CEO或者Leader基本上都是產品或者是商務背景，也就是說移動互聯網是商業模式和產品模式的創新，而這一波AI創業的大潮，所有AI公司的CEO基本上都是技術背景。

為什么呢？因為在AI領域技術遠遠超過產品商業模式，技術的領先才能帶來業務上的紅利。

舉幾個(ge)例子，首先不可(ke)避免要談到(dao)這(zhe)個(ge)行業的(de)第一名，OpenAI。OpenAI為(wei)什(shen)么(me)現在(zai)估(gu)值這(zhe)么(me)高，為(wei)什(shen)么(me)全(quan)世界(jie)對它這(zhe)么(me)期許？因(yin)為(wei)本質上在(zai)ChatGPT之后，它在(zai)文本大模型上的(de)SOTA地位(wei)一直非(fei)常穩固(gu)。直到(dao)Claude 3出(chu)來之后，才第一次(ci)有大模型可(ke)以(yi)接近GPT-4的(de)位(wei)置，所以(yi)它趕忙拋出(chu)Sora，這(zhe)是在(zai)視頻生成(cheng)領域的(de)SOTA。也(ye)就是說在(zai)最泛化的(de)通用人工智(zhi)能、文本大模型領域，OpenAI的(de)SOTA紅(hong)利非(fei)常明顯(xian)。

但是我(wo)們看圖像生成賽道，DALL·E 3出(chu)來得非常早(zao)，但是很快(kuai)像Midjourney、Stable Diffusion出(chu)來之后(hou)，這(zhe)些中(zhong)小(xiao)(xiao)型的創(chuang)業公司獲取大量的用戶，遠遠超(chao)過(guo)OpenAI的DALL·E 3。為什么？就是因為DALL·E 3沒有達到SOTA。SOTA被Midjourney以及后(hou)面的一(yi)些中(zhong)小(xiao)(xiao)創(chuang)業公司拿(na)到，用戶肯定會(hui)選擇中(zhong)小(xiao)(xiao)公司的產(chan)品，而不會(hui)選擇其他公司的產(chan)品。

也就是說在任何一個領域，對于我們所有的創業者和后來者，只要你能在這個領域拿到技術指標上的第一，你就能夠獲取大量的用戶。在(zai)獲取大量用戶(hu)之后，才可以用你的產品模(mo)式(shi)、商業模(mo)式(shi)把這些(xie)用戶(hu)固(gu)化在(zai)你的平(ping)臺上。

從長期來看(kan)，只(zhi)要新的大模型和新的競(jing)爭者沒有明顯的代際壓制的話，你仍(reng)然能(neng)夠繼續靠(kao)這(zhe)些(xie)用戶獲取紅利。就像Midjourney V6出(chu)來之后，它的SOTA地位已經(jing)不是很穩固了(le)，但(dan)是用戶基礎仍(reng)然很堅實。

前面是我的一些背景介紹，當然中國企業因為進入大模型賽道，其實大家都蠻晚的，但是我們在全球的競爭中心仍然是堅持技術第一，我們一定要在某個垂類領域拿到SOTA之后，才能夠由技術上的紅利，轉化為用戶和市場上的紅利。

二、以天工大模型為底座，形成六大業務矩陣

首先給大家(jia)匯報一下昆侖萬維是從(cong)什(shen)么時候開始做AGI和AIGC這件事情。

我們是2020年(nian)GPT-3出(chu)來的(de)(de)時候就(jiu)成立了一支(zhi)團隊做文(wen)本大(da)模(mo)型的(de)(de)預訓練工作，2021年(nian)開(kai)始做音樂(le)大(da)模(mo)型的(de)(de)生成預研工作，當然我們也走過很(hen)多彎路，比如音樂(le)大(da)模(mo)型一開(kai)始走的(de)(de)符號(hao)生成，再轉到(dao)端(duan)到(dao)端(duan)。現在所(suo)有垂直賽道(dao)到(dao)終(zhong)局(ju)一定是端(duan)到(dao)端(duan)。

2022年12月，我們發布了中國首個開源文本大模型，當(dang)時海外的(de)(de)各種開(kai)源大模(mo)型也沒出來，這(zhe)是(shi)來自中國企業的(de)(de)第一(yi)個(ge)基于中文的(de)(de)13B開(kai)源文本(ben)大模(mo)型。

2023年4月17日，我們發布了天工1.0；8月23號發布了國內首個AI搜索“天工AI搜索”。今年4月17日，我們發布天工3.0，包含首個中國的音樂AIGC賽道的SOTA，也就是SkyMusic音樂生成模型，以及4000億參數的全球最大規模的開源MoE大模型。

昆侖萬維方漢：將技術紅利轉為市場紅利，拿到垂直領域SOTA是前提丨GenAICon 2024

目前我們有六大業務矩陣，包括AI大模型、AI搜索、AI音樂、AI視頻、AI社交和AI游戲。

雖然矩(ju)陣這么多(duo)，但我(wo)(wo)們目標(biao)非常(chang)清晰。首先我(wo)(wo)們一定要(yao)(yao)做底座模型(xing)(xing)——天工大(da)模型(xing)(xing)，從原(yuan)來的(de)文本大(da)模型(xing)(xing)到(dao)現在的(de)MoE大(da)模型(xing)(xing)，再到(dao)下一代多(duo)模態大(da)模型(xing)(xing)，我(wo)(wo)們一定要(yao)(yao)在底座大(da)模型(xing)(xing)上持續去(qu)演(yan)進。

為什么？因為現(xian)在有一(yi)個明(ming)顯(xian)的(de)現(xian)象，所有垂(chui)直賽道的(de)各種(zhong)垂(chui)類模型，不(bu)管音頻(pin)、音樂、視頻(pin)、圖像還是(shi)3D模型其實(shi)都嚴(yan)重(zhong)依(yi)賴于底座(zuo)文本大(da)模型的(de)能力(li)，如果底座(zuo)文本大(da)模型能力(li)不(bu)行，各種(zhong)垂(chui)類模型能力(li)上限比較低。

社交、音樂、游戲和視頻都屬于AIGC垂類賽道，我們認為在這些垂類賽道上只要進行持續和長期的投入，就一定可以達到SOTA，從而獲取市場上的領先優勢。

三、中國首個音樂AIGC上的SOTA，近2000萬首全量音樂數據集

首先給大家介紹一下天工音樂大模型SkyMusic，這個現在已經對全量用戶開放了，大家在App Store和應用商店搜索“天工”，“天工”里面有一個音樂的type，大家可以立刻去使用，這是中國第一個音樂AIGC上的SOTA。

這(zhe)是我們把剁(duo)椒魚頭的(de)菜譜做成一首歌的(de)案例演(yan)示，是用(yong)粵語演(yan)唱出來的(de)。

昆侖萬維方漢：將技術紅利轉為市場紅利，拿到垂直領域SOTA是前提丨GenAICon 2024

這是天工(gong)AI音樂(le)和龐博(bo)聯合(he)的案例，我們(men)把龐博(bo)寫的詞做成了一首歌。

昆侖萬維方漢：將技術紅利轉為市場紅利，拿到垂直領域SOTA是前提丨GenAICon 2024

下面說一下技術指標，目前SkyMusic和Suno V3版本相比，在人聲、BGM音質、人聲自然度、發音可懂度方面都已經擊敗了Suno。我們相信在下一個(ge)版本里面可以(yi)把這個(ge)差距(ju)繼續拉大。

AI音樂(le)大(da)模型，自2021年開始(shi)研發到現在走過(guo)三年歷(li)程，我(wo)們(men)技術路(lu)線也在不斷地演進(jin)。去年8月份Sora沒(mei)有出(chu)來，我(wo)們(men)就已(yi)經轉向Diffusion Transformer架(jia)構(gou)(gou)，因為(wei)這個架(jia)構(gou)(gou)是最(zui)為(wei)Scale up的一(yi)種架(jia)構(gou)(gou)。

我們的數據集包含將近兩千萬首全量的音樂數據集，并且經過三年多的清洗和處理，其數據質量是有保障的。我們采用類DiT架構做了SkyMusic音樂大模型的(de)(de)研發，目前這個大模型還只是我們的(de)(de)第一個版(ban)本，后續在實驗室(shi)版(ban)本會實現更多(duo)的(de)(de)功能。

下(xia)面(mian)介紹一下(xia)我們(men)有(you)哪些(xie)非常(chang)獨(du)特(te)的優(you)勢。

用過Suno的(de)都知道(dao)，你選擇的(de)是(shi)文本標簽和(he)風格。我(wo)們現在(zai)的(de)制作(zuo)方(fang)法是(shi)，上傳一(yi)(yi)首你喜歡聽的(de)歌(ge)，甚至(zhi)你自己(ji)錄的(de)一(yi)(yi)個旋(xuan)律，我(wo)們都能(neng)根據(ju)這個生成音(yin)(yin)(yin)樂。這其實更像傳統的(de)音(yin)(yin)(yin)樂工(gong)作(zuo)者創作(zuo)音(yin)(yin)(yin)樂的(de)一(yi)(yi)個邏輯，很多音(yin)(yin)(yin)樂工(gong)作(zuo)者先在(zai)腦海(hai)或(huo)者嘴巴哼出(chu)一(yi)(yi)段(duan)曲子，然后寫(xie)下來(lai)，根據(ju)這個再做主歌(ge)、副歌(ge)、編曲的(de)工(gong)作(zuo)，SkyMusic示例音(yin)(yin)(yin)源生成音(yin)(yin)(yin)樂的(de)能(neng)力(li)非常強。

第二，我們支持單一語種方言的輸出能力。目前中(zhong)文版(ban)本已經支(zhi)持四川話、粵語、北京話、天(tian)津話、上海話等多種方言版(ban)本，這個對于用戶(hu)來說是非常(chang)有意(yi)義的。

最后是更具辨識度的自然人聲。人(ren)(ren)聲(sheng)的(de)音源質量，以及對于(yu)各種(zhong)人(ren)(ren)群，女聲(sheng)、男聲(sheng)、幼兒聲(sheng)和成人(ren)(ren)聲(sheng)，SkyMusic都(dou)有非常好(hao)的(de)一個泛(fan)化。

當做到技術上的SOTA時，怎么把技術上的SOTA轉為產品上的紅利？

我們認為所有的AIGC，包括音樂創作(zuo)的大模型出來后，首(shou)先極大降低(di)了(le)音樂創作(zuo)門檻。

就(jiu)(jiu)像(xiang)我發(fa)的(de)朋友圈，“人(ren)人(ren)皆(jie)可(ke)以歌(ge)明志”。以前我們(men)做(zuo)一(yi)(yi)(yi)首歌(ge)的(de)邏輯是(shi)什么？首先要(yao)從四五歲就(jiu)(jiu)開始學(xue)(xue)鋼琴、學(xue)(xue)樂理、學(xue)(xue)樂譜。我自(zi)己的(de)孩子在(zai)鋼琴方面(mian)可(ke)能(neng)花(hua)了七八年才考到一(yi)(yi)(yi)個(ge)專業級別，這個(ge)訓(xun)練時間很長。如(ru)果(guo)他(ta)能(neng)成為(wei)一(yi)(yi)(yi)個(ge)作曲家，可(ke)能(neng)還(huan)(huan)要(yao)在(zai)大學(xue)(xue)里面(mian)再學(xue)(xue)四年，學(xue)(xue)完四年之后這還(huan)(huan)只是(shi)作曲，作完曲還(huan)(huan)要(yao)編曲，編曲完還(huan)(huan)要(yao)找歌(ge)手演(yan)唱、找錄音棚來錄。我們(men)在(zai)市場上錄一(yi)(yi)(yi)首歌(ge)從頭到尾，哪怕用最(zui)簡化的(de)配置、最(zui)普(pu)通的(de)設備也(ye)要(yao)兩(liang)萬人(ren)民幣左右(you)。

這就導致了整個音樂創作，實際上僅僅依靠一個人是沒有能力創作歌曲的，但是有了SkyMusic大模型之后，所有人只要花1分鐘時間，只要你有歌詞，就能生成一首完整的歌曲，極大降低了音樂創作的(de)門檻和造福全體(ti)內(nei)容行(xing)業。

以(yi)前大(da)家知道所謂的配(pei)(pei)樂(le)全(quan)是拿現有(you)的曲子往視頻內容(rong)上(shang)配(pei)(pei)，今(jin)天(tian)可以(yi)把這(zhe)個話題(ti)極(ji)大(da)泛(fan)化，比如今(jin)天(tian)的主題(ti)演(yan)(yan)講，可以(yi)給(gei)每(mei)一(yi)位主題(ti)演(yan)(yan)講者配(pei)(pei)一(yi)首歌(ge)，比如微博上(shang)每(mei)一(yi)個大(da)V給(gei)他們寫一(yi)首關于(yu)他們的歌(ge)曲，這(zhe)個對于(yu)全(quan)體的內容(rong)行業都非常便利。

最后，SkyMusic證明中國研發也可以在垂直領域取得全球的SOTA，從而(er)讓中國(guo)企業在全球的AIGC市(shi)場(chang)上去和國(guo)外的同行正面(mian)競(jing)爭(zheng)，獲取我們應有(you)的市(shi)場(chang)份額。

四、4000億參數開源MoE大模型天工3.0，拉低全領域創作門檻

下面介紹一下天工3.0，我們4月17日開啟公(gong)測的(de)(de)4000億(yi)參(can)數(shu)的(de)(de)全(quan)球最大(da)規(gui)模(mo)(mo)的(de)(de)開源MoE大(da)模(mo)(mo)型，目前(qian)性能已經全(quan)部超(chao)越xAI發布的(de)(de)3140億(yi)參(can)數(shu)的(de)(de)MoE大(da)模(mo)(mo)型Grok-1。這(zhe)是(shi)天工3.0 400B參(can)數(shu)的(de)(de)MoE大(da)模(mo)(mo)型的(de)(de)技(ji)(ji)術(shu)底座，目前(qian)在(zai)MMBench推(tui)理能力測試中標(biao)藍色(se)的(de)(de)是(shi)處(chu)于領(ling)先的(de)(de)技(ji)(ji)術(shu)指(zhi)標(biao)，我們在(zai)這(zhe)個技(ji)(ji)術(shu)指(zhi)標(biao)上還(huan)是(shi)遙(yao)(yao)遙(yao)(yao)領(ling)先的(de)(de)。

昆侖萬維方漢：將技術紅利轉為市場紅利，拿到垂直領域SOTA是前提丨GenAICon 2024

天(tian)工3.0，功(gong)能(neng)全面升級，它(ta)更聰明，模型的技術知識能(neng)力(li)提升超過20%；數學、推理(li)、代碼(ma)、文(wen)創能(neng)力(li)提升30%；內(nei)容創作(zuo)(zuo)(zuo)能(neng)力(li)，包括能(neng)搜索、能(neng)寫作(zuo)(zuo)(zuo)、能(neng)閱讀、能(neng)聊天(tian)，能(neng)夠(gou)語音對話，能(neng)夠(gou)文(wen)生(sheng)圖，能(neng)夠(gou)給你作(zuo)(zuo)(zuo)詞(ci)作(zuo)(zuo)(zuo)曲。

給(gei)大(da)(da)家(jia)演示(shi)一(yi)下多輪搜索(suo)與綜合(he)工具的(de)調用(yong)能力。圖(tu)中問題是(shi)成(cheng)(cheng)都(dou)迪士尼怎么去，成(cheng)(cheng)都(dou)迪士尼實(shi)際(ji)上(shang)是(shi)一(yi)個(ge)(ge)梗，它(ta)是(shi)成(cheng)(cheng)都(dou)的(de)一(yi)個(ge)(ge)小區，并不是(shi)真正的(de)迪斯(si)尼樂(le)園。這時候通過搜索(suo)和大(da)(da)模(mo)型結合(he)就判斷出來成(cheng)(cheng)都(dou)迪士尼實(shi)際(ji)上(shang)是(shi)一(yi)個(ge)(ge)網絡梗，但它(ta)還是(shi)把怎么去成(cheng)(cheng)都(dou)迪士尼這個(ge)(ge)小區規劃做出來。當你(ni)問到上(shang)海(hai)迪士尼天(tian)(tian)氣時候，大(da)(da)模(mo)型又(you)生成(cheng)(cheng)一(yi)張天(tian)(tian)氣卡(ka)片(pian)，告訴你(ni)今天(tian)(tian)上(shang)海(hai)迪士尼下雨，最后再調用(yong)文生圖(tu)給(gei)你(ni)生成(cheng)(cheng)一(yi)張圖(tu)片(pian)。

昆侖萬維方漢：將技術紅利轉為市場紅利，拿到垂直領域SOTA是前提丨GenAICon 2024

第二個(ge)研究模式，做研究需要寫大綱、寫知識圖譜(pu)和思(si)維導(dao)圖，而天工3.0在自(zi)(zi)動搜(sou)索之后(hou)不僅僅能生(sheng)(sheng)成表格，而且可以(yi)迅速生(sheng)(sheng)成大綱和自(zi)(zi)動生(sheng)(sheng)成腦(nao)圖，最后(hou)自(zi)(zi)動生(sheng)(sheng)成腦(nao)圖，可以(yi)即貼即用(yong)。

智能體廣場可以構建超強的(de)AI智能(neng)體，去幫(bang)助你(ni)完成相應的(de)工(gong)作(zuo)。例如造一個(ge)智能(neng)體，幫(bang)助研究小(xiao)米汽車和特斯拉汽車的(de)一個(ge)差(cha)別，進(jin)行大量(liang)搜索(suo)獲取大量(liang)資料后，模型開始生成文圖俱備的(de)對比表格，對于做文案工(gong)作(zuo)的(de)同(tong)學非(fei)常關鍵(jian)。

五、昆侖萬維新使命：實現AGI，讓每個人更好地塑造和表達自我

昆侖萬維作為一家中國的互聯網企業，現在的戰略是All in AGI與AIGC。我們在2023年宣布了公司的新使命：實現通用人工智能，讓每個人更好地塑造和表達自我。

為(wei)什么要做這樣一個使命的(de)(de)修正？因為(wei)實現通(tong)用(yong)人工(gong)智(zhi)(zhi)能(neng)，本質上(shang)是(shi)基(ji)于文本大模型把人類所有(you)的(de)(de)知識壓(ya)縮到我們(men)的(de)(de)通(tong)用(yong)大模型里面(mian)，這樣是(shi)通(tong)向(xiang)通(tong)用(yong)人工(gong)智(zhi)(zhi)能(neng)的(de)(de)必(bi)經(jing)之(zhi)路。

但是(shi)大家知道通(tong)用人工智能在(zai)現(xian)實中(zhong)的(de)落地是(shi)有先后之分的(de)，什么樣的(de)場景會更容易(yi)落地？

其實也比(bi)較(jiao)簡(jian)單，有(you)人(ren)開玩笑說，大(da)模(mo)型剛(gang)出來(lai)的時候大(da)家都覺得所有(you)做生(sheng)產工作的同(tong)學會(hui)最早失(shi)業，所有(you)做創意藝術的同(tong)學應該是(shi)位置(zhi)是(shi)最穩(wen)固的。但實際上經過這(zhe)段時間(jian)的發展，大(da)家可以(yi)看到(dao)，所有(you)做文藝創作的同(tong)學失(shi)業概率會(hui)更大(da)一些，也就是(shi)說在內容生(sheng)成領域，其實AI的落地更容易。

很簡單，因(yin)為內(nei)容(rong)(rong)生(sheng)成領域(yu)容(rong)(rong)錯率(lv)極高，用(yong)戶對于內(nei)容(rong)(rong)錯誤(wu)忍耐度非常高。我(wo)(wo)們(men)可以(yi)容(rong)(rong)忍我(wo)(wo)們(men)畫上、視頻的(de)(de)人(ren)多(duo)一(yi)(yi)根手指頭、少一(yi)(yi)根手指頭。但是(shi)我(wo)(wo)們(men)工作中，你哪(na)怕小數點后面少一(yi)(yi)位，這都是(shi)巨大(da)的(de)(de)生(sheng)產(chan)事故。也就是(shi)說在容(rong)(rong)錯率(lv)高的(de)(de)內(nei)容(rong)(rong)賽道(dao)，這一(yi)(yi)波大(da)模(mo)型和人(ren)工智能的(de)(de)發揮空(kong)間是(shi)非常大(da)的(de)(de)。

我(wo)們(men)在(zai)人工智能、AIGC領域，研究(jiu)目的(de)就(jiu)(jiu)是(shi)(shi)降低創作(zuo)的(de)門檻。不(bu)管是(shi)(shi)文(wen)生(sheng)圖、文(wen)生(sheng)視頻、文(wen)生(sheng)音樂、文(wen)生(sheng)音效還是(shi)(shi)文(wen)生(sheng)3D資產，本質上就(jiu)(jiu)是(shi)(shi)移除所有前序我(wo)們(men)所需要(yao)的(de)長(chang)期的(de)專業訓(xun)練，而讓任何(he)一個人覺得(de)只要(yao)你會講故事，就(jiu)(jiu)可以創造出(chu)相應的(de)內(nei)容來(lai)表(biao)達(da)你自己(ji)。

這會帶(dai)來什么樣的(de)影響？首(shou)先(xian)大家知道創作(zuo)內(nei)(nei)容的(de)成本(ben)極(ji)大降(jiang)(jiang)低了，創作(zuo)內(nei)(nei)容的(de)門檻降(jiang)(jiang)低了。我們(men)知道創作(zuo)內(nei)(nei)容方面只要門檻降(jiang)(jiang)低，創作(zuo)內(nei)(nei)容的(de)人數會急劇(ju)膨脹。

舉個例(li)子，我小時候(hou)拍視頻(pin)(pin)都是電視臺記者(zhe)(zhe)扛幾十(shi)公(gong)斤的攝像機拍，這時候(hou)創作者(zhe)(zhe)非常(chang)少。但是智能手機出現之后把拍攝者(zhe)(zhe)變(bian)成全(quan)中國十(shi)幾億人(ren)，人(ren)人(ren)可以拍視頻(pin)(pin)，結(jie)果就是短視頻(pin)(pin)行業(ye)的巨大(da)發(fa)展。這一(yi)波AI把全(quan)領域的創作門檻(jian)都拉低了，結(jie)果是什么？整(zheng)個內(nei)容行業(ye)會迎來一(yi)個巨大(da)的爆發(fa)。同(tong)時，它還(huan)帶(dai)來另(ling)外一(yi)個文(wen)化平權和打破(po)壟斷(duan)的作用。

為什么？我(wo)(wo)在非(fei)洲待了蠻長時間(jian)，在尼(ni)日利亞(ya)的(de)(de)(de)時候，了解(jie)到尼(ni)日利亞(ya)拍一(yi)部在院線上線電影(ying)的(de)(de)(de)平均(jun)成本是兩萬(wan)美金(jin)(jin)到二十萬(wan)美金(jin)(jin)之(zhi)間(jian)，這樣拍出(chu)(chu)(chu)來(lai)的(de)(de)(de)片子和中國(guo)(guo)四五(wu)億人民幣(bi)拍出(chu)(chu)(chu)來(lai)的(de)(de)(de)《流浪地球》、美國(guo)(guo)四五(wu)億美金(jin)(jin)拍出(chu)(chu)(chu)來(lai)的(de)(de)(de)“漫(man)威”系列電影(ying)相(xiang)比，是毫無(wu)競爭力的(de)(de)(de)。但是在我(wo)(wo)們下(xia)一(yi)代AIGC技術出(chu)(chu)(chu)來(lai)之(zhi)后，我(wo)(wo)們認(ren)為全世界所有的(de)(de)(de)弱勢(shi)文化(hua)的(de)(de)(de)人都可以用非(fei)常低廉的(de)(de)(de)成本，創造(zao)出(chu)(chu)(chu)媲美歐(ou)美強(qiang)勢(shi)文化(hua)的(de)(de)(de)內容。

這(zhe)樣的(de)(de)(de)結果是(shi)什么？每(mei)個(ge)弱勢(shi)文化的(de)(de)(de)族(zu)群都(dou)可以通過AIGC技術(shu)來產(chan)生(sheng)適合自己民族(zu)的(de)(de)(de)文化、產(chan)生(sheng)適合自己小(xiao)語(yu)種的(de)(de)(de)文化，這(zhe)個(ge)對于全(quan)世(shi)界的(de)(de)(de)文化平(ping)權是(shi)非常有(you)意(yi)義的(de)(de)(de)。這(zhe)也就是(shi)第二條，讓每(mei)個(ge)人更好塑造和(he)表達自我，這(zhe)也是(shi)研發(fa)人員在文生(sheng)音樂、文生(sheng)視頻、文生(sheng)小(xiao)說、文生(sheng)漫(man)畫等內容創作(zuo)領域持續(xu)不(bu)斷迭代改(gai)進的(de)(de)(de)一個(ge)終極(ji)目的(de)(de)(de)。

以上是方漢演講內容的完整整理。

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

一、在垂類領域拿到SOTA，才能將技術紅利轉化市場紅利

二、以天工大模型為底座，形成六大業務矩陣

三、中國首個音樂AIGC上的SOTA，近2000萬首全量音樂數據集

四、4000億參數開源MoE大模型天工3.0，拉低全領域創作門檻

五、昆侖萬維新使命：實現AGI，讓每個人更好地塑造和表達自我

相關推薦