
智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣
當下,各路生成式AI工具落地如火如荼。
據全球知名數據機構SimilarWeb統計,2024年9月,穩居全球第一的ChatGPT網站月訪問量環比增長18.71%,達到31.24億次。同時,聊天機器人Gemini、虛擬角色伴侶Character.AI、AI寫作工具Notion AI等AI工具月訪問量也都穩定在超1億次,各個賽道展現出百花齊放的態勢(shi)。
然而,看似火熱的AI視頻生成產品賽道,卻透出絲絲的寒氣。
雖然新玩家還在不斷進入,但一線行業大佬已經帶頭“警告”。近日,百度董事長兼CEO李彥宏在2024年Q3總監會上說:“Sora這種視頻生成的投入周期太長,10年、20年都可能拿不到業務收益。無論(lun)多么火爆,百度(du)都不去做。”
而聚焦(jiao)產品(pin)落地(di)形勢,Sora還沒有正式推出,炙手可熱的AI視頻生成“代餐”已經熱度驟降。
據SimilarWeb統計,位居全球前列的AI視頻生成企業Luma AI網站在9月的總訪問量僅為1181萬次,環比下跌38.49%;紅極一時的Pika在9月總訪問量僅110.8萬次,環比下跌9.78%。
再看看上半年其他幾家存在感較強的種子選手,被稱為AI視頻生成領域的“老大哥”的Runway在9月流量僅755.8萬次,不及ChatGPT的1/400;我國知名AI創企愛詩科技推出的PixVerse在9月總訪問量為407.7萬次,不及ChatGPT的1/700。
▲部分AI產品9月全球總訪問量情況(數(shu)據來自(zi)SimilarWeb,智東西制圖)
一邊,Meta、字節、快手等互聯網大廠都相繼入局,推出Movie Gen、Kling AI等競品;智譜AI、Minimax等大模型創企也推出了智譜清影、Video-01等新模型,讓“內卷”的競爭更具緊迫感;另一邊,AI視頻生成工具之間差異化越來越小,小頭部們用戶增長乏力已成為不爭的事實,增長壓力一天高于一天。
Sora仍是“期貨”,而類Sora產品已經遇到肉眼可見的瓶頸,面臨入秋轉寒的生存挑戰。
一、8個月Sora“祛魅”:期貨難產、負責人跳槽、實際體驗不佳
今年2月,橫空出世的Sora一舉將AI視頻賽道變得炙手可熱。
彼時(shi),相(xiang)比Runway、Pika、PixVerse等(deng)在2023年6月-11月扎堆入場的視(shi)頻(pin)模型,Sora不僅對文本理解更深刻(ke),可(ke)以(yi)準(zhun)確地(di)呈現提示詞,而且能在一個生成(cheng)(cheng)的視(shi)頻(pin)中創(chuang)建(jian)多個鏡頭,準(zhun)確地(di)保留角色和視(shi)覺風格,生成(cheng)(cheng)長(chang)達1分鐘的質量驚(jing)(jing)艷(yan)的視(shi)頻(pin),讓(rang)無(wu)數人(ren)驚(jing)(jing)嘆:“以(yi)后(hou)可(ke)能不需要人(ren)拍電影了!”
然而8個月后的今天,OpenAI仍未推出Sora,Sora兩位負責人之一卻在10月4日宣布跳槽去了谷歌DeepMind,這款“期貨”產品正在逐漸被人們遺忘,社交媒體的討論熱度和人們的期待程度都已經驟降。
近期的種種跡象,表明OpenAI在當時亮出(chu)這款視頻模型時,并沒(mei)有準(zhun)備好。
在Sora發布后,有一小部分紅隊測試人員和藝術家可以使用Sora。但據外媒The Information近期報道,一些試用了Sora的電影制作人體驗并不太理想。
首先,Sora生成的視頻在呈現提示詞上不夠準確。例如,電影制作人帕特里克·塞德伯格 (Patrick Cederberg)說,他必須讓模型生成數百個短片,才能找到一個可用的短片。換句話說,Sora的(de)使用非常困難。
其次,生成視頻耗時久、一致性保持不足。比如另一位試用者稱,他最初需要10多分鐘才能(neng)生成一段(duan)時長(chang)約1分鐘的(de)短(duan)片,而且Sora也很(hen)難在整(zheng)個視頻片段(duan)中保持相同的(de)風格,物(wu)體和角色保持一致更加困難。
此外,“恐怖谷”效應多發。一位與OpenAI高管交談過的人士稱,Sora生成的視頻總是包含奇怪的物理現象,比如(ru)憑(ping)空出現(xian)一把椅子,或(huo)者錯誤地解(jie)剖分割(ge)事(shi)物。換句話說,市(shi)面(mian)上(shang)AI視(shi)頻生成工具有(you)的“翻車”場面(mian),Sora也(ye)都有(you)。
這表明,Sora在技術層面仍存在缺陷和不成熟,至少與市面上已發布的產品相比,沒有展現出太大優勢。
一邊Sora“難產”的跡象日益明顯,另一邊Sora項目團隊也面臨動蕩,為Sora的如期出世增添了極大不確定性。
10月4日,Sora項目負責人蒂姆(mu)?布(bu)魯(lu)克斯(Tim Brooks)在社交平臺X上官(guan)宣離職,加(jia)入谷歌(ge)DeepMind。“我將加(jia)入谷歌(ge)DeepMind致力于視(shi)頻生成和世(shi)界模(mo)擬器!”布(bu)魯(lu)克斯說(shuo)。這很有可能(neng)將Sora的(de)炮彈安到了谷歌(ge)視(shi)頻生成模(mo)型Veo上,成為進攻OpenAI的(de)強(qiang)力火(huo)炮。
▲Sora兩位(wei)負責(ze)人之一(yi)Tim Brooks發文宣布(bu)跳槽去了(le)谷歌DeepMind
而就在不(bu)久前(qian)的9月26日,OpenAI首(shou)席(xi)技(ji)術(shu)官米拉·穆拉蒂(di)(Mira Murati),以及在o1模型、GPT-4o、GPT-4v模型的開(kai)發過程中扮(ban)演了重(zhong)要角色的研(yan)究副(fu)總裁巴雷特·佐夫(Barret Zoph)與首(shou)席(xi)研(yan)究官鮑勃(bo)·麥克格盧(Bob McGrew)也(ye)宣布離職(zhi)。技(ji)術(shu)領頭人一(yi)個接一(yi)個離開(kai),讓Sora研(yan)發項目的進展變得前(qian)途未卜。
研發部門靈魂人物的離開,很可能改變Sora的研發方向和節奏。
實際上,OpenAI已傳出正在重新訓練Sora,目的就(jiu)是為了讓Sora在正式(shi)發布(bu)時(shi)還能保持優勢。
9月底,一位與OpenAI高管交談過的人士向外媒稱,OpenAI正(zheng)在(zai)訓練(lian)新版(ban)Sora,希望它(ta)能快速生(sheng)成質量(liang)更高、時(shi)(shi)間(jian)更長的(de)視頻。這位人士稱(cheng),為了(le)訓(xun)練(lian)Sora,OpenAI收(shou)集了(le)數百萬(wan)小時(shi)(shi)的(de)視頻作為訓(xun)練(lian)數據,高分(fen)辨率,并包含多種風格(ge)和(he)主題。
然而這個重新(xin)訓練(lian)的Sora什么時候能跟大家見面?答案似乎(hu)是遙遙無(wu)期。
無論是Sora體驗和技術本身的缺陷,還是Sora項目團隊的動蕩,亦或是“回爐重造”的消息,都指向Sora的優勢可能已經不保,也意味著AI視頻生成同行的機會在變大。
一邊,OpenAI的Sora的進展“秋風蕭瑟”;另一邊,其他AI視頻生成行業看到了自家產品的可乘之機,“熱火朝天”地發新品和招攬用戶。
二、同行加速占領AI視頻生成市場,創企與巨頭熱戰,但寒潮已來
Sora日益降溫,AI視頻生成同行在2024年夏天已快速占領市場,開啟多輪熱戰。
在國外,當Sora還是一個“餅”,Runway、Pika、Luma AI、Stability AI等創企已經把好用的AI視頻生成工具免費給用戶用,Meta、谷歌等硅谷科技大廠們也試圖動搖Sora的根基。
AI視頻生成領域“老大哥”Runway9月的新品已將視頻生成時長延長至40秒,幾乎追平Sora展示的效果;Luma AI比Sora效果更真實還免費,在SimilarWeb統計的全球AI產品訪問量為AI視頻生成類工具排名第一;Pika也在2024年10月已推出Pika 1.5,更真實(shi)的運(yun)動效(xiao)果和大屏幕鏡頭堪稱驚(jing)艷……
Meta于11月推出了自帶配音的文生視頻模型Movie Gen,直接用一個完整的評測體系宣告自己打敗Sora;谷歌已從團隊層面削弱Sora的戰斗力,Sora項目兩位負責人之一已于近期加入谷歌DeepMind,為自家AI視頻生成工具Veo注入火力……一把又一把火越燒越旺。
▲Meta發(fa)測(ce)試(shi)結果證明自(zi)家Movie Gen趕(gan)超Sora
在大洋彼岸的中國,AI創企和科技巨頭也已推出多款“中國造Sora”,在剛剛過去的夏天開啟了一輪輪熱戰。
愛詩(shi)科技、生數科技、智象未來、Morph Studio、智譜AI、Minimax等(deng)AI創企都已推出了公眾(zhong)可用的AI視(shi)(shi)頻(pin)生成工(gong)具(ju),免費策略(lve)、功(gong)能更新(xin)(xin)、玩法創新(xin)(xin)輪番(fan)轟炸;科技大(da)廠阿里、字節(jie)跳動、快(kuai)手、騰訊等(deng)也都入場(chang)攪局,對這一市場(chang)虎(hu)視(shi)(shi)眈眈。
快手推出的可靈AI在全球現象級爆紅,字節推出的即夢AI憑借CapCut(剪映)已成為許多短視頻博主創作必備工具,愛詩科技推出的PixVerse率先打開國際市場并多次迭代,生數科技的Vidu初步打入動漫影視圈……其中后發制人的快手7月推出的可靈AI在2024年8月訪問量達1448萬,環比增長591.54%,位列全球AI產品流量排行榜第32位,在AI視頻生成賽道排名僅次于Luma AI。
總之,在Sora靜默的這半年多里,同行正加速占領AI視頻生成市場。
▲部(bu)分熱門AI視(shi)頻(pin)生成產品/模型(xing)進展情況
AI視頻生成賽道的戰況在盛夏推至頂峰,但大戰入秋后的結果如何?
就在產業和市場猝不及防之際,一場寒潮已經悄然潛入,不少紅極一時的類Sora產品熱度驟降。
今年9月,根據InfoQ等科技媒體聯合推出的AI產品榜·全球降速榜,上榜的前五名中有兩名都是AI視頻生成工具:Luma AI 9月網站Web訪問量為12.13M,環比下降38.49%,位居第二;Viggle 9月網站Web訪問量為2.85M,環比下跌36.13%。
▲AI產(chan)品榜(bang)·全球降速榜(bang)(圖源:InfoQ)
而正如前文提到,據第三方平臺AIGCRank援引全球知名數據機構SimilarWeb數據,眾多全球AI產品2024年8月訪問量繼續上漲。排名前20的AI產品中,除了月訪問超20億的“常青樹”ChatGPT,還有AI搜索引擎Perplexity、虛擬角色JanitorAI、PDF工具Liner等多個領域的黑馬,卻未出現一個AI視頻生成工具。
▲全球AI產品2024年8月訪問量(liang)榜單(圖源:AIGCRank)
前50名單中僅出現了排名22的Luma AI,但訪問量僅1920萬,環比下跌14.9%。按照這樣的(de)趨勢,這棵獨苗(miao)在(zai)下個月統(tong)計中很有可能被踢(ti)出前50名。
▲全球AI產(chan)品2024年8月(yue)訪(fang)問量榜單(圖源:AIGCRank)
當然,一(yi)些(xie)新晉(jin)AI視頻生成產品(pin)的(de)增長(chang)還是不錯的(de),比如快手(shou)推出的(de)Kling AI(可(ke)靈AI)海(hai)外版9月(yue)出海(hai)總榜Top1,幾乎從零開(kai)始月(yue)訪(fang)問量達(da)1765萬次(ci);生數科技7月(yue)在全球上線的(de)Vidu?8月(yue)100倍增長(chang),增速(su)高達(da)14158.35%。
然而,這些產品的用戶體量(liang)還是比較(jiao)小,如何增(zeng)長到Luma AI那樣的水平,并克服后者還未克服的瓶頸,是新入局(ju)者打響第一炮后不(bu)得不(bu)面對的問題(ti)。
而(er)科技巨頭那邊(bian),情況也并沒有看起來(lai)的(de)那樣樂(le)觀。
無論(lun)是(shi)國外的(de)(de)(de)Meta、谷歌,還(huan)是(shi)國內的(de)(de)(de)阿里、字節(jie)、騰訊等(deng),布(bu)局AI視(shi)(shi)頻生成(cheng)賽道步伐都比(bi)(bi)較謹慎。它們大多(duo)數(shu)沒(mei)有推出全民級的(de)(de)(de)消費產(chan)品,而是(shi)以試水為主。背后(hou),無疑是(shi)在衡量算力及數(shu)據的(de)(de)(de)巨額投入,與(yu)親自做AI視(shi)(shi)頻生成(cheng)的(de)(de)(de)收益是(shi)否成(cheng)正比(bi)(bi)。
這不禁讓人思考:AI視頻賽道入秋,大廠們的余糧也不足了?
三、視頻大模型為何始終發布雷聲大,落地雨點小?
當下,整個類Sora產品市場正進入一個調整期。
類Sora產品賽道的瓶頸已經展露出來。在親自體驗多款AI視頻生成工具并與多位消費者交流之后,筆者認為,當下類Sora產品主要存在共性問題在于技術成熟度不足。具體表現在:
1、生成視頻時長限制。很多(duo)人用到的(de)AI視頻(pin)生(sheng)(sheng)成(cheng)工具僅(jin)能生(sheng)(sheng)成(cheng)4-5秒的(de)視頻(pin),對于需要(yao)完整表(biao)達內容的(de)創作(zuo)者來說過于短(duan)暫(zan),難以(yi)進行影視創作(zuo)等商業化支持。即便一些平臺的(de)視頻(pin)生(sheng)(sheng)成(cheng)時間已經(jing)接近1分鐘,但仍然存在前(qian)后(hou)一致性、動態(tai)不足等問題。
2、功能更新突破性不足。過去一段時間,多家AI視頻生成廠商都對功能(neng)進行密(mi)集迭代,但大多是(shi)“錦上添花”而(er)缺乏躍進式體驗(yan)(yan)升(sheng)級(ji)。比如Pika推出(chu)了唇形同(tong)步功能(neng)LipSync、AI配(pei)音(yin)工具(ju)Sound Effects、風(feng)格選項等新功能(neng),但并未給用戶帶來突破性的體驗(yan)(yan),出(chu)現“同(tong)質化”趨勢。
3、等待時間過長。比(bi)如在Luma AI的Dream Machine發布后,由于(yu)大(da)(da)量(liang)用戶(hu)(hu)涌入使用,服(fu)務器壓力過大(da)(da),很多用戶(hu)(hu)需要排(pai)隊等(deng)待數小時(shi)才(cai)能得到生成的視頻,從(cong)(cong)而大(da)(da)大(da)(da)消耗了(le)用戶(hu)(hu)的耐心,讓體(ti)驗打(da)折扣。從(cong)(cong)企業角度(du)來說,提供AI視頻生成服(fu)務是(shi)一項遠比(bi)聊天(tian)機(ji)器人更耗費算力的工作,成本壓力大(da)(da)。
4、高昂的付費價格。雖然(ran)各(ge)家AI視頻(pin)生成工(gong)具(ju)都推出了免費服(fu)務,但大多都有次(ci)數和質(zhi)量的(de)(de)(de)(de)(de)限制。以(yi)Dream Machine為例,其有29.99美(mei)元的(de)(de)(de)(de)(de)標準檔(dang)(dang)、99.99美(mei)元的(de)(de)(de)(de)(de)專業檔(dang)(dang)以(yi)及499.99美(mei)元的(de)(de)(de)(de)(de)高級(ji)檔(dang)(dang)等不(bu)同檔(dang)(dang)次(ci)的(de)(de)(de)(de)(de)付費選(xuan)項(xiang),高昂的(de)(de)(de)(de)(de)價(jia)格使(shi)得當下AI視頻(pin)生成工(gong)具(ju)的(de)(de)(de)(de)(de)性價(jia)比(bi)大打折(zhe)扣,影(ying)響其熱(re)度進一步提升(sheng)。
而從外部環境來看,當下AI視頻生成在商業化方面也缺乏應用市場的刺激。
當下,在經濟增(zeng)長放緩的(de)背景下,無(wu)論是(shi)(shi)消(xiao)費端(duan)用戶還是(shi)(shi)各(ge)行各(ge)業企業對AI投入都會更加(jia)謹(jin)慎。
以短(duan)視頻(pin)(pin)創(chuang)作UGC市場(chang)為(wei)(wei)例,今年7月抖音可快手兩大(da)短(duan)視頻(pin)(pin)廠商(shang)都親自下(xia)場(chang),分別(bie)推出《三星堆(dui):未(wei)來啟示(shi)錄》、《山海奇鏡之(zhi)劈波斬浪》兩部AI生成(cheng)短(duan)劇(ju),盡(jin)管在平臺(tai)的(de)帶動(dong)下(xia)兩部AI短(duan)劇(ju)迅速播(bo)放破億,并(bing)吸引了(le)不少創(chuang)作者開(kai)始嘗試AI視頻(pin)(pin)生成(cheng)。然而,時(shi)隔三個月,在各大(da)平臺(tai)上并(bing)未(wei)看到AI生成(cheng)短(duan)劇(ju)扎堆(dui)跟進(jin)出現的(de)勢頭。幾位嘗試過AI的(de)短(duan)視頻(pin)(pin)創(chuang)作者告訴智東西(xi),主要(yao)因為(wei)(wei)當下(xia)內容賽道競爭(zheng)激烈,變現更加艱難,他們(men)更愿(yuan)意從(cong)話題、內容質(zhi)量等方面(mian)去(qu)提升而非增大(da)技術(shu)成(cheng)本投入(ru)。
以AI被寄予高希望變革的(de)影(ying)視(shi)(shi)行(xing)(xing)業為例,據央視(shi)(shi)新聞(wen)報道,2024年(nian)(nian)上半(ban)年(nian)(nian),北美電影(ying)票房35.55億美元,同比(bi)下(xia)降19.2%;據燈塔專業版,2024年(nian)(nian)國(guo)慶檔(dang)(10月(yue)1日-10月(yue)7日)票房同比(bi)去(qu)年(nian)(nian)的(de)27.36億下(xia)滑(hua)了23%……在(zai)這種背景下(xia),即便已(yi)經有不(bu)少影(ying)視(shi)(shi)人、短視(shi)(shi)頻(pin)創作(zuo)(zuo)者選擇(ze)AI視(shi)(shi)頻(pin)生(sheng)成(cheng)工具進行(xing)(xing)創作(zuo)(zuo),但付費(fei)意愿卻不(bu)高。
向內看AI視頻生成技術發展仍不成熟,向外看AI視頻生成賽道的商業化外部條件不足,這也解釋了為什么視頻大模型始終發布雷聲大,落地雨點小。
結語:冷靜看待AI產品熱,AI視頻賽道仍需等風來
當人們熱衷(zhong)于AI產品的火熱落地時,AI視頻(pin)生(sheng)成工(gong)具已經悄然入秋,Sora的難產和AI視頻(pin)生(sheng)成同行的瓶(ping)頸不容忽視。只有冷(leng)靜看待(dai)技術產業賽(sai)道的周期性特點,企(qi)業和產業才能夠在(zai)日(ri)益激烈的競(jing)賽(sai)中拔得頭籌。
旱季長(chang)根系,雨季長(chang)葉(xie)子。與聊天(tian)(tian)機器人、虛擬角色、翻譯工具等賽道(dao)相比,AI視(shi)頻(pin)生(sheng)(sheng)成目前的剛需賽道(dao)影(ying)視(shi)制作行業本身面(mian)臨下行壓力,阻礙了AI視(shi)頻(pin)生(sheng)(sheng)成產品(pin)的商業化落地(di)。寒冬隨時可能到來(lai),類Sora產品(pin)玩家在技術迭代和產品(pin)擴張(zhang)時,只有(you)保證生(sheng)(sheng)存下來(lai)才能在來(lai)年春天(tian)(tian)等到風來(lai)。