1、馬斯克:特斯拉(la)一年前(qian)就(jiu)可生成(cheng)真實世界視頻(pin)

2、馬(ma)斯克連續發(fa)文施壓OpenAI

3、楊立(li)昆開噴Sora:不理解(jie)物理世(shi)界

4、謝(xie)賽寧(ning)否認系Sora發明者

5、李志飛稱Sora是(shi)世界模擬器 歸功于三大要素

6、AI配音(yin)版Sora視(shi)頻上線

7、英偉達(da)高級研究科學家回應Sora視(shi)頻“有聲”

8、傳月之暗(an)面融(rong)資10億美元,美團、阿(a)里參投

9、266家企業(ye)通(tong)過網(wang)信辦第四批深度合(he)成算(suan)法備(bei)案

10、信(xin)通(tong)院(yuan)可(ke)信(xin)AI汽車大模型(xing)啟動(dong)首批(pi)驗(yan)證

11、虹(hong)軟大模型引擎上線視頻生成功能

12、傅盛稱AGI和Sora沒(mei)有(you)大關聯(lian)

13、UC伯克利大世(shi)界模型登GitHub熱榜第一(yi)

14、硅谷芯片大神懟阿(a)爾(er)特曼7萬億(yi)美元AI芯片計(ji)劃

1、馬斯克:特斯拉一年前就可生成真實世界視頻

今天,馬斯(si)克(ke)在社交平(ping)臺X上回復(fu)網友稱,一年(nian)(nian)以前,特(te)(te)斯(si)拉(la)就已經能以精確(que)的(de)(de)物(wu)理(li)生(sheng)成真(zhen)實世界的(de)(de)視(shi)頻(pin),但由于(yu)訓(xun)練(lian)數據來自汽車,所以生(sheng)成的(de)(de)視(shi)頻(pin)并不(bu)有(you)趣(qu),因(yin)此即(ji)便(bian)具有(you)動(dong)態生(sheng)成的(de)(de)內容也看起來像(xiang)來自特(te)(te)斯(si)拉(la)的(de)(de)視(shi)頻(pin)。他(ta)(ta)稱特(te)(te)斯(si)拉(la)缺(que)乏FSD的(de)(de)訓(xun)練(lian)算(suan)力,因(yin)此沒有(you)用其(qi)他(ta)(ta)視(shi)頻(pin)進行(xing)訓(xun)練(lian),今年(nian)(nian)晚些時候,當(dang)特(te)(te)斯(si)拉(la)有(you)閑(xian)置(zhi)算(suan)力時,他(ta)(ta)們(men)會進行(xing)訓(xun)練(lian)。馬斯(si)克(ke)轉發(fa)了2023年(nian)(nian)特(te)(te)斯(si)拉(la)自動(dong)駕(jia)駛總(zong)監Ashok Elluswamy介紹特(te)(te)斯(si)拉(la)如何用AI模擬真(zhen)實世界駕(jia)駛的(de)(de)相關視(shi)頻(pin),其(qi)中AI生(sheng)成了7個不(bu)同角度視(shi)頻(pin)以實現演示。

2、馬斯克連續發文施壓OpenAI

今天,馬(ma)(ma)斯克在社(she)交平臺X上連發(fa)多條推文(wen)施壓(ya)OpenAI,他(ta)轉發(fa)了(le)2016年8月,OpenAI第一次收到英偉(wei)達捐贈DGX-1 AI超級計算機的(de)推文(wen),并(bing)說“現在看看發(fa)生了(le)什么(me):(”。同時他(ta)還轉發(fa)了(le)同天發(fa)布(bu)的(de)OpenAI公司入(ru)口處(chu)照(zhao)片,并(bing)@OpenAI稱(cheng),這是(shi)OpenAI“最初創建的(de)原因”。馬(ma)(ma)斯克炮(pao)轟OpenAI背離初心,言(yan)外之意是(shi)對(dui)AI技術過快的(de)發(fa)展表示擔憂。

3、楊立昆開噴Sora:不理解物理世界

今天(tian),Meta首席(xi)AI科學家楊立(li)昆在(zai)社交(jiao)平臺X上發(fa)文(wen)評價Sora,一(yi)個“創造東西”的(de)工(gong)具作(zuo)為創造性(xing)的(de)輔助工(gong)具是非常棒的(de)。“但作(zuo)為幫助人們采取行動的(de)心理(li)模型(xing),它完全很(hen)糟糕。”并(bing)且針對OpenAI Sora生(sheng)成(cheng)的(de)“螞蟻(yi)穿梭蟻(yi)巢特寫(xie)”視(shi)頻(pin)中,螞蟻(yi)只有4條(tiao)(tiao)腿,楊立(li)昆發(fa)文(wen)喊話(hua)Sora團隊(dui)負(fu)責人Aditya Ramesh:“螞蟻(yi)有六條(tiao)(tiao)腿,不是嗎?”楊立(li)昆稱,Aditya在(zai)紐約大學讀本科時就在(zai)他(ta)的(de)實驗室工(gong)作(zuo)過,之后(hou)在(zai)OpenAI實習并(bing)留下任職。2月17日,楊立(li)昆曾發(fa)文(wen)稱:“根據提示生(sheng)成(cheng)看起來(lai)最真實的(de)視(shi)頻(pin)并(bing)不表(biao)明(ming)系(xi)統能理(li)解物理(li)世(shi)界,生(sheng)成(cheng)與(yu)世(shi)界模型(xing)的(de)因果預測有很(hen)大不同。”

4、謝賽寧否認系Sora發明者

今天,據(ju)新浪科技報道(dao),紐約大學助理教授謝賽寧發(fa)朋友圈辟謠(yao)自媒體稱其(qi)是Sora發(fa)明者之一。謝賽寧稱,Sora跟他的(de)關系(xi)“只能(neng)(neng)說(shuo)是一點關系(xi)都沒有(you)”。對于Sora這樣的(de)復(fu)雜系(xi)統,人才第(di)一,數據(ju)第(di)二(er),算力第(di)三,其(qi)他都沒有(you)什么是不可(ke)替代的(de)。他還談道(dao):“在(zai)問Sora為什么沒出現在(zai)中(zhong)國的(de)同(tong)時,可(ke)能(neng)(neng)也得(de)問問假(jia)設真的(de)出現了(可(ke)能(neng)(neng)很快),我們有(you)沒有(you)準備好?”

5、李志飛稱Sora是世界模擬器 歸功于三大要素

今天,AI科技公(gong)司出門(men)問問CEO李志飛在公(gong)眾號“飛哥說(shuo)AI”發文,分析了“為(wei)(wei)(wei)(wei)什么說(shuo)Sora是世(shi)(shi)界(jie)(jie)(jie)(jie)的(de)(de)模(mo)(mo)(mo)擬(ni)(ni)(ni)器(qi)?”他提(ti)(ti)到(dao),ChatGPT通過(guo)“語言”這(zhe)一(yi)思維的(de)(de)載(zai)體,其(qi)可以多方面(mian)模(mo)(mo)(mo)擬(ni)(ni)(ni)虛(xu)擬(ni)(ni)(ni)世(shi)(shi)界(jie)(jie)(jie)(jie)中的(de)(de)各(ge)種場(chang)景和角色(合(he)理絲滑的(de)(de)故事線(xian)),成為(wei)(wei)(wei)(wei)虛(xu)擬(ni)(ni)(ni)世(shi)(shi)界(jie)(jie)(jie)(jie)的(de)(de)“模(mo)(mo)(mo)擬(ni)(ni)(ni)器(qi)”。而(er)作為(wei)(wei)(wei)(wei)“物(wu)理世(shi)(shi)界(jie)(jie)(jie)(jie)的(de)(de)模(mo)(mo)(mo)擬(ni)(ni)(ni)器(qi)”,需要(yao)能(neng)(neng)夠(gou)在虛(xu)擬(ni)(ni)(ni)環境中重(zhong)現(xian)物(wu)理現(xian)實,為(wei)(wei)(wei)(wei)用戶提(ti)(ti)供一(yi)個逼(bi)真且不違反「物(wu)理規律」的(de)(de)數字世(shi)(shi)界(jie)(jie)(jie)(jie)。他們認為(wei)(wei)(wei)(wei),Sora之所以有潛(qian)力成為(wei)(wei)(wei)(wei)下(xia)一(yi)代物(wu)理世(shi)(shi)界(jie)(jie)(jie)(jie)模(mo)(mo)(mo)擬(ni)(ni)(ni)器(qi)的(de)(de)翹楚,主要(yao)歸功(gong)于其(qi)基于多模(mo)(mo)(mo)態大(da)模(mo)(mo)(mo)型的(de)(de)設計理念及其(qi)實現(xian)中巨大(da)算力和工(gong)程能(neng)(neng)力。不過(guo),他也提(ti)(ti)到(dao),Sora并不是成為(wei)(wei)(wei)(wei)世(shi)(shi)界(jie)(jie)(jie)(jie)模(mo)(mo)(mo)擬(ni)(ni)(ni)器(qi)的(de)(de)唯一(yi)解法(fa),另外一(yi)種可能(neng)(neng)是ChatGPT+物(wu)理渲染引擎UE。

6、AI配音版Sora視頻上線

昨天,AI音(yin)(yin)頻(pin)生(sheng)(sheng)成創企(qi)ElevenLabs在社(she)交平臺X上(shang),發布了為Sora生(sheng)(sheng)成的(de)視(shi)頻(pin)添加(jia)音(yin)(yin)效(xiao)后的(de)視(shi)頻(pin),如汽車行(xing)駛(shi)的(de)引擎聲(sheng)、公(gong)共交通(tong)行(xing)駛(shi)聲(sheng)音(yin)(yin)、走路聲(sheng)、海(hai)浪聲(sheng)等。并且該公(gong)司還預告AI音(yin)(yin)效(xiao)生(sheng)(sheng)成的(de)相關功能即將(jiang)上(shang)線。

傳月之暗面融資10億美元;馬斯克稱已掌握Sora類似技術;楊立昆開噴Sora丨AIGC大事日報

7、英偉達高級研究科學家回應Sora視頻“有聲”

今天,英(ying)偉(wei)達高(gao)級研究科學家范(fan)麟熙(xi)(Jim Fan)發文回應(ying)AI音頻(pin)生(sheng)成創企ElevenLabs為OpenAI Sora生(sheng)成的(de)視頻(pin)添加了音頻(pin)。范(fan)麟熙(xi)認為,目前這一音頻(pin)是(shi)由(you)文本提示的(de),但正確的(de)調節應(ying)該針對文本和視頻(pin)像(xiang)素,既(ji)要(yao)學習準(zhun)確的(de)視頻(pin),音頻(pin)映射還需要(yao)對潛在空(kong)間(jian)中(zhong)的(de)一些“隱(yin)式”物理進行建(jian)模。

想要正確模(mo)擬視頻的聲音(yin)需要做到:

(1)識別每(mei)個對象的(de)類別、材(cai)料和空間位置;

(2)識別(bie)物(wu)體之間(jian)的(de)高(gao)階相互作用,棍子(zi)是否(fou)擊中木質、金屬或鼓表面(mian)?以什么速度;

(3)識別環境:餐館、空間(jian)站等;

(4)從模型(xing)的內(nei)存中檢索物體和周圍環境的典型(xing)聲音模式;

(5)“軟”運行(xing),學習物理(li)規則來拼湊(cou)和調整聲音(yin)模式的(de)參數,甚(shen)至即時合成全新的(de)聲音(yin)模式,有(you)點像游戲引擎中的(de)“程(cheng)序音(yin)頻”;

(6)如果場(chang)景繁(fan)忙,模型(xing)需要(yao)根據空間位置疊加多(duo)個音軌。

以(yi)上(shang)這些(xie)都(dou)將通過(guo)大量視頻、音頻組合的(de)(de)梯度下降來學習,這些(xie)組合在大多數互聯網視頻中(zhong)自然是(shi)時(shi)間對齊的(de)(de)。注意力層將在其權重中(zhong)實現這些(xie)算法以(yi)滿(man)足擴(kuo)散目標。不過(guo),目前(qian)(qian)還沒有如此高質量的(de)(de)AI音頻引擎(qing),他分享(xiang)了一篇5年前(qian)(qian)名為(wei)“像素之聲(sheng)”的(de)(de)論文。

論文(wen)地址:http: //sound-of-pixels.csail.mit.edu

8、傳月之暗面融資10億美元,美團、阿里參投

據36氪報道,國內大(da)(da)模(mo)型獨角獸月(yue)之暗(an)(an)面近期已完成(cheng)新一(yi)輪超10億美(mei)(mei)元融(rong)資,投資方包括紅杉(shan)中國、小紅書、美(mei)(mei)團、阿(a)里(li),老(lao)股東跟(gen)投。本輪融(rong)資后(hou),月(yue)之暗(an)(an)面估值已達約25億美(mei)(mei)元。據了解,月(yue)之暗(an)(an)面當前也已經在(zai)秘密(mi)研(yan)發通用多模(mo)態模(mo)型,預計今年內將推出。目(mu)前,月(yue)之暗(an)(an)面已經完成(cheng)千億參數規模(mo)的自研(yan)通用大(da)(da)模(mo)型,面向消費者(zhe)的“kimi智能(neng)助手”。

9、266家企業通過網信辦第四批深度合成算法備案

2月18日(ri),根據《互聯網信息服務深(shen)度合成管(guan)理規定(ding)》,國家(jia)(jia)互聯網信息辦公室公開發布第四(si)批境內深(shen)度合成服務算(suan)法(fa)(fa)備案信息,包括獵(lie)戶星空大模型(xing)算(suan)法(fa)(fa)、愛詩科(ke)技(ji)視頻生(sheng)成算(suan)法(fa)(fa)、TCL智能問答內容(rong)生(sheng)成算(suan)法(fa)(fa) 、vivo藍心(xin)大模型(xing)算(suan)法(fa)(fa)、智譜多模態通用文生(sheng)圖算(suan)法(fa)(fa)、聆心(xin)CharacterChat生(sheng)成算(suan)法(fa)(fa)等266家(jia)(jia)企業。

詳(xiang)細(xi)備(bei)案(an)清單地址://www.cac.gov.cn/2024-02/18/c_1709925427424332.htm

10、信通院可信AI汽車大模型啟動首批驗證

今天,依托于中國(guo)(guo)信(xin)息(xi)通信(xin)研究(jiu)院(yuan)(yuan)開展的(de)第三方(fang)(fang)評(ping)估(gu)(gu)(gu)(gu)測試平臺“可(ke)信(xin)AI評(ping)測”宣布,中國(guo)(guo)信(xin)通院(yuan)(yuan)可(ke)信(xin)AI汽車大(da)(da)模(mo)型(xing)(xing)首批標準(zhun)(zhun)符(fu)合性驗證正式(shi)啟動。此前,中國(guo)(guo)信(xin)息(xi)通信(xin)研究(jiu)院(yuan)(yuan)聯(lian)合業內30余家(jia)單位(wei)共同編制了《面向行業的(de)大(da)(da)規模(mo)預訓練模(mo)型(xing)(xing)技術(shu)和應(ying)(ying)用評(ping)估(gu)(gu)(gu)(gu)方(fang)(fang)法 第4部分(fen):汽車大(da)(da)模(mo)型(xing)(xing)》標準(zhun)(zhun),此次驗證工作主要(yao)面向汽車大(da)(da)模(mo)型(xing)(xing)相關解決方(fang)(fang)案的(de)應(ying)(ying)用單位(wei)和技術(shu)提供(gong)單位(wei)。應(ying)(ying)用方(fang)(fang)可(ke)評(ping)估(gu)(gu)(gu)(gu)汽車大(da)(da)模(mo)型(xing)(xing)的(de)應(ying)(ying)用效能(neng)(neng),對已(yi)應(ying)(ying)用或(huo)擬采用的(de)汽車大(da)(da)模(mo)型(xing)(xing)產品進(jin)行評(ping)估(gu)(gu)(gu)(gu)。同時,技術(shu)方(fang)(fang)可(ke)對產品能(neng)(neng)力進(jin)行摸底。

11、虹軟大模型引擎上線視頻生成功能

今天,虹(hong)軟核(he)(he)心大(da)模(mo)型(xing)技術(shu)引擎虹(hong)軟ArcMuse升(sheng)級,將支持面(mian)向商(shang)(shang)拍(pai)的商(shang)(shang)業視(shi)(shi)頻(pin)自(zi)動(dong)生(sheng)成(cheng)。虹(hong)軟ArcMuse大(da)模(mo)型(xing)視(shi)(shi)頻(pin)生(sheng)成(cheng)基(ji)于(yu)diffusion-transformer技術(shu)架(jia)構,通過圖像(xiang),ArcMuse大(da)模(mo)型(xing)能夠(gou)(gou)捕捉到(dao)商(shang)(shang)品(pin)(pin)的細節特(te)征、質(zhi)感、色彩等方面(mian)的精確信息,生(sheng)成(cheng)更(geng)能展示(shi)商(shang)(shang)品(pin)(pin)真實面(mian)貌的動(dong)態商(shang)(shang)拍(pai)視(shi)(shi)頻(pin)。在產(chan)品(pin)(pin)功能落(luo)地上,虹(hong)軟的ArcMuse引擎實現了兩大(da)核(he)(he)心功能:一是商(shang)(shang)品(pin)(pin)展示(shi)視(shi)(shi)頻(pin)的自(zi)動(dong)生(sheng)成(cheng),二(er)是服裝模(mo)特(te)視(shi)(shi)頻(pin)的自(zi)動(dong)生(sheng)成(cheng)。未來,PhotoStudio AI將成(cheng)為能夠(gou)(gou)助力商(shang)(shang)家依靠產(chan)品(pin)(pin)圖片(pian)生(sheng)成(cheng)展示(shi)視(shi)(shi)頻(pin)的AIGC視(shi)(shi)頻(pin)創作工具。

體驗(yan)地址://photostudio.arcsoft.com.cn/

12、傅盛稱AGI和Sora沒有大關聯

今天,在央視財經(jing)前沿科(ke)技訪談節目(mu)《光(guang)華錄》中,獵豹移動(dong)董事長兼CEO、獵戶星空董事長傅(fu)盛表示,OpenAI正(zheng)式推出(chu)Sora是(shi)一(yi)個里程碑級別(bie)的(de)(de)事件;Sora的(de)(de)出(chu)現是(shi)更好的(de)(de)工程化、更大的(de)(de)算力的(de)(de)結果。他談道,Sora相當于打開了一(yi)扇門(men),很(hen)快很(hen)多(duo)人(ren)都會涌入(ru)這個領(ling)域。OpenAI把(ba)Transformer引進到(dao)了視頻的(de)(de)時間(jian)軸(zhou)里面,真正(zheng)地實現了對更多(duo)數據量的(de)(de)理解。傅(fu)盛還提到(dao),通用(yong)人(ren)工智能的(de)(de)出(chu)現和Sora并無很(hen)大的(de)(de)關聯。

13、UC伯克利大世界模型登GitHub熱榜第一

今天,UC伯(bo)克利(li)大學研(yan)究(jiu)人員(yuan)提出的(de)大世界模型(xing)(Large World Model,LWM)登上GitHub榜首,目(mu)前已經(jing)攬(lan)獲3.2K星標(biao)(biao)。為了應對內存限(xian)制、計算復雜性和(he)(he)數據集有(you)限(xian)等挑(tiao)戰(zhan),研(yan)究(jiu)人員(yuan)從數百萬個(ge)視(shi)(shi)頻和(he)(he)語言序列的(de)標(biao)(biao)記中學習,整理了一個(ge)包含各種視(shi)(shi)頻和(he)(he)書籍的(de)大型(xing)數據集,利(li)用RingAttention技術(shu)對長序列進行(xing)可擴展訓(xun)練(lian),并(bing)逐漸將上下(xia)文(wen)大小從4000 tokens增加到100萬tokens,并(bing)完全(quan)開源(yuan)一系列7B參數模型(xing)。論(lun)文(wen)中提到,LWM可以(yi)回答超過1小時的(de)YouTube視(shi)(shi)頻中的(de)相關問題,還能在100萬tokens的(de)上下(xia)文(wen)窗口內實現高精度檢(jian)索,并(bing)且性能優于GPT-4V和(he)(he)Gemini Pro。

論文(wen)地址://largeworldmodel.github.io/

項(xiang)目地(di)址(zhi)://github.com/LargeWorldModel/LWM?tab=readme-ov-file

14、硅谷芯片大神懟阿爾特曼7萬億美元AI芯片計劃

今天(tian),硅谷芯(xin)片大神吉(ji)姆(mu)?凱勒(le)(Jim Keller)在社(she)交平臺(tai)X上回(hui)復OpenAI CEO薩姆(mu)·阿爾特曼(Sam Altman)籌集5-7萬億美元(yuan)制造(zao)AI芯(xin)片的計劃,吉(ji)姆(mu)?凱勒(le)稱,他可(ke)以用不到1萬億美元(yuan)做到這一(yi)點。