1、馬斯克Grok大模(mo)型開(kai)源 參數量(liang)3410億

2、蘋(pin)果谷歌和OpenAI商(shang)談iPhone大模(mo)型使用

3、蘋果(guo)新研(yan)究提升服務(wu)大模型(xing)效率

4、Open-Sora視頻生成模(mo)型開源(yuan)

5、AI程序員代碼能力超Claude 2

6、月之暗面智能助手支(zhi)持200萬字上下文

7、斯坦福(fu)新研究(jiu)提升大模型長(chang)視頻(pin)理解(jie)能力

8、高通手機芯片支(zhi)持100億參數(shu)大模型

9、國內(nei)首個(ge)AI導演上崗

10、賽迪四川發布中國AI大模(mo)型20強(qiang)報告

11、OpenAI CTO說(shuo)不知道Sora訓練數據出處(chu)

12、阿聯酋AI投資公司考(kao)慮支持(chi)OpenAI萬億芯片計劃

1、馬斯克Grok大模型開源 參數量3410億

今(jin)天,馬斯克的(de)AI創(chuang)企xAI正式(shi)發布了大(da)模型(xing)Grok-1,其參(can)(can)數量(liang)達到了3140億,超過OpenAI GPT-3.5的(de)1750億。這是迄今(jin)參(can)(can)數量(liang)最大(da)的(de)開(kai)源大(da)語言(yan)模型(xing),遵照Apache 2.0協議開(kai)放模型(xing)權重和架構。Grok-1是一個混(hun)合專家(Mixture-of-Experts,MoE)大(da)模型(xing)。xAI稱這是他們自己從頭訓練(lian)的(de)大(da)模型(xing),Grok-1沒有針對特定應(ying)用進行(xing)微調。

2、蘋果谷歌和OpenAI商談iPhone大模型使用

今(jin)天(tian),據彭博社(she)報道,有知情人士(shi)稱,蘋(pin)果(guo)公司正在與谷歌(ge)進(jin)行(xing)談判,希(xi)望將谷歌(ge)的(de)Gemini大模型能(neng)力(li)應用在iPhone中,以支持今(jin)年(nian)iPhone即將增加的(de)各類生成(cheng)式(shi)AI功能(neng)。彭博社(she)記者馬克(ke)·古爾曼(man)認為(wei),這(zhe)將是一項重大的(de)協(xie)議(yi),可能(neng)會撼動整個AI行(xing)業。該報道還提(ti)到,蘋(pin)果(guo)最近(jin)與OpenAI進(jin)行(xing)了討論,考(kao)慮使用其大模型。

3、蘋果新研究提升服務大模型效率

3月14日,蘋果(guo)研(yan)究人員發布(bu)論文,推出了(le)一(yi)種(zhong)(zhong)用于大(da)型(xing)語言模型(xing)中快(kuai)速推測解(jie)碼的(de)(de)(de)Recurrent Drafter,這(zhe)種(zhong)(zhong)改進(jin)后的(de)(de)(de)推測解(jie)碼方法可以(yi)提高服務大(da)型(xing)語言模型(xing)的(de)(de)(de)效率。Recurrent Drafter利(li)用了(le)雙模型(xing)推測解(jie)碼方法和單(dan)模型(xing)方法Medusa。研(yan)究人員通(tong)過實驗證明了(le)這(zhe)種(zhong)(zhong)方法在(zai)幾(ji)個主流開源大(da)型(xing)語言模型(xing)上的(de)(de)(de)有(you)效性(xing)。

論文地址:

//arxiv.org/pdf/2403.09919.pdf

HuggingFace地址:

//huggingface.co/papers/2403.09919

4、Open-Sora視頻生成模型開源

3月18日凌(ling)晨,潞晨科技(ji)創(chuang)始人(ren)尤(you)洋教授在X平臺發(fa)文,潞晨科技(ji)旗下(xia)Colossal-AI團隊開源了(le)其Open-Sora 1.0視頻(pin)生成模(mo)(mo)型(xing),包(bao)括模(mo)(mo)型(xing)權重(zhong)、訓(xun)練源代(dai)碼和詳(xiang)細的架構(gou)(gou)。該模(mo)(mo)型(xing)采用了(le)Diffusion Transformer(DiT)架構(gou)(gou)。據了(le)解,團隊以使用了(le)DiT架構(gou)(gou)的開源文生圖模(mo)(mo)型(xing)PixArt-α為基礎,引(yin)入了(le)時間注意力(li)層,并將其擴展到了(le)視頻(pin)數據上。

GitHub地址:

//github.com/hpcaitech/Open-Sora

5、AI程序員代碼能力超Claude 2

3月15日,AI創企Cognition對其團隊發布的(de)首個AI軟件工(gong)程師Devin進行(xing)了(le)技(ji)術解(jie)(jie)讀,發布了(le)關于Devin的(de)SWE-bench基準測(ce)試(shi)技(ji)術報告(gao)。SWE-bench可以(yi)評估系統解(jie)(jie)決(jue)現(xian)實(shi)中(zhong)(zhong)代碼庫問題(ti)(ti)的(de)能力。測(ce)試(shi)結果顯示(shi),Devin不需要(yao)人(ren)類輔(fu)助(zhu)就(jiu)可以(yi)解(jie)(jie)決(jue)570個問題(ti)(ti)中(zhong)(zhong)的(de)79個問題(ti)(ti),成(cheng)功率為13.86%,高(gao)于SOTA 大(da)模型(xing)(Claude 2)的(de)4.80%。

GitHub地址:

//github.com/CognitionAI/devin-swebench-results

6、月之暗面智能助手支持200萬字上下文

今(jin)(jin)天,AI創企(qi)月之暗(an)面(Moonshot AI)宣(xuan)布其智能助手Kimi在長上下文(wen)窗口技術上取得突破,無損(sun)上下文(wen)長度提升(sheng)至200萬字。今(jin)(jin)天起,支持200萬字上下文(wen)的Kimi已(yi)啟動內測。據稱,基于(yu)新版Kimi,用戶上傳幾十萬字的經(jing)典德(de)州撲(pu)克(ke)長篇教(jiao)程后,Kimi可(ke)以(yi)扮演德(de)撲(pu)專(zhuan)家為(wei)用戶提供出牌(pai)策略的指導。

7、斯坦福新研究提升大模型長視頻理解能力

3月(yue)15日,斯坦福研究人員發(fa)布(bu)論文,推出(chu)了一種基(ji)于代(dai)(dai)理(li)(Agent)的系統——VideoAgent,其將大型(xing)語言模型(xing)作(zuo)為(wei)(wei)中央代(dai)(dai)理(li),迭代(dai)(dai)地(di)識(shi)別和(he)編譯(yi)關鍵(jian)信(xin)息(xi)以(yi)回答問題,同(tong)時利(li)用(yong)視(shi)覺(jue)語言基(ji)礎模型(xing)作(zuo)為(wei)(wei)翻譯(yi)和(he)檢索視(shi)覺(jue)信(xin)息(xi)的工(gong)具。在(zai)EgoSchema和(he)NExT-QA基(ji)準測試中,VideoAgent在(zai)零樣本準確(que)率上分(fen)別達到了54.1%和(he)71.3%,平均僅使用(yong)了8.4和(he)8.2幀。研究人員稱,該測試結果(guo)表明該方(fang)法(fa)在(zai)效(xiao)果(guo)和(he)效(xiao)率上優于當(dang)前最先進(jin)的方(fang)法(fa),在(zai)提升長(chang)篇(pian)視(shi)頻理(li)解方(fang)面(mian)有(you)應用(yong)潛(qian)力。

論文地址:

//arxiv.org/pdf/2403.10517.pdf

GitHub地址:

//wxh1996.github.io/VideoAgent-Website/

8、高通手機芯片支持100億參數大模型

今(jin)天,高通正(zheng)式(shi)發布了第(di)三代驍龍8s芯片,其在端側生成(cheng)式(shi)AI能力方面進行了重(zhong)點升級(ji),支持(chi)Baichuan-7B、Gemini Nano、Llama 2和智譜ChatGLM等30多個大型(xing)語言模型(xing)和大型(xing)視覺(jue)模型(xing),據稱(cheng)最高支持(chi)模型(xing)參(can)數量為100億。

9、國內首個AI導演上崗

據上海證券報(bao)報(bao)道,3月15日,湖南廣電集團(tuan)首(shou)(shou)個AI導(dao)演(yan)愛(ai)芒(mang)(英文名AIM)正式以(yi)助理導(dao)演(yan)的身份和(he)觀眾、網友們見面。這(zhe)也(ye)是國(guo)內首(shou)(shou)個正式上崗的AI導(dao)演(yan)。3月17日午間,該(gai)綜藝(yi)超前企劃播出,愛(ai)芒(mang)正式亮相。《聲生(sheng)不息》系列制片人洪(hong)嘯說:“AI導(dao)演(yan)會倒逼著我們不斷地去(qu)創(chuang)新。”

10、賽迪四川發布中國AI大模型20強報告

智(zhi)東西3月17日(ri)消息,3月15上午,賽迪工業和(he)信息化研究(jiu)院(yuan)(集團)四(si)(si)川有限(xian)公司發布了《2024中國(guo)人工智(zhi)能多模(mo)態大(da)(da)(da)模(mo)型(xing)企業綜合競爭力20強研究(jiu)報告》,騰訊混元大(da)(da)(da)模(mo)型(xing)排(pai)名第(di)(di)一、科(ke)大(da)(da)(da)訊飛星火大(da)(da)(da)模(mo)型(xing)排(pai)名第(di)(di)二、阿里巴(ba)(ba)巴(ba)(ba)通義千問排(pai)名第(di)(di)三、華為盤古大(da)(da)(da)模(mo)型(xing)排(pai)名第(di)(di)四(si)(si)、智(zhi)譜(pu)華章智(zhi)普清言排(pai)名第(di)(di)五。

據稱(cheng)此(ci)次評(ping)(ping)(ping)價(jia)(jia)(jia)研究通過(guo)建立覆蓋經(jing)濟、技(ji)術、行業(ye)、商(shang)業(ye)等多(duo)維度指標的企業(ye)競(jing)爭力(li)評(ping)(ping)(ping)價(jia)(jia)(jia)模(mo)型,對我(wo)國人工(gong)智能自研多(duo)模(mo)態大模(mo)型企業(ye)實力(li)進行綜合(he)評(ping)(ping)(ping)估,最(zui)終形(xing)成人工(gong)智能多(duo)模(mo)態大模(mo)型企業(ye)綜合(he)競(jing)爭力(li)20強評(ping)(ping)(ping)價(jia)(jia)(jia)結(jie)果。其評(ping)(ping)(ping)價(jia)(jia)(jia)體(ti)系包括經(jing)濟抗衡力(li)(15%)、行業(ye)影響力(li)(30%)、技(ji)術競(jing)爭力(li)(40%)、商(shang)業(ye)角逐力(li)(15%)。

11、OpenAI CTO說不知道Sora訓練數據出處

智東西3月17日(ri)消息,3月14日(ri),《華爾街日(ri)報》記(ji)者Joanna Stern采訪了(le)OpenAI首席技術官Mira Murati,針對一段Sora生成的虛擬視頻進行了(le)討論,Mira Murati解釋(shi)了(le)Sora的工作原理,但是(shi)回避了(le)大部分有關該模型(xing)訓(xun)練數(shu)據來(lai)源的問題,甚至(zhi)在回答(da)中出現了(le)“我其(qi)實不(bu)太確定(I’m actually not sure about that)”的說法(fa)。

12、阿聯酋AI投資公司考慮支持OpenAI萬億芯片計劃

智東(dong)西(xi)3月17日消息,據英國《金融時報(bao)(bao)》報(bao)(bao)道(dao),阿聯酋(qiu)阿布扎比(bi)一(yi)家由(you)國家資(zi)助的(de)(de)(de)投資(zi)公司(si)MGX正在(zai)(zai)和OpenAI談判,討論(lun)支持此前由(you)OpenAI CEO Sam Altman提出的(de)(de)(de)“萬億芯片計劃”。報(bao)(bao)道(dao)稱,MGX 是一(yi)家今(jin)年1月剛剛成(cheng)立的(de)(de)(de)專注于AI的(de)(de)(de)投資(zi)公司(si),代表(biao)了阿聯酋(qiu)希望(wang)在(zai)(zai)全球AI競賽中(zhong)實現領先的(de)(de)(de)關鍵(jian)布局。