
1、阿里發(fa)布肖像(xiang)視頻生成框架EMO
2、Pika推(tui)出“對(dui)口型”功能
3、傳蘋果(guo)放棄電動(dong)汽車制(zhi)造轉向生成(cheng)式AI
4、特斯拉APP推(tui)出AI聊天(tian)助手(shou)測試版
5、Gemini 1.5通(tong)過視頻成功修復Bug
6、谷(gu)歌將進行結(jie)構性調整以解決(jue)Gemini偏見問題(ti)
7、研究顯示Gemini等在選舉上(shang)存(cun)在偏(pian)見
8、傳谷歌向媒體付費測試(shi)AI寫作工具(ju)
9、扎克(ke)伯(bo)格(ge)拜訪日韓討論AI、XR合(he)作
10、OpenAI稱《紐(niu)約時報(bao)》侵(qin)權(quan)指控(kong)存在欺(qi)騙行為
11、歐盟監管機構擬審查微(wei)軟對(dui)Mistral的(de)投資(zi)
12、GitHub推(tui)出(chu)企業版Copilot
13、微軟正測試Copilot GPT
14、百度2023年(nian)凈利(li)潤漲39%
15、百度Comate啟動眾測活動
16、螞蟻集團推出多模態遙感模型SkySense
17、魅族Aicy語音助手(shou)接入AI大模(mo)型
18、OPPO Reno11系列(lie)將引入生成式(shi)AI功能
19、南京大學開設AI通識核心課程體系(xi)
20、傳Tumblr等計劃(hua)將數據(ju)出(chu)售(shou)給AI公司(si)
21、Prophesee與高通(tong)合作進入可量產階段
22、芯片大(da)神Jim Keller創企與日企合作(zuo)設計AI芯片
23、法AI圖像創(chuang)企獲(huo)4300萬(wan)美(mei)元(yuan)融資
24、字節推出(chu)MegaScale 將LLM訓練擴展(zhan)到1萬個GPU
1、阿里發布肖像視頻生成框架EMO
今日,來自阿里巴巴的(de)團(tuan)隊發布(bu)了音(yin)頻(pin)驅動的(de)肖像(xiang)視頻(pin)生成框(kuang)架EMO(Emote Portrait Alive),相關論(lun)文同步發表(biao)于arXiv。輸入一張(zhang)參(can)考圖像(xiang)和(he)聲(sheng)音(yin)音(yin)頻(pin),該框(kuang)架能夠生成具(ju)有豐(feng)富(fu)面部(bu)表(biao)情(qing)和(he)頭(tou)部(bu)姿(zi)勢的(de)聲(sheng)音(yin)肖像(xiang)視頻(pin)。
論文地址:
arxiv.org/pdf/2402.17485.pdf
項目主頁:
humanaigc.github.io/emote-portrait-alive/
2、Pika推出“對口型”功能
昨晚,AI視(shi)頻(pin)生(sheng)(sheng)成平臺Pika宣布推(tui)出為生(sheng)(sheng)成視(shi)頻(pin)中的(de)人物(wu)配音(yin),并同時“對口型”的(de)唇形同步功能LipSync,目(mu)前僅(jin)支持Pro用戶體驗。其中,音(yin)頻(pin)生(sheng)(sheng)成部分由AI語音(yin)克隆創企ElevenLabs提供技術支持。
3、傳蘋果放棄電動汽車制造轉向生成式AI
據彭博社援引知情人(ren)士消息報道,蘋(pin)果(guo)在(zai)當地時(shi)間周二(er)于公司內部(bu)宣布取消長達(da)十年的電(dian)動汽車項目,從事(shi)該(gai)項目的近2000名(ming)員工(gong)(gong)中的許多(duo)人(ren)將被(bei)轉到由約翰·詹南德雷(lei)亞(John Giannandrea)領導的AI部(bu)門,專注于生成式人(ren)工(gong)(gong)智(zhi)能項目。
4、特斯拉APP推出AI聊天助手測試版
據electrek報道,特(te)斯(si)拉今日(ri)更新了移動端應(ying)用程序,推出(chu)測試版聊天助手,可(ke)以回(hui)答有(you)關特(te)斯(si)拉或其他產(chan)品的問題。
5、Gemini 1.5通過視頻成功修復Bug
昨日,社交平臺X博主(zhu)Mckay Wrigley稱Gemini Pro 1.5通過視頻和(he)文本成功修復了問題(ti)代碼(ma)。他將整個(ge)代碼(ma)庫以文本形式發送給Gemini Pro 1.5,并同時上(shang)傳了攝像頭拍攝的三個(ge)出錯的程序界(jie)面(mian),輸(shu)入“請幫(bang)我修復代碼(ma)中(zhong)的所有Bug”等提示詞(ci),Gemini直接給出了問題(ti)代碼(ma)位置(zhi)和(he)解決方案。
6、谷歌將進行結構性調整以解決Gemini偏見問題
據Semafor今日(ri)報道,谷歌CEO桑(sang)達爾(er)·皮查伊(Sundar Pichai)在當地時(shi)間周二(er)晚間回應了(le)Gemini的種(zhong)族(zu)偏見爭(zheng)議,稱該問題(ti)“不可接受”,并發誓要進(jin)(jin)行結(jie)構性調整來解決問題(ti)。他在內部信中(zhong)說,公司(si)在修復Gemini護(hu)欄方面已經(jing)(jing)取(qu)得了(le)進(jin)(jin)展,“我(wo)們(men)的團隊一直在夜以繼日(ri)地工作來解決這些問題(ti)。我(wo)們(men)已經(jing)(jing)看到(dao)各種(zhong)提示都(dou)得到(dao)了(le)顯著的改進(jin)(jin)。”
7、研究顯示Gemini等在選舉上存在偏見
據非盈(ying)利新聞工作室Proof今日發布的(de)報告(gao),GPT-4、Llama 2、Gemini、Mixtral和Claude等領先的(de)五個AI文(wen)本模型在26個選舉相關(guan)問題上(shang)準(zhun)確(que)性表現(xian)不佳,超過(guo)一半的(de)相應被AI專家評委不準(zhun)確(que),40%的(de)回答被評為有害(hai)。其(qi)中(zhong),Gemini、Llama2和Mixtral的(de)不準(zhun)確(que)答案(an)率最高,均超過(guo)60%。
8、傳谷歌向媒體付費測試AI寫作工具
據ADWEEK昨(zuo)日(ri)報道,谷(gu)歌(ge)上個(ge)月為少數(shu)獨立出(chu)版(ban)商推出(chu)一項計(ji)劃,為后(hou)者(zhe)提(ti)供未(wei)發布(bu)的(de)生成式AI平臺測試(shi)版(ban)訪問權(quan)限,來換取分析和(he)反饋。作為協議(yi)的(de)一部分,出(chu)版(ban)商將使(shi)用該工具套件在(zai)12個(ge)月內每(mei)天發布(bu)3篇內容(rong),每(mei)月可以獲得五位數(shu)的(de)津貼。
9、扎克伯格拜訪日韓討論AI、XR合作
據路透社報道(dao),Meta CEO扎克(ke)伯格周(zhou)二拜訪了東京,與日本(ben)首(shou)相岸(an)田文雄討論了AI問題。周(zhou)二晚(wan)間(jian),他抵達韓國,并于(yu)今日會(hui)見了LG電子CEO、LG母公(gong)司COO,討論下一(yi)代XR設備開發相關業務,以及在AI領域的潛在合(he)作。
10、OpenAI稱《紐約時報》侵權指控存在欺騙行為
據The Verge報(bao)道,OpenAI在當地時(shi)間(jian)周一提交的一份(fen)動議(yi)中(zhong)稱,《紐(niu)約時(shi)報(bao)》使用“欺騙(pian)性提示”讓ChatGPT重復其內(nei)容,并請求紐(niu)約南部的美國地方法(fa)院(yuan)駁回《紐(niu)約時(shi)報(bao)》版權侵權訴訟(song)中(zhong)的幾(ji)項索(suo)賠。
11、歐盟監管機構擬審查微軟對Mistral的投資
據(ju)The Information報道,歐洲最高(gao)反壟斷監管機構(gou)歐盟委員(yuan)會當地(di)時(shi)間周二稱(cheng),計劃審查微(wei)軟(ruan)(ruan)對法國生成式AI初創(chuang)公司(si)Mistral的(de)投(tou)資。微(wei)軟(ruan)(ruan)于周一宣(xuan)布與Mistral建立合作伙伴關(guan)系,向Mistral投(tou)資1630萬美元(yuan),并在云平臺(tai)Azure中(zhong)提供(gong)Mistral的(de)模型(xing)。
12、GitHub推出企業版Copilot
微軟旗下(xia)的(de)GitHub今日推出(chu)Copilot Enterprise,可根據(ju)企業(ye)內部的(de)代碼和知(zhi)識庫定制(zhi),每人每月39美元(yuan)。
13、微軟正測試Copilot GPT
昨日,微軟(ruan)副總裁兼(jian)Copilot和(he)必應工程(cheng)與產品(pin)負責人約爾迪·里巴斯(Jordi Ribas)透露,微軟(ruan)正在測試Copilot GPT,當用(yong)戶打開Microsoft Copilot時(shi)會(hui)出現一(yi)個新的Copilot GPT列表,可為用(yong)戶提供健身訓練(lian)計(ji)劃、計(ji)劃假期和(he)幫助烹飪(ren)等功(gong)能。
14、百度2023年凈利潤漲39%
據百度微信公眾號(hao)今日發(fa)文,其2023年營收(shou)為1345.98億元,凈(jing)利(li)潤287億元,同比增(zeng)長39%;其第(di)(di)四季(ji)度營收(shou)349.51億元,凈(jing)利(li)潤77.55億元,同比增(zeng)長44%。其中,AI成為增(zeng)長新動力,百度智能云、PP飛槳等AI平臺高速增(zeng)長,千帆大模型平臺累計精調模型1萬個(ge),AI出(chu)行平臺蘿(luo)卜快跑第(di)(di)四季(ji)度提供乘車服(fu)務83.9萬次。
15、百度Comate啟動眾測活動
據(ju)百度(du)安全應急響應中心微信公(gong)眾(zhong)號今日(ri)(ri)發文,百度(du)智能編程(cheng)工具(ju)Comate及(ji)千(qian)帆大模型平(ping)臺開啟專項加碼眾(zhong)測活動,活動時間(jian)為2月29日(ri)(ri)-3月12日(ri)(ri),單個漏(lou)洞獎勵最高(gao)可達3萬元。
16、螞蟻集團推出多模態遙感模型SkySense
螞蟻(yi)集團今日(ri)宣(xuan)布推出(chu)20億(yi)參數多模(mo)態(tai)遙感(gan)基礎模(mo)型SkySense,這是螞蟻(yi)百靈大模(mo)型在多模(mo)態(tai)領域最新的研發成果,其論文已被世界計算機視覺頂(ding)會CVPR 2024接收。數據(ju)顯示,SkySense在17項測(ce)試場景中指(zhi)標均超(chao)過國際(ji)同類產品,可用于地貌(mao)、農作物觀測(ce)和解譯(yi)等,有效輔助農業生產和經(jing)營。
17、魅族Aicy語音助手接入AI大模型
據IT之(zhi)家報道,魅族21系列手機今(jin)日(ri)獲推(tui)Flyme 10.5.0.1A穩定版系統,語(yu)音助手小溪(xi)(Aicy)接入大模型,支持自然語(yu)言對話(hua)、文檔總結、知(zhi)識問答、出(chu)行規劃、運動健(jian)康建議(yi)、文案生成等AI功能(neng)。
18、OPPO Reno11系列將引入生成式AI功能
昨(zuo)日(ri),OPPO在2024年世界(jie)移(yi)動通信大會(MWC 2024)宣布將全面發(fa)力AI領(ling)域。OPPO還宣布,今(jin)年第二季度,全球OPPO Reno11系列及OPPO Find N3也將引入包括AI消除功能在內的一系列生成式AI功能。
19、南京大學開設AI通識核心課程體系
昨日,南京大學(xue)宣布(bu)將(jiang)(jiang)面向全(quan)體(ti)本(ben)科(ke)新(xin)生開(kai)設(she)“人工智能通(tong)(tong)識(shi)(shi)(shi)核心課(ke)程體(ti)系(xi)”。南京大學(xue)將(jiang)(jiang)建設(she)“1+X+Y”三層次“人工智能通(tong)(tong)識(shi)(shi)(shi)核心課(ke)程體(ti)系(xi)”,以1門(men)(men)必修的AI通(tong)(tong)識(shi)(shi)(shi)核心課(ke)+X門(men)(men)AI素養課(ke)+Y門(men)(men)個(ge)學(xue)科(ke)與AI深度(du)融合的前沿拓展課(ke)為基礎(chu),從知識(shi)(shi)(shi)、能力、價值觀與倫(lun)理三個(ge)維(wei)度(du)開(kai)展教育教學(xue)。
20、傳Tumblr等計劃將數據出售給AI公司
據(ju)(ju)404 Media今(jin)日援引內部文件報(bao)道,社(she)交平臺Tumblr和(he)博(bo)客網(wang)站(zhan)WordPress.com的所有者正在與AI公司Midjourney和(he)OpenAI進行談判,以提供從用戶(hu)帖子(zi)中抓(zhua)取的訓練數(shu)據(ju)(ju)。
21、Prophesee與高通合作進入可量產階段
神經擬態視覺(jue)(jue)傳(chuan)感公司Prophesee 2月(yue)27日宣布與高通的(de)(de)(de)合作進入可量(liang)產階段(duan)。在巴塞羅(luo)那世界(jie)移動(dong)(dong)(dong)通信(xin)大會MWC 2024期(qi)間,Prophesee展示了其(qi)解(jie)決方(fang)(fang)案與驍龍旗艦移動(dong)(dong)(dong)平臺的(de)(de)(de)原生兼容性,以及神經擬態視覺(jue)(jue)技術為(wei)智能手機攝(she)像頭(tou)帶來的(de)(de)(de)速度(du)、能效和成(cheng)像質量(liang)方(fang)(fang)面(mian)的(de)(de)(de)提(ti)升(sheng)。Prophesee Metavision事件(jian)視覺(jue)(jue)傳(chuan)感器和AI算法(fa)針對驍龍平臺進行(xing)了優化,使運(yun)動(dong)(dong)(dong)模(mo)糊消除的(de)(de)(de)效果和整體圖像的(de)(de)(de)質量(liang)都得(de)到前所(suo)未(wei)有的(de)(de)(de)提(ti)升(sheng),尤其(qi)是在快速移動(dong)(dong)(dong)和低光等傳(chuan)統基于幀的(de)(de)(de)RGB傳(chuan)感器難(nan)以應對的(de)(de)(de)場景中(zhong)。
22、芯片大神Jim Keller創企與日企合作設計AI芯片
根據彭博社昨日報(bao)道,日本政(zheng)府投資的(de)半導體研發集團Rapidus將與加(jia)拿大芯(xin)片(pian)創企Tenstorrent合作(zuo)設(she)(she)計(ji)其(qi)首款AI芯(xin)片(pian)。Tenstorrent將授權其(qi)設(she)(she)計(ji)日本AI加(jia)速器的(de)一部分,并(bing)與Rapidus共同設(she)(she)計(ji)整個(ge)芯(xin)片(pian)。Tenstorrent成立于(yu)2016年(nian),首席執(zhi)行官為芯(xin)片(pian)界(jie)大神吉姆·凱勒(Jim Keller)。Rapidus成立于(yu)2022年(nian),計(ji)劃在2027年(nian)開始芯(xin)片(pian)生(sheng)產,與臺積電和三星(xing)電子等(deng)公司競爭。
23、法AI圖像創企獲4300萬美元融資
據TechCrunch昨(zuo)日(ri)報道,法國AI圖像編輯器創企Photoroom近(jin)期以5億美元(yuan)估值完成了4300萬美元(yuan)融(rong)資(zi),Balderton Capital領投(tou)(tou)此輪融(rong)資(zi),新投(tou)(tou)資(zi)者Aglaé和(he)之(zhi)前的投(tou)(tou)資(zi)者Y Combinator參投(tou)(tou)。Photoroom目前擁有(you)約(yue)50名員工,計(ji)劃(hua)利用這筆融(rong)資(zi)雇(gu)用更多員工,并投(tou)(tou)資(zi)于研發和(he)基礎設施。
24、字節推出MegaScale 將LLM訓練擴展到1萬個GPU
2月24日,來自字節和(he)北大的(de)團隊在(zai)arXiv上(shang)發表論文,提出大模型生產系統(tong)MegaScale。MegaScale將大型語言模型訓練擴展到超過(guo)10000個GPU,在(zai)12288個GPU上(shang)訓練175B LLM模型時(shi),MegaScale實現了(le)(le)55.2%的(de)模型FLOP利用(yong)率(MFU),與層內模型并行技(ji)術Megatron-LM相比,MFU提高了(le)(le)1.34倍(bei)。
論文地址:
//arxiv.org/abs/2402.15627