
1、阿里云通義千問140億參數Qwen-14B發布
2、百川(chuan)智(zhi)能(neng)發布Baichuan2-53B閉源大模型
3、Meta或于(yu)本周發布系列AI聊天機器人
4、開源可商(shang)用(yong)的中文版Llama 2發布
5、特斯(si)拉(la)機器人啟用端到端神(shen)經網絡
6、6.7k Star量的vLLM出(chu)論文(wen) 助大模型低成(cheng)本(ben)部署
7、亞馬遜與(yu)Anthropic達(da)成合作 至多(duo)投資40億美(mei)元(yuan)
8、恒生電子大(da)模型(xing)LightGPT開啟內測
9、AI原生人(ren)(ren)力(li)資(zi)源服(fu)務商TTC獲千萬人(ren)(ren)民幣(bi)融資(zi)
10、Canalys:2027年兼容(rong)AI功能(neng)的個人電腦占60%
1、阿里云通義千問140億參數Qwen-14B發布
今天,阿里云(yun)舉辦(ban)通(tong)義(yi)千問開(kai)源(yuan)發布(bu)會,正式發布(bu)通(tong)義(yi)千問140億參數模(mo)(mo)型Qwen-14B及對話模(mo)(mo)型Qwen-14B-Chat,開(kai)源(yuan)、免(mian)費。據介紹,Qwen-14B在眾(zhong)多(duo)同尺(chi)寸20B以(yi)內開(kai)源(yuan)模(mo)(mo)型中(zhong)突出重(zhong)圍,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等(deng)(deng)12個權威測評集上都取得了(le)最優成績,超越所(suo)有測評中(zhong)的(de)(de)SOTA大(da)模(mo)(mo)型。此外,通(tong)義(yi)千問團隊還升級(ji)了(le)Qwen模(mo)(mo)型對接外部系統的(de)(de)能力,開(kai)發者可以(yi)通(tong)過簡(jian)單的(de)(de)操作(zuo)實現(xian)復(fu)雜的(de)(de)插件調用,也可以(yi)基(ji)于(yu)Qwen系列基(ji)座(zuo)模(mo)(mo)型快速開(kai)發Agent等(deng)(deng)AI系統,利用Qwen的(de)(de)理解和規劃(hua)能力完成復(fu)雜的(de)(de)任務。同時,Qwen-7B也實現(xian)了(le)全面升級(ji),核心(xin)指標最高提升22.5%。
2、百川智能發布Baichuan2-53B閉源大模型
今天,百川智能(neng)發布(bu)(bu)Baichuan2-53B閉源大(da)模型(xing),全面升級了(le)Baichuan1-53B的(de)各(ge)項能(neng)力。據介(jie)紹,Baichuan2-53B的(de)數學(xue)和(he)邏輯推(tui)理(li)能(neng)力顯著提升,并通過高(gao)質量數據體(ti)系(xi)和(he)搜(sou)索(suo)增強(qiang)大(da)幅降(jiang)低了(le)模型(xing)幻覺(jue),是目前國內幻覺(jue)問(wen)題最低的(de)大(da)模型(xing)。百川智能(neng)此次還開放了(le)Baichuan2-53B API接(jie)口,宣布(bu)(bu)正式進(jin)軍To B領域。
API接口文檔地址:
//platform.baichuan-ai.com
3、Meta或于本周發布系列AI聊天機器人
據《華(hua)爾街日報》報道,知情人(ren)(ren)(ren)士透(tou)露(lu),Meta計(ji)劃最(zui)快于本周在其社交媒體應用(yong)上發布一(yi)系(xi)列AI聊(liao)天(tian)機(ji)(ji)器人(ren)(ren)(ren),以(yi)(yi)吸引年輕(qing)用(yong)戶。據稱,這(zhe)些聊(liao)天(tian)機(ji)(ji)器人(ren)(ren)(ren)在公司內部被稱為“Gen AI Personas”,正(zheng)在由員工進行內測,預計(ji)將(jiang)在當地時間本周三開始的(de)(de)(de)Meta Connect大會上推出(chu)。據《華(hua)爾街日報》看到的(de)(de)(de)內部文(wen)件顯示,正(zheng)在開發的(de)(de)(de)聊(liao)天(tian)機(ji)(ji)器人(ren)(ren)(ren)中有一(yi)款被稱為“機(ji)(ji)器人(ren)(ren)(ren)Bob”,自稱是(shi)一(yi)位“高智商、敏銳(rui)的(de)(de)(de)智慧和尖銳(rui)的(de)(de)(de)諷刺(ci)”的(de)(de)(de)將(jiang)軍;一(yi)個名為“Alvin the Alien”的(de)(de)(de)聊(liao)天(tian)機(ji)(ji)器人(ren)(ren)(ren)會詢問用(yong)戶的(de)(de)(de)生活(huo);一(yi)個名為“Gavin”的(de)(de)(de)聊(liao)天(tian)機(ji)(ji)器人(ren)(ren)(ren)發表了攻擊性言論(lun),以(yi)(yi)及批評(ping)扎克伯格和Meta但贊揚TikTok和Snapchat的(de)(de)(de)評(ping)論(lun)。
4、開源可商用的中文版Llama 2發布
據(ju)量子(zi)位報道,現(xian)在(zai),15小時、幾(ji)千(qian)塊錢、85億Tokens數據(ju),即(ji)可訓練出中文版Llama 2。Colossal-LLaMA-2近期(qi)把大模(mo)(mo)(mo)型(xing)(xing)(xing)門檻打下來(lai)了,同(tong)時開源團隊(dui)還提供了一(yi)個完(wan)整的評估體系框(kuang)架(jia)ColossalEval,以實現(xian)低(di)成(cheng)本(ben)的可復現(xian)性(xing)。這一(yi)模(mo)(mo)(mo)型(xing)(xing)(xing)綜(zong)合性(xing)能(neng)達到開源社區同(tong)規模(mo)(mo)(mo)從頭(tou)預訓練SOTA模(mo)(mo)(mo)型(xing)(xing)(xing)水平。方案完(wan)全開源,包括全套訓練流程、代碼及權重;而且無商業(ye)限制,還可遷移應用到任意垂類(lei)領域和從頭(tou)預訓練大模(mo)(mo)(mo)型(xing)(xing)(xing)的低(di)成(cheng)本(ben)構建(jian)。
GitHub地址:
//github.com/hpcaitech/ColossalAI
5、特斯拉機器人啟用端到端神經網絡
據量子位報道,當地時間9月24日,特(te)斯拉人形機(ji)(ji)器(qi)人「擎天柱(zhu)」最新視(shi)頻(pin)公開,啟用了自動駕(jia)駛系統同款的(de)端到端神經網絡架構,無需任何規則代碼就學(xue)(xue)會(hui)分揀(jian)物(wu)品(pin)。對此網友表(biao)示(shi)很(hen)難相信視(shi)頻(pin)是(shi)真的(de),馬斯克(ke)回復稱(cheng):“執行器(qi)、傳感器(qi)和整體機(ji)(ji)械(xie)結構更多(duo)升(sheng)級還在(zai)后面(mian)。”伴隨(sui)視(shi)頻(pin)發布的(de)是(shi)機(ji)(ji)器(qi)人團(tuan)隊招聘公告(gao),特(te)斯拉機(ji)(ji)器(qi)人團(tuan)隊招聘各類硬件工程(cheng)師及機(ji)(ji)器(qi)學(xue)(xue)習工程(cheng)師、實習生,總(zong)計(ji)51個(ge)職位。
6、6.7k Star量的vLLM出論文 助大模型低成本部署
據機(ji)器之心(xin)報道,今年(nian)六月,來(lai)自(zi)加(jia)州大學伯克利分校等機(ji)構的(de)(de)一個(ge)(ge)研(yan)(yan)究團隊(dui)開源了(le)vLLM,其(qi)使用(yong)了(le)一種新設(she)計的(de)(de)注意力(li)算法(fa)PagedAttention,可(ke)讓(rang)服(fu)務提供商輕松、快速(su)且低(di)成本地發(fa)布(bu)LLM服(fu)務,該團隊(dui)宣(xuan)稱vLLM能實(shi)現比(bi)HuggingFace Transformers高24倍的(de)(de)吞(tun)吐量。現在離vLLM最初宣(xuan)布(bu)時差不多已過去(qu)三個(ge)(ge)月,他(ta)們終于(yu)發(fa)布(bu)了(le)這篇關于(yu)vLLM和PagedAttention的(de)(de)研(yan)(yan)究論文(wen),其(qi)中(zhong)詳細解釋了(le)他(ta)們如何通過類似操作系統(tong)虛擬(ni)內存管(guan)理的(de)(de)機(ji)制來(lai)實(shi)現高效(xiao)的(de)(de)LLM服(fu)務。該論文(wen)已被將于(yu)十月底(di)在德國舉(ju)辦的(de)(de)ACM操作系統(tong)原理研(yan)(yan)討會(SOSP 2023)接收。
論文地址:
//arxiv.org/abs/2309.06180
代碼地址:
//github.com/vllm-project/vllm
文檔地址:
//vllm.readthedocs.io/
7、亞馬遜與Anthropic達成合作 至多投資40億美元
據(ju)界面報道,亞(ya)馬遜(xun)與人工智(zhi)能公(gong)司Anthropic今日宣(xuan)布達成(cheng)戰略合(he)作,共同推進生成(cheng)式AI發展。Anthropic選擇亞(ya)馬遜(xun)云(yun)科技(AWS)作為(wei)其主要云(yun)提供商,并將利(li)用AWS的(de)高性能、低成(cheng)本機器(qi)學習(xi)加(jia)速器(qi),在(zai)AWS Trainium和(he)Inferentia芯片(pian)上訓練(lian)和(he)部署(shu)其未來基(ji)礎模型(xing)。亞(ya)馬遜(xun)將向(xiang)Anthropic投資至多40億美(mei)元,并擁有該公(gong)司的(de)少數股權。
8、恒生電子大模型LightGPT開啟內測
今日,恒生(sheng)大(da)(da)模(mo)型產品(pin)已面向20家金融機(ji)構(gou)開啟(qi)內測。據悉,恒生(sheng)金融行業大(da)(da)模(mo)型LightGPT是(shi)專為金融領域打造的大(da)(da)語言模(mo)型,它通(tong)過訓練海量金融數據,對金融相關問(wen)題有更好的理解(jie)能力。光子是(shi)基于(yu)LightGPT的智能應用(yong)服務(wu),可以為金融機(ji)構(gou)的各個業務(wu)系(xi)統注入AI能力,包(bao)括投(tou)資合(he)規(gui)、投(tou)顧、客服、運營、投(tou)研和交易等(deng)。
體驗地址:
www.hs.net/lightgpt
9、AI原生人力資源服務商TTC獲千萬人民幣融資
《科(ke)創(chuang)板日報》25日訊,近日,AI原生(sheng)國際性(xing)人力資(zi)源服務提供商TTC完成數千萬(wan)元人民(min)幣Pre-A輪(lun)融資(zi),本輪(lun)融資(zi)領投方為創(chuang)新工場。
10、Canalys:2027年兼容AI功能的個人電腦占60%
據知名行研(yan)機構Canalys預測(ce),兼容AI個人(ren)電腦(nao)將呈穩定的(de)上(shang)升趨勢。截至2023年第(di)二季度(du)(du),在蘋果的(de)神經引擎的(de)大力推動(dong)下,兼容AI個人(ren)電腦(nao)市場實(shi)現(xian)了超(chao)過500萬臺的(de)出貨量(liang)(liang)。隨著x86架構提升它們的(de)AI能(neng)力,預測(ce)從(cong)2024上(shang)半(ban)年開始將出現(xian)新一輪的(de)AI賦能(neng)模型浪(lang)潮(chao)。到2024年第(di)四(si)季度(du)(du),出貨量(liang)(liang)預計上(shang)升至約2000萬臺的(de)水(shui)平(ping),在全球個人(ren)電腦(nao)出貨量(liang)(liang)的(de)占比(bi)超(chao)過25%。
鑒于(yu)在(zai)(zai)2024年(nian)末推出(chu)的最新(xin)Windows操作系(xi)統將(jiang)預(yu)期發(fa)布經AI提(ti)升的功能(neng),以及AI工具(ju)在(zai)(zai)商(shang)業和生(sheng)產力軟件(jian)的廣泛應用,兼(jian)容(rong)AI個人電腦市場將(jiang)在(zai)(zai)2025年(nian)和2026年(nian)有望實現爆發(fa)式(shi)增(zeng)長。到(dao)2027年(nian),出(chu)貨量預(yu)計超過1.75億臺,在(zai)(zai)總個人電腦出(chu)貨量的占比超逾60%。從現在(zai)(zai)起(qi)到(dao)那(nei)時,該板塊的復合年(nian)均增(zeng)長率將(jiang)達94%。