智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 云鵬

智東西2月14日報道,剛剛,DeepSeek在開源社區Hugging Face上的點贊數躍居第一,獲約(yue)8730次點贊,這一數字仍在持(chi)續上漲。

DeepSeek又得了個第一

這(zhe)是(shi)繼(ji)DeepSeek應用力壓ChatGPT登頂美區(qu)(qu)App Store免費(fei)榜(bang)、模(mo)型在開源社區(qu)(qu)GitHub上(shang)Star數首次(ci)超越(yue)OpenAI之后,創下的又一個歷史時刻,DeepSeek在海外平臺(tai)再次(ci)登頂。

Hugging Face點(dian)(dian)贊(zan)榜單前十名的(de)模型(xing)中,都(dou)曾在(zai)不同節點(dian)(dian)引爆整個(ge)大(da)模型(xing)產(chan)業。

排名第二的是曾以AI生圖“新王”名號橫空出世的FLUX.1,由(you)StableDiffusion原(yuan)班人馬成立的新工作(zuo)室黑森林工作(zuo)室打造,點(dian)贊數約8710次。

排名第六的是全球1000名科學家組成BigScience打造的參數高達1760億個的超大NLP模型BLOOM,第八的是歐洲AI獨角獸Mistral AI基于MoE架構的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包攬。

OpenAI的語音轉錄模型(xing)Whisper-large-v3被擠出前十名(ming)之列,排名(ming)第11,點贊數約3810次。

此外,DeepSeek-V3的排名在第19名,點贊約3810次,超越了微軟的Phi-2谷歌(ge)Gemma-7B模型。

Hugging Face點贊數排行榜前30的還有DeepSeek另一款開源的多模態模型Janus-Pro-7B,該(gai)模型在使用文本提示的(de)圖像(xiang)生成排行榜中優于(yu)OpenAI的(de) DALL-E 3和Stability AI的(de)Stable Diffusion。

DeepSeek又得了個第一

▲開(kai)源社區Hugging Face點贊榜(圖源:Hugging Face)

DeepSeek V3、DeepSeek R1、Janus-Pro-7B分別于(yu)2024年12月(yue)(yue)(yue)26日(ri)和今年1月(yue)(yue)(yue)20日(ri)、1月(yue)(yue)(yue)28日(ri)發布。

DeepSeek V3為DeepSeek自(zi)研MoE模型,參(can)數(shu)量達(da)到671B,激活參(can)數(shu)量37B,在(zai)14.8T token上(shang)進行了(le)預訓練(lian),該(gai)模型在(zai)多項(xiang)評測成績超越了(le)Qwen2.5-72B和Llama-3.1-405B等(deng)開源(yuan)模型,并在(zai)性能上(shang)和閉源(yuan)模型GPT-4o以及(ji)Claude-3.5-Sonnet比肩。

DeepSeek R1在數(shu)學、代碼、自然(ran)語言推理等(deng)任務上,性能比肩OpenAI o1正式版(ban),在開源DeepSeek-R1-Zero和(he)(he)DeepSeek-R1兩個660B模型(xing)(xing)的同(tong)時,蒸餾了(le)6個小模型(xing)(xing),其中32B和(he)(he)70B模型(xing)(xing)在多項能力上實現(xian)了(le)對標(biao)OpenAI o1-mini的效果。

多模態模型Janus-Pro是去(qu)年發布的(de)Janus的(de)高級版本,可顯著(zhu)提高多模態理解和視覺生(sheng)成。

當下,全(quan)球(qiu)已經(jing)掀(xian)起(qi)了從芯片企(qi)業、云計(ji)算巨頭到(dao)各路基(ji)礎設(she)施公司適(shi)配、接入DeepSeek的(de)熱(re)潮,DeepSeek所展現出的(de)卓越性能與廣泛的(de)應用潛力正(zheng)在逐漸(jian)放大。