
智東西(公眾號:zhidxcom)
作者 |? 徐豫
編輯 |? 漠影
DeepSeek-R1橫空出世,打響了大模型比拼性價比的第一槍。
Meta、OpenAI等(deng)國外頭部大(da)模(mo)型廠商(shang)紛紛復刻或(huo)變相(xiang)降(jiang)價。比DeepSeek-R1晚兩周發布的OpenAI o3-mini模型,定價比前代模型o1-mini降低了超6成(cheng),比前代完整版的o1模型便宜超(chao)9成。
國內(nei)的大模(mo)型廠商也迅速做出(chu)反應(ying)。2月13日,百度宣布文心一言將于4月1日全(quan)面免費開放。文心(xin)一言此前(qian)采取基礎版(ban)(ban)免費、專業版(ban)(ban)收費的模式(shi),專業版(ban)(ban)定價(jia)59.9元/月,連續包(bao)月優(you)惠(hui)價(jia)49.9元/月。
這場看似僅僅是價格層面的競爭,實則背后蘊含著更為深層次的較量,其不僅是技術實力的比拼,也是對用戶市場的爭奪。
在這(zhe)場(chang)沒有硝(xiao)煙(yan)的商(shang)戰中,中國(guo)算力市(shi)場(chang)正經歷著深刻的變(bian)革。
最近發布的《2025年中(zhong)國人工智能計算力發展評估報告》(以下簡稱《報告》),把中國算力發展的四(si)大變化,從“幕后”搬到了“臺前”。
▲中(zhong)國AI應用場景(jing)發展(圖源:IDC 2025)
一、算力效率之變:大模型從“大力出奇跡”,轉向“四兩撥千斤”
第一大變化(hua)體現在算力效率方(fang)面,DeepSeek通(tong)過(guo)算法優(you)化(hua),大幅降(jiang)低大模型訓練、推理對高端GPU的依(yi)賴,突(tu)破了“算力軍備(bei)競賽”的傳統路徑?。
模算效率(lv)的顯(xian)著提升,正是(shi)DeepSeek能(neng)夠實現(xian)高(gao)性價比(bi)的核心因素(su)之(zhi)一。
DeepSeek的論文顯示,DeepSeek-R1訓練成本僅557萬美元,不足OpenAI同類產品的5%,卻能在數學競賽、代碼生成等任務中超越(yue)GPT-4模型(xing)。這意味(wei)著DeepSeek-R1以較低的算力成本投入,也能實現高性能產出(chu),即模算效率較高。
這(zhe)其中(zhong)的(de)(de)模算(suan)(suan)效率(lv)(lv)(Model Computation Efficiency)就是,AI模型的(de)(de)訓練和(he)推理過程中(zhong)用來(lai)衡量模型精度與計算(suan)(suan)資(zi)源利用效率(lv)(lv)的(de)(de)綜合指標,它(ta)反映了(le)模型在特定硬(ying)件(jian)平臺上,以最小的(de)(de)算(suan)(suan)力消耗實(shi)現(xian)最高精度的(de)(de)能力。
DeepSeek“四兩(liang)撥(bo)千斤(jin)”的(de)研發模式,更加注重算法創新、架構優化和資源的高效利用,這或許將帶動業界對于模算效率的追求。IDC中國副總裁周震剛(gang)接(jie)受采訪(fang)時稱,未(wei)來,大(da)模型廠商(shang)們的關注點將(jiang)從追求參數量(liang)規模,轉變為(wei)追求模型訓練、推理、部(bu)署等環(huan)節的性價(jia)比。
此外,DeepSeek使用MoE(混合專家模(mo)型(xing))架構(gou)實現了更高的成本效益,而Dense架構在相同參數量下擴展的計算成本較高。浪潮信(xin)息(xi)高級副(fu)總裁(cai)劉軍在接受采訪時回顧:“去年開始,大家發現基于Dense架構的模型,再往前去演化到要訓練一個超過五千億、一萬億參(can)數量的模型時,所需的算力、時間、數據量,都是當前技術條件下實現不了的。有企業做過一個評估,在這種情況下,需要20萬張卡訓(xun)練(lian)一(yi)年,才能把一個(ge)萬億的Dense模型高質量訓(xun)練出來(lai)。”
因此(ci),MoE展現出來的在計算成(cheng)本、模型性能等方面的優勢,或將引發業界對于該架構的一波(bo)模仿(fang)借鑒。
當下,企業接入DeepSeek模型主要有兩種策略。一方面,國內大模型廠(chang)(chang)商(shang)、芯片廠(chang)(chang)商(shang)、AI硬件廠(chang)(chang)商(shang)、運營商(shang)、AI應(ying)用開發商(shang)等相繼接入DeepSeek模型671B滿血版(ban);另一方面,有的企業會根據自身業務需求選擇接入DeepSeek參數量較小的模型,或者選擇蒸餾DeepSeek模型將其與自家模型相結(jie)合,從而提高模型性能、降低應用成本。
這種多形態、多參數的模型協同發展,才是大模型生態應有的狀態。在浪潮信息高級副總裁劉軍看來,把DeepSeek-R1模型的能力蒸餾到一些小模型上,實際會促(cu)進AI技術(shu)的擴散。
二、算力結構之變:智能算力市場井噴,推理算力成“香餑餑”
將目光放到整個(ge)算力(li)(li)市場,我們可(ke)以發現第(di)二大變化(hua),國內(nei)智(zhi)能算力(li)(li)規模正極速擴(kuo)張,需求結(jie)構也正被重塑。
《報告》顯示,2024年中國(guo)智能(neng)算力規(gui)模達(da)725.3EFLOPS,同(tong)比增長74.1%,是近5年來的總量最高(gao)峰。這也是近年來中國智能算力規模擴張速(su)度最快的一次。
相比于國內通用算力,智能算力的增幅已經達到同期通用算力增幅的3倍以上。2024年中國通用算力規模為71.5EFLOPS,同比增(zeng)長(chang)20.6%。
▲2020年至2028年,中國智能(neng)算(suan)力和通(tong)用算(suan)力規模及預測(圖源:IDC 2025)
這意味著,過去一年內,AI芯片、AI服務器、AI訓練、AI推理和AI應用的市場規模也在快速膨脹。例如,2024年中國AI加速計算服務器市場規模為190億美元(yuan),同比大幅增長86.9%。
盡管此前業界對大模型的Scaling law(規模法則)是否失效有所爭議,但在當下的AI發展進程中,其仍占主(zhu)導地位。這也是推動AI算力需求持(chi)續增長的主要原因之一。
《報告》中提到,基于杰文斯悖論的現象反映出,DeepSeek實現的算法效率提升,并未抑制算力需求,反而帶(dai)動(dong)了更多的用戶和場景,進一步推動了大模型的普及與應用落地。這也有助于AI行(xing)業重(zhong)構產業創新范式,并加強數據中心(xin)、邊緣及端(duan)側算(suan)力建設(she)。
▲目前及未來三年(nian)應(ying)用(yong)AI對企業帶來的價值(zhi)(圖源:IDC 2025)
不過,單單堆疊訓練算力的策略并不能一勞永逸。越來越多大模型廠商轉向加速開發大模型的多模態能力,并尋找落地場景。多模態模型的應用、AI Agent熱潮隨之出現,并且知識(shi)管(guan)理、對話(hua)式應用、內容(rong)生(sheng)成(cheng)、營(ying)銷(xiao)、視頻(pin)生(sheng)成(cheng)等都成(cheng)為了(le)生成(cheng)式AI技術的熱(re)門(men)落地場(chang)景。
在應(ying)用落地側,這會大幅激發AI推理需求。
如聊天機器人、音視頻圖像等的生成、辦公場景的AI助手等,在實際的應用場景中都較為依賴AI推理能力。因此,《報告》中預測,后(hou)續用(yong)于推理的(de)算力規模,將會超過用(yong)于訓(xun)練的(de)算力規模。
在全球AI服務器市場中,未來生(sheng)成式AI服務器的占比,將從2025年的29.6%,提升至2028年的37.7%。
▲2023年至(zhi)2028年,全球生成式AI和非生成式AI服務器(qi)市場(chang)規模預測(圖源:IDC 2025)
在真實的業務場景中實現“降本增效”是AI技術發展的重要一環。未來,隨著大模型相關技術逐漸成熟,以及生成式AI應用不斷拓展,推理場景的需求日益增加,推理服(fu)務器的占比將大幅提高。IDC的數據顯示,預計到2028年,推理工作負載占比將會達到73%。
▲2024年至(zhi)2028年,中國AI服(fu)務器(qi)工作負載(zai)預(yu)測(ce)(圖(tu)源:IDC 2025)
這一發展趨勢也在浪潮信息的業務中得到了印證。據浪潮信息高級副總裁劉軍透露,近期公司接到的大部分都是推理算力的訂單,現階段推理算力的投資回(hui)報率高,帶來的用戶體(ti)驗也更好,所以推(tui)理算力的(de)規模會大幅提(ti)升。
三、算力供應方式之變:算力供應方式多元化,企業AI選擇更多了
第三大變(bian)化(hua)來自算(suan)力供應的方式。蛋(dan)糕做大了,下場(chang)分蛋(dan)糕的人(ren)也多了。
去年有一大很明顯的市場趨勢是,一方面,AI算(suan)力基礎(chu)設施的供給結構趨于多元化,另(ling)一方面(mian),用戶(hu)對智能(neng)算(suan)力基(ji)礎設(she)施(shi)和服務能(neng)力的需求,也在發生深刻變化。
在供(gong)給端(duan),其形成了(le)數據中心服務商(shang)、云(yun)服務商(shang)、硬件廠商(shang)和相(xiang)關AI創企(qi)多點提(ti)供(gong)AI算力資(zi)源的格局。
在需求端的變化則集中于兩(liang)點(dian):
首先,生成式AI將進一步推動企業,使用AI就緒的數據中心托管設施、生成式AI服務器集群等智算服務,這可以幫助企業縮短部(bu)署(shu)時(shi)間,降低資本成本。
IDC數據顯示,2024年中國智算服務市場整體規模達到50億美元;其預計2025年中國智算服務市場整體規模將達到79.5億美元(yuan),2028年達到266.9億美元,2023年至2028年的年復合增長率將達到57.3%。
▲2023年(nian)至2028年(nian),中國智算(suan)服務細分市場規模預測(圖源(yuan):IDC 2025)
其次,用于推理的(de)一(yi)體機也開始(shi)受到市場追捧。
IDC中國(guo)副總裁周震剛解釋(shi)說,早(zao)前企(qi)業基于云服(fu)務部(bu)署AI的(de)案(an)例比較多,而用一體(ti)機的(de)比較少。但是DeepSeek模型(xing)爆火(huo)后,企(qi)業對于一體(ti)機的(de)需求隨之(zhi)大(da)幅上(shang)升(sheng),開(kai)始注重私有化部(bu)署。
因此,后續一段時間內,“開源+一(yi)體機(ji)”可(ke)能會成(cheng)為企業AI服(fu)務的爆款模式。
據不完全統計,目前市面上至少已有60家DeepSeek一體機企業,其中既有京東云、移動云、聯通云等云服務提供商,也有聯想、華為等大廠。基于一體機,企業便可以通過“開箱即(ji)用”的(de)方式,快速接(jie)入更強大的(de)AI能力。
浪潮信息上周推出的元腦R1推理服務器,就是其中一員。浪潮信息方面稱,該產品通過系統創新和軟硬協同優化,單機即可部署運行DeepSeek-R1滿血(xue)版671B的模型。
據浪潮信息高級副總裁劉軍透露,“最近兩個禮拜,來找我們咨詢購買能帶動滿血版DeepSeek-R1模型的AI服務器的客(ke)戶數,正直線上升。”
四、城市AI排名之變:京杭滬拿下AI算力全國前三
第四大變(bian)化是城(cheng)市(shi)AI算力排名。
《報告》的數據顯示,目前國內各城市正通過加大AI投資、吸納人才(cai)以及提供政(zheng)策(ce)支持(chi)等舉措(cuo),持(chi)續為(wei)AI發展提升競(jing)爭優勢。
可以看到,在(zai)中國各城市的(de)AI算力排行榜中,北京和杭(hang)州依然穩(wen)居排行榜前兩位,上海的(de)排名則從2023年的(de)第四位上升至第三位。
這3座城市的AI策略各有所側重。其中,北京聚集了一大批大模型企業,憑借大量人才、成熟的企業和有力的政策扶持,持續位居首位。杭州早在2021年就提出要成為具有全球影響力的AI頭雁城市,并頒布了諸多政策支持AI發展;上(shang)海的優(you)勢在(zai)于,其正(zheng)加(jia)速推動(dong)AI世界級產業集群建設等工(gong)作,并表現出色。
此外(wai),廣州、成都、天津、廈門等城市的AI算力全國排名均(jun)有所提(ti)升。
▲中國各城市AI計算(suan)力發展評估TOP 10(圖源:IDC 2025)
AI影響下,不同(tong)行業的(de)AI應用滲(shen)透(tou)度排名(ming)也發生了變(bian)化。
排名第一的是互聯網行業,其AI相關應用的滲透率更高。在該行業中,AI原(yuan)生應用已覆蓋(gai)問答、寫作、客服、路線(xian)規劃、生(sheng)活指導、學(xue)習助手、角色扮演(yan)、視頻生(sheng)產、圖片(pian)企業智能(neng)客服、智能(neng)銷(xiao)售分析等多(duo)個(ge)場(chang)景。
金融(rong)行業(ye)從(cong)2023年的(de)第(di)四名(ming)(ming)(ming),上升至2024年的(de)第(di)二名(ming)(ming)(ming)。制造行業(ye)2024年的(de)排名(ming)(ming)(ming)相較于(yu)2023年前(qian)進了一(yi)位。這(zhe)是由于金(jin)融行業積累了海(hai)量的(de)數據(ju),可以用(yong)于AI訓(xun)練(lian),為其(qi)進行風(feng)險評估等提供決策依據(ju);在制造業方面(mian),由AI驅動的(de)機器人和自(zi)動化設備可以完(wan)成重復性高、勞動強度大的(de)工作(zuo)任(ren)務。
▲中(zhong)國AI行業(ye)應用滲透度(圖源:IDC 2025)
結語:未來算力發展既要“擴容”,也要“提效”
從(cong)這四大變化可以看出(chu),國(guo)內(nei)算(suan)(suan)(suan)力產業的(de)發展(zhan)正呈現(xian)出(chu)蓬勃向上的(de)態勢。與此同時,更為(wei)迫切的(de)算(suan)(suan)(suan)力發展(zhan)挑戰(zhan)也被(bei)擺到(dao)了(le)算(suan)(suan)(suan)力提供商面前。未來,如何(he)持續優化計算(suan)(suan)(suan)架構,如何(he)進一步提升(sheng)智算(suan)(suan)(suan)中(zhong)心(xin)的(de)算(suan)(suan)(suan)力資源利用率,如何(he)完善數據中(zhong)心(xin)的(de)監控系統(tong)和(he)故障恢復機制,都亟需新的(de)解決(jue)方案。
針對此,《報告》也提出了解決辦法,那就是算力提供商可以根據自身情況,采用算力(li)“擴容”和(he)“提效”并行(xing)策略來部署AI算力。
其中,擴容(rong)包(bao)括增加智算中心的數(shu)量(liang)和種類(lei),注重智算中心建設的區域分布和技術(shu)先進性(xing),以加強算力供給能(neng)力。
提效包(bao)括(kuo)以(yi)用(yong)(yong)定建(jian),以(yi)應(ying)用(yong)(yong)為(wei)導向規(gui)劃(hua)AI基礎設施(shi)(shi);提(ti)(ti)高模型(xing)架(jia)構效率;優(you)化算(suan)力基礎設施(shi)(shi)架(jia)構,包(bao)括(kuo)計算(suan)架(jia)構、內存層(ceng)次架(jia)構、智能調度算(suan)法(fa)等;使用(yong)(yong)高質量(liang)的(de)數(shu)(shu)據(ju)(ju)集,并(bing)搭建(jian)統(tong)一的(de)數(shu)(shu)據(ju)(ju)存儲和訪問接口(kou),以(yi)提(ti)(ti)高算(suan)力利用(yong)(yong)率。
未來,大模型產業(ye)的底層技術創(chuang)新加速、場景(jing)應用逐漸(jian)鋪(pu)開,都(dou)將(jiang)為(wei)國(guo)內算力市(shi)場注入新活力。