智東西AI前瞻(公眾號:zhidxcomAI)
作者 | 江宇
編輯 | 漠影

智東西AI前(qian)瞻(zhan)7月28日報(bao)道,今日,在(zai)2025世界人(ren)工智能大(da)會(WAIC)期間,啟明創投主管合(he)伙人(ren)周志峰發表主題演(yan)講(jiang)《技術向(xiang)上(shang)生(sheng)長,應(ying)用向(xiang)下扎根(gen)——AI共振(zhen)周期暨2025 AI十大(da)展望(wang)發布(bu)》,發布(bu)了“AI十大(da)展望(wang)”。

該報告覆蓋了從基礎模型、多模態智能體、AI基礎設施到新型交互與機器人應用等(deng)多個方向(xiang),系統(tong)梳理了(le)未來12至24個月(yue)內值得關(guan)注的關(guan)鍵技術與落地趨勢(shi),構成了(le)一份面向(xiang)下一個AI周期的重要趨勢(shi)圖譜。

在這份年度報告中,啟明創投將未來一到兩年的發展趨勢概括為“能力突破”與“應用深化”兩個方面。

啟(qi)明創(chuang)投判斷,未來12到24個月,大模(mo)型領域(yu)或將(jiang)迎來一(yi)次決定性(xing)躍(yue)遷:基(ji)礎模(mo)型上下文窗口或拓展至200萬Token,通用(yong)視頻模(mo)型有望實現生(sheng)成、推理、理解一(yi)體化,徹(che)底(di)改變內容創(chuang)作與人機交互方式(shi)。

如果這些能力得以兌現,其直接產物將是“數字員工”的真正誕生——Agent不再只是工具,而將深入企業內部流程去交付結果;多模態智能體也將(jiang)在高復(fu)雜場(chang)景中完成推理與執行。

同時,國產AI芯片將迎來“國設”+“國造”的大規模交付,AI原生硬件或將在部分場景從手機上轉移出用戶的部分需求,具身智能產(chan)品如通(tong)用機(ji)器人(ren)也有(you)望率先在制造(zao)業(ye)和物流業(ye)的(de)揀選、搬運和組裝等場景實現商(shang)業(ye)部署。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

以下是周志峰演講實錄(智東西(xi)在不影響原意的前提下進行了處(chu)理):

一、AI投資熱度不減,技術與應用進入“共振”周期

一(yi)年(nian)一(yi)度,一(yi)期一(yi)會(hui)。首先特別開心,又能(neng)在WAIC啟明創(chuang)投的(de)(de)創(chuang)業與(yu)投資論(lun)壇上(shang),跟(gen)各位(wei)新老朋友,無論(lun)是(shi)線(xian)下參加還是(shi)線(xian)上(shang)看直播的(de)(de),再次聚(ju)在一(yi)起。熟悉我們(men)論(lun)壇的(de)(de)人都知道,每年(nian)都是(shi)我來開始這個“序(xu)曲”,引出后續的(de)(de)演(yan)講與(yu)討(tao)論(lun)。

今年(nian)我(wo)的(de)題目叫“技術向上生(sheng)長(chang),應用向下(xia)扎根”。為什么起(qi)這個(ge)名字?我(wo)記(ji)得2023年(nian)我(wo)們第一(yi)次論壇的(de)時候,我(wo)跟大家分享過我(wo)的(de)感受:做AI投資人最(zui)大的(de)感受就是(shi)“累”。

當時美國大模(mo)型公司(si)密集(ji)發布新(xin)模(mo)型,我經常凌晨三(san)四(si)點起(qi)床,為了搶那些公司(si)發布會之后(hou)有限的邀請碼,趕緊去試試最(zui)新(xin)的大模(mo)型技術。

去年我說,AI越來越熱鬧,但在任何一個“大浪潮”熱鬧的時候,噪音特別多。作(zuo)為一(yi)個投(tou)資(zi)人,如何“讓自己安靜下來”?你真正能夠有自己的獨(du)立(li)判斷、有自己的思考(kao)去進行布局,是一(yi)件特別(bie)不(bu)容易的事。

而今年,我覺得AI產業又到了一個新的階段:一方面,技術還在往上快速增長,沒有明顯的天花板;另一方(fang)(fang)面,技術在(zai)性能(neng)、成本方(fang)(fang)面變得“可用”,我們也看到“大規模的應用已經(jing)開始落地(di)”,就像(xiang)“樹根(gen)一樣(yang)”深深扎(zha)根(gen)、扎(zha)實(shi)生(sheng)長,在(zai)創(chuang)造巨大的價(jia)值。

所以(yi)今年AI處在一個(ge)很特別(bie)的(de)“周期(qi)”——“AI技術與應(ying)用的(de)共(gong)振周期(qi)”。啟(qi)明創投在整個(ge)AI產業(ye)(ye)鏈上有很多布局,我們投了很多中國AI領(ling)域的(de)企業(ye)(ye)。

但我(wo)們的(de)信息和觀點,并不是“閉門(men)造(zao)車”自己想出來的(de),而(er)是整合(he)了(le)來自產業(ye)界“一手信息”的(de)成果,這也是我(wo)今天十分(fen)(fen)鐘分(fen)(fen)享(xiang)的(de)基礎。從投(tou)資人角度(du)講,我(wo)依然愿意“累”,因為這是最熱門(men)的(de)賽(sai)道(dao)。

大家可以看看,2025年AI占了全球50%以上的投資份額。一個領(ling)域占全球一半的(de)投資,這說明:即(ji)使AI大(da)模型已經成長了兩(liang)三(san)年(nian),大(da)家仍然認為“它(ta)的(de)潛力依然巨大(da)”。越(yue)來(lai)越(yue)多投資人(ren),用“真金白銀去投票(piao)”,持續投入(ru)到(dao)AI中。

這半年甚至一年,很多人在問:“是不是預訓練這條路快走到頭了,大模型的天花板差不多了?Scaling Law是不是不靈了?”但從資本的“投票”來看,不是這樣的。2024年,模型公司拿到了330億美元,占全年全球風險投資的近20%。

二、大模型關鍵能力躍遷,推理與多模態成技術主線

這也說明,大模型依然在高速發展。過去12個月,大模型有了很多新突破,比如MOE架構、合成數據、更長的上下文窗口等等。如果讓我總結一兩個最關鍵的技術進展,第一個一定是推理能力

以前(qian)的(de)大模(mo)型是靠(kao)幾萬億個token做預訓(xun)練,壓縮信息。當你(ni)提問(wen)時,它(ta)只是把“信息轉移”給我們人(ren)類用戶(hu)。而現(xian)在,有了推理能力之后,它(ta)能做更深(shen)入的(de)邏輯思(si)維,“向前(qian)推理,向后反思(si)”,具備了非常復雜的(de)一些能力。效果非常明顯。

去年(nian)這個時(shi)候,我們在講GPT-4o,當時(shi),它(ta)是最(zui)強的(de)(de)(de)模型。但如(ru)果用人類(lei)智(zhi)(zhi)商(shang)(shang)測(ce)試標準,它(ta)的(de)(de)(de)成績不(bu)到70分。還記(ji)得《阿甘正(zheng)傳》里的(de)(de)(de)主角Forest Gump嗎(ma)?他(ta)的(de)(de)(de)智(zhi)(zhi)商(shang)(shang)是75,是一位“輕度的(de)(de)(de)智(zhi)(zhi)障者”。所以當時(shi)的(de)(de)(de)大模型,也只(zhi)是“人類(lei)的(de)(de)(de)輕度智(zhi)(zhi)障者”水平,只(zhi)能做一些(xie)簡單的(de)(de)(de)應用,做不(bu)了復雜任(ren)務。

但現在,最新的推理模型,比如上周五發布的“階躍星辰Step-3”模型,智商已達到120左右。這意味著什么?全球80億人,有87%的人的智商在90-120分之間。也就是說,大模型已經超越了80%以上人類的智商水平。這(zhe)是非常重大的進展。

另一(yi)個關鍵是(shi)“多(duo)模(mo)態”。過去,我們說“大語(yu)(yu)言(yan)模(mo)型”,但語(yu)(yu)言(yan)只(zhi)是(shi)人感知(zhi)和(he)交互的一(yi)個維度。如果能融(rong)入語(yu)(yu)音、圖像、視頻,甚至未來的物聯網多(duo)維信息,那模(mo)型對世界的感知(zhi)與交互就會變得更加(jia)豐(feng)富(fu)多(duo)彩。

除了語言主(zhu)導的模型(xing)(xing)外(wai),圖像(xiang)和視(shi)(shi)頻生成模型(xing)(xing)的進(jin)展也很大(da)。今年5月,谷歌發布(bu)的“Veo 3”,已經(jing)能生成非(fei)常(chang)真實的視(shi)(shi)頻,還能自動(dong)加(jia)音(yin)效(xiao)、對白、背(bei)景(jing)噪音(yin),讓(rang)你感覺(jue)“就(jiu)像(xiang)是一個真實世(shi)界(jie)的視(shi)(shi)頻記錄(lu)”。

我(wo)們投資的生(sheng)數科技,此前也(ye)發布了新一代視(shi)頻(pin)模型。它可以支持輸入“最多七個主(zhu)體”(人、動物、汽車(che)等)的參考(kao)圖(tu)片,且在(zai)生(sheng)成的視(shi)頻(pin)中保持這些(xie)主(zhu)體的“高度一致性”。

三、Agent進化走向“七月定律”,AI產品應用邁向全球

再來說說Agent。這是從今年3月開始最火的話題。Agent爆火,其實是因為基礎模型能力提升了:上下文窗口更大、能使用外部工具,核心還是“推理能力”的增強。現在甚至出現了“智能體的摩爾定律”——任務處理復雜度每七個月翻一倍。我(wo)們可以期(qi)待(dai)Agent再經歷一、兩(liang)個“七(qi)個月周期(qi)”后,會達(da)到什么(me)樣(yang)的智能水(shui)平。

今年1月,DeepSeek V3/R1模型發布,震驚全球。它在“推理成本”上做得非常好,僅為OpenAI對應模型的5%。此后,全球大模型團隊都在壓低成本。谷歌比DeepSeek還降了不少,階躍星辰最新模型的推理成本又比DeepSeek更低。現在主流的大模型,即使沒有做蒸餾,完整尺寸大模型的推理成本也已經降到每百萬Token約1美元,比去年下降了100倍。

講完(wan)技(ji)術,我們(men)再看應用(yong)(yong)層。大家熟悉的(de)(de)ChatGPT這個產品(pin),是(shi)這波(bo)AI浪(lang)潮的(de)(de)點火器(qi)。2023年7月,我們(men)第一次在(zai)WAIC召開論(lun)壇時,ChatGPT周(zhou)活用(yong)(yong)戶不(bu)到1億;到2024年舉辦論(lun)壇時是(shi)2億;而現(xian)在(zai)已(yi)經“差不(bu)多(duo)八、九億周(zhou)活用(yong)(yong)戶”了。AI應用(yong)(yong)發展速度非常快。

哈佛商業評論最近也總結了一個趨勢——AI產品從輔助創意走向深層互動。過去我們用AI在做圖、寫文案時產生創意,參考它的idea。但現在,療愈陪伴產品成(cheng)了最常用(yong)的應用(yong),真正幫助用(yong)戶尋找情緒出(chu)口,成(cheng)為一個數字(zi)化的陪伴者。

Token調用量也反映了應用熱度,比如豆包,12個月內調用量增長了超過100多倍。

硬件方面(mian)也有進展。我們投的“未來智(zhi)能”推出的翻譯(yi)耳機(ji),用(yong)戶已突(tu)破100萬。Plaud AI這(zhe)個華人團隊主攻(gong)北美市場(chang),也剛(gang)剛(gang)突(tu)破百(bai)萬用(yong)戶。

人(ren)(ren)(ren)形(xing)機器人(ren)(ren)(ren)在中國開始率先落地(di)。比如兩周前,優必選剛(gang)簽了全球最大的(de)人(ren)(ren)(ren)形(xing)機器人(ren)(ren)(ren)訂單;智元與宇(yu)樹也(ye)中標了真實落地(di)場景。

還有一個趨勢是“全球化”。過去互聯網公司是“本地稱王,再拓海外”;但現在,AI產品“生而全球”。比如快手的可靈AI,網頁端80%流量來自海外。生數科技(ji)的視頻(pin)生成平臺Vidu AI,上(shang)線3個月用戶超(chao)1000萬,其中80%以上(shang)也來自海(hai)外(wai)。

四、十大預測:基礎突破、應用轉向與硬件新形態

我們(men)每次(ci)分享的(de)最(zui)后,也是最(zui)重要的(de)環(huan)節,我們(men)再次(ci)挑戰一下自己,跟大家(jia)聊聊我們(men)對接下來12個(ge)月到18個(ge)月的(de)十大展望。

1、基礎模型上下文窗口突破

今年的展望,第一個是關于基礎模型。我們認為基礎模型會有很多創新,但有一點,就是12個月內,中國和美國的頭部基礎模型就會達到一個200萬Token的上下文窗口。從供給端(duan)(duan)看(kan),注意(yi)力機(ji)制等架構的創新(xin)正(zheng)在推動長(chang)文本能(neng)力迅速(su)突破;而從需求(qiu)端(duan)(duan)看(kan),只有(you)上(shang)下文窗口更長(chang),才(cai)能(neng)生成出真正(zheng)有(you)細節(jie)、有(you)連貫性的、貼合(he)語境的高質(zhi)量內容。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

2、通用視頻模型進入實用期

第(di)二個是關(guan)于多模態模型(xing)。其(qi)實(shi)不光是我們(men)啟明自己的判斷,我們(men)也結(jie)合了很多企業家、科學家、創新者(zhe)的智(zhi)慧。

在這個領域,我們判斷未來一到兩年之內,會出現真正的通用視頻模型,可以處理(li)在視頻模態下的多種任(ren)(ren)務,包括(kuo)生(sheng)成(cheng)、推(tui)理(li)和任(ren)(ren)務理(li)解,促進“內容生(sheng)成(cheng)”以及(ji)“交互(hu)方式”的革新。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

3、Agent邁入“數字員工”時代

那(nei)下一個是關于AI Agent。AI Agent也是現在(zai)(zai)非常熱的話題。我們判(pan)斷在(zai)(zai)未來12到14個月,Agent的形態(tai)將從(cong)“工具的輔(fu)助(zhu)”走向(xiang)“真(zhen)正的任(ren)務(wu)承接”。

在未來,我(wo)們認(ren)為兩年之內(nei)會(hui)有(you)真正意(yi)義上的“首(shou)批數(shu)字員工”進(jin)入(ru)企業內(nei)部廣泛(fan)參與企(qi)業的(de)研發、銷售、運營和客(ke)戶服(fu)務等重要(yao)環(huan)節(jie)。這意味著AI Agent不(bu)再(zai)僅作為助手存(cun)在,而是從“成本(ben)工具(ju)”走向了(le)“價值創造”,具(ju)備主(zhu)動承擔(dan)OKR、主(zhu)動反饋、協同作業等能力。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

4、多模態Agent將不斷走向實用化

多模(mo)態Agent將能(neng)夠融(rong)合視覺(jue)、語音、傳感器等(deng)多源輸入,進行復雜推理、工(gong)具調用(yong)與任務(wu)執行,在醫療(liao)、金融(rong)、法律等(deng)行業率先實現突(tu)破(po)。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

5、更多國設國造的GPU開啟批量交付

然后下面是關于AI的基礎設施,第一個是關于芯片。我們認為未來12個月到18個月內,有望看到越來越多所謂“國設”且“國造”的GPU問世

不光是中國團隊設計的GPU,而且是在中國的供應鏈中生產的GPU,能夠真正走向市場,批量交(jiao)付。這將是對中(zhong)國AI行業一個巨大(da)的好(hao)消(xiao)息。

但(dan)與此同時(shi),我們也會(hui)看(kan)到很多新一代去顛覆傳統GPU的(de)“馮諾依曼架構”的(de)AI芯片出現(xian)。比如說3D內(nei)存堆疊、通(tong)算融合等新一代AI芯片,也會(hui)慢(man)慢(man)走向市(shi)場(chang)、嶄露頭角(jiao)。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

6、AI Infra側將大幅降低Token成本

接下(xia)來是我們對另一個AI基礎設施(shi)層的(de)判(pan)斷(duan)(duan)。過去兩(liang)年推理成本已下(xia)降(jiang)了超百倍,我們判(pan)斷(duan)(duan)這個趨勢還會(hui)繼(ji)續。

未來12到24個月,Token的消耗量還會再提高1到2個數量級。集群推理優化、終端推理優化,和軟硬件協同優化,將成為AI基礎設施進(jin)一步(bu)降低Token成本的關鍵路徑。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

7、AI催生“非屏幕中心”的新型硬件

再說說應用,我(wo)們(men)(men)比較確信未來(lai)很快會看到一次“范式轉移”。也就是(shi)說,過(guo)去或(huo)現在我(wo)們(men)(men)主要的應用,都是(shi)基于(yu)手機,基于(yu)“人(ren)+屏(ping)幕(mu)”的人(ren)機交(jiao)互方(fang)式。手機這(zhe)種(zhong)屏(ping)幕(mu)中心的人(ren)機交(jiao)互方(fang)式,已經越來(lai)越跟(gen)不上(shang)AI能力的發展。

未來會出現很多更自然、更符合人性的“人機交互方式”,改變我們使用手機的習慣。也許會很快出現一種“能(neng)(neng)承載AI能(neng)(neng)力、又符(fu)合人(ren)性交互”的新硬件形態。就像(xiang)當(dang)年(nian)(nian)手機,在15年(nian)(nian)前、20年(nian)(nian)前把PC上的很多人類需(xu)求“轉移(yi)”出來一(yi)樣,新一(yi)代的硬件,也會把我們今天(tian)很多人類需(xu)求從手機上“轉移(yi)出來”。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

8、垂類切入成為創業破局關鍵

從我們投資人、創業者的角度,我們其實比較喜歡“go narrow and go deep”。我們的策略就是:應該找一個垂直細分場景,把它做深做透。這樣企業才能更有效地與大廠形成差異化競爭,走出所謂大廠的“巨人陰影”。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

9、AI-BPO模式崛起

另外一個關于AI應用的預測,我們也看到,過去幾年,從賣license,到賣訂閱,各種商業模式越來越豐富。而現在我們看到一種新模式正在異軍突起,即“AI?BPO”——也就是AI驅動的業務外包。

AI BPO(業務外(wai)包(bao))模式(shi)將在(zai)未來12-24個月實現(xian)商業化突(tu)破(po),從“交付工具”走向(xiang)“交付結(jie)(jie)果(guo)”,并通過“按結(jie)(jie)果(guo)付費(fei)”的方式(shi),在(zai)金融、客服、營銷、電商等流程標準化行業快速(su)擴張(zhang)。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布

10、具身智能將在三個場景率先落地

最后一個預測,是這幾個月最熱的“具身智能”。很多媒體都在問我:“你們覺得具身智能機器人,最先會在哪些真正有用的場景落地?而不是只是舞臺表演?”我們大膽預測,未來12至18個月內,會在挑選、搬運和組裝三個場景率先落地,而且是“規模化落地”——我說的“規模化”是“上千臺、上萬臺”的落地。

我們覺得這點非常關鍵。只有在一(yi)些細分場(chang)景落地之后,才會形成“從模型(xing)、本體到(dao)場(chang)景數據(ju)”的(de)飛輪效應,推動整個具身智能技(ji)術高速向前發展。

AI員工將進入企業,新一代AI芯片嶄露頭角!啟明創投年度AI十大展望發布