
智東西(公眾號:zhidxcom)
作者 | 陳駿達
編輯 | 心緣
智(zhi)東西5月23日(ri)報道,5月18日(ri),中(zhong)國人(ren)民大(da)學高瓴人(ren)工智(zhi)能學院向外界分享了該學院在AI研究方面取得的(de)最新成果,以及(ji)學院本碩博(bo)在校生和畢業生的(de)創新創業項(xiang)目情況(kuang)。高瓴人(ren)工智(zhi)能學院成立剛滿6周年(nian),已交出(chu)一(yi)份令人(ren)驚喜的(de)答(da)卷(juan)。
高(gao)瓴人工(gong)智(zhi)能學(xue)院于2020年開啟了(le)大(da)模型研發工(gong)作(zuo),是國(guo)內最早(zao)開始研發大(da)模型的(de)單位之一,現(xian)已布(bu)局了(le)20多個研究(jiu)方向。該學(xue)院曾發布(bu)我國(guo)第一個大(da)規模預訓練模型文(wen)瀾、大(da)語(yu)言模型玉蘭等AI科研成果(guo),現(xian)已進入計算機(ji)學(xue)科國(guo)際權威排行榜CSRankings的(de)前列,并在互聯網信息檢索領域(yu)連(lian)續3年排名(ming)世界第一。
去年,高瓴人工智(zhi)能學院共發表160篇CCF A類(中國(guo)計算機學會(hui)推薦的A類國(guo)際學術會(hui)議)論文(wen),其中有部分成(cheng)果來(lai)自(zi)于(yu)與北京智(zhi)源人工智(zhi)能研究(jiu)院、華為、聯通(tong)等國(guo)內頭部研究(jiu)機構和(he)企業的合作。
人才培養方面,高(gao)瓴人工智能學(xue)院現有本(ben)碩博學(xue)生(sheng)532人,其中本(ben)科生(sheng)與(yu)博士生(sheng)占絕大多數(shu)。這(zhe)批學(xue)生(sheng)從(cong)大二開(kai)始便進入實驗室,已有11人次獲得百度獎學(xue)金(jin)、微軟學(xue)者、中國計算機學(xue)會優博等獎項。
該學(xue)院還積極引(yin)導學(xue)生(sheng)(sheng)創業,其中由2020級(ji)博士生(sheng)(sheng)高一釗創辦(ban)的多模態大模型企(qi)業智子引(yin)擎(qing)已完成3輪融資,總融資額(e)達數千萬元。
文繼榮(rong)稱,在培養一流(liu)的AI科學(xue)(xue)家、工(gong)程師的同時,未來高瓴人(ren)工(gong)智能學(xue)(xue)院還將在創業創新、學(xue)(xue)科交叉這(zhe)兩(liang)大方(fang)向發(fa)力,作(zuo)為(wei)院長,他希望高瓴也能做(zuo)出DeepSeek這(zhe)樣的工(gong)作(zuo)。
高瓴人(ren)(ren)(ren)工智(zhi)能學院在(zai)中(zhong)(zhong)國人(ren)(ren)(ren)民大(da)學首屆“全(quan)球校友大(da)會”的人(ren)(ren)(ren)工智(zhi)能自主創新發展論壇(tan)上分享了(le)(le)上述成果,這一論壇(tan)還見證了(le)(le)門頭溝(gou)區政(zheng)府(fu)與中(zhong)(zhong)國人(ren)(ren)(ren)民大(da)學共同建設的“京西(xi)智(zhi)谷(gu)中(zhong)(zhong)國人(ren)(ren)(ren)民大(da)學人(ren)(ren)(ren)工智(zhi)能與智(zhi)慧治理研(yan)發中(zhong)(zhong)心”的揭牌(pai)。
一、探索大模型架構創新,AI+社科交叉研究成特色
中國人民大學高瓴人工智(zhi)能學院的多位教師分享了該學院在(zai)大模型、交叉學科(ke)研究、科(ke)學智(zhi)能、智(zhi)慧治理方面的科(ke)研成果(guo)。
▲參與分享(xiang)的7位(wei)高瓴人工智能(neng)學院(yuan)教師(圖(tu)源:高瓴人工智能(neng)學院(yuan))
高(gao)(gao)瓴人(ren)工智(zhi)能學院(yuan)自2020年9月(yue)開始著手研發“文瀾(lan)”多模(mo)(mo)態(tai)大(da)(da)模(mo)(mo)型(xing)(xing),成(cheng)為全(quan)球(qiu)最早開展大(da)(da)模(mo)(mo)型(xing)(xing)研究的(de)學術(shu)機構之一。基于文瀾(lan)模(mo)(mo)型(xing)(xing)的(de)技術(shu)積(ji)累,高(gao)(gao)瓴人(ren)工智(zhi)能學院(yuan)相繼研發出視頻生成(cheng)大(da)(da)模(mo)(mo)型(xing)(xing)VDT和(he)圖文大(da)(da)模(mo)(mo)型(xing)(xing)Awaker,探(tan)索了多模(mo)(mo)態(tai)大(da)(da)模(mo)(mo)型(xing)(xing)在三(san)維場景生成(cheng)、人(ren)物動作交(jiao)互和(he)機器人(ren)感(gan)知進(jin)化上實際(ji)落地應用的(de)技術(shu)。
在語(yu)言(yan)(yan)大(da)模(mo)型領(ling)域,該學院成功構建“玉(yu)蘭”系(xi)列(lie)開源(yuan)大(da)語(yu)言(yan)(yan)模(mo)型,包括百億級參(can)數(shu)的YuLan、輕量化的YuLan-Mini及創(chuang)新性的非自回(hui)歸模(mo)型LLaDA,系(xi)統(tong)掌握(wo)了預訓練全(quan)鏈條技(ji)術,成為國內少數(shu)具備從頭預訓練能(neng)力(li)的高校團(tuan)隊。該學院發表(biao)了首篇大(da)模(mo)型綜(zong)述《A Survey of Large Language Model》及《大(da)語(yu)言(yan)(yan)模(mo)型》教(jiao)材,有力(li)推動(dong)了大(da)模(mo)型技(ji)術推廣。
依托中國人民大學的學科(ke)優勢,高瓴人工(gong)智能重點推進“AI+”跨學科(ke)創新,形成了(le)AI社(she)會(hui)科(ke)學研究(jiu)仿真模擬(ni)框架與涉外法治大模型等特色成果。
高瓴(ling)人工智能學院(yuan)打造(zao)的玉蘭-萬(wan)象(xiang)大模(mo)型社會模(mo)擬(ni)平臺,支持自(zi)(zi)(zi)動化(hua)場景(jing)構(gou)建,用戶只需通(tong)過自(zi)(zi)(zi)然語言對(dui)模(mo)擬(ni)場景(jing)進(jin)行描述,系統將自(zi)(zi)(zi)動生成代碼,大幅降低編(bian)程門檻。平臺內置(zhi)(zhi)50個模(mo)擬(ni)模(mo)擬(ni)場景(jing),支持十萬(wan)級智能體大規模(mo)模(mo)擬(ni)。內置(zhi)(zhi)的AI社會研究員可自(zi)(zi)(zi)動完(wan)成從研究問題分析、場景(jing)構(gou)建、模(mo)擬(ni)執行到報告生成的完(wan)整科研閉環(huan)。
該學(xue)院(yuan)還聯合人大(da)法(fa)學(xue)院(yuan)、智(zhi)源研究院(yuan)共同研發了中國人民大(da)學(xue)涉外法(fa)治大(da)模型,并在(zai)研發過(guo)程中建立了高質(zhi)量(liang)的(de)(de)涉外法(fa)律知識(shi)庫、高精(jing)準的(de)(de)多語言法(fa)條檢(jian)(jian)索系(xi)統、高可信(xin)的(de)(de)法(fa)條增(zeng)強(qiang)生成框架、深(shen)度思考(kao)的(de)(de)法(fa)律推理(li)功能。通過(guo)知識(shi)檢(jian)(jian)索和智(zhi)能問答(da)兩大(da)系(xi)統,用(yong)戶能夠精(jing)準獲(huo)取更優(you)質(zhi)、可信(xin)、合理(li)的(de)(de)檢(jian)(jian)索結果和法(fa)律回答(da)。
AI技術賦(fu)能智(zhi)(zhi)慧治理(li)也是(shi)高瓴人工智(zhi)(zhi)能學院的重要研究方(fang)向。從(cong)基礎(chu)平臺到垂直場景,他們構建了“數據(ju)感知-智(zhi)(zhi)能 認知-精準施(shi)策(ce)”的閉(bi)環體(ti)系,涵蓋城市治理(li)中的數據(ju)智(zhi)(zhi)能基礎(chu)平臺、民生(sheng)治理(li)、公租房分配(pei)智(zhi)(zhi)能決(jue)策(ce)、產(chan)業(ye)賦(fu)能治理(li)等領域(yu)。
高(gao)瓴(ling)人工智能學(xue)院(yuan)(yuan)還(huan)探索了大模型架構的新范式。該學(xue)院(yuan)(yuan)于2025年2月(yue)發布全球首個80億參數擴(kuo)散(san)語言模型LLaDA。LLaDA 通過(guo)擴(kuo)散(san)采(cai)樣的方(fang)式而非從左到(dao)右的方(fang)式生成連(lian)貫對話,效果媲(pi)美同規(gui)模代表(biao)性自回歸模型并突(tu)破單(dan)(dan)向推理瓶(ping)頸。LLaDA在國(guo)內外社交媒體(ti)被(bei)廣泛討論,單(dan)(dan)帖瀏覽量破40萬。開源模型單(dan)(dan)月(yue)全球下載量超過(guo)17萬次。
信息檢索領域是高瓴人工(gong)智(zhi)能(neng)(neng)學院(yuan)(yuan)的(de)強(qiang)項(xiang)。該學院(yuan)(yuan)曾開源模塊(kuai)化(hua)工(gong)具包FlashRAG,在(zai)開源社(she)區(qu)GitHub上獲得(de)2300多(duo)星標,并(bing)適(shi)配了(le)華為(wei)、百(bai)度的(de)國產化(hua)開發框(kuang)架。今(jin)年,高瓴人工(gong)智(zhi)能(neng)(neng)學院(yuan)(yuan)開始關注AI深度搜索,并(bing)發布了(le)深度搜索引擎WebThinker。
WebThinker以大規模推理模型為基(ji)座(zuo),能一邊(bian)推理一邊(bian)主動識(shi)(shi)別知識(shi)(shi)缺口,自主發起聯(lian)(lian)網(wang)(wang)搜(sou)索補充知識(shi)(shi);還能深度(du)瀏(liu)覽(lan)互聯(lian)(lian)網(wang)(wang),在搜(sou)索到的網(wang)(wang)頁上(shang)根據需要自主點擊其他鏈接來(lai)獲(huo)取(qu)更深層(ceng)次相關信(xin)息(xi)。
它還能“邊(bian)(bian)思(si)考-邊(bian)(bian)搜(sou)索(suo)-邊(bian)(bian)寫(xie)作”,通過并行(xing)處理實現實時研(yan)究報告(gao)生(sheng)成,大幅(fu)縮(suo)短內容(rong)整理和(he)報告(gao)寫(xie)作周期,并基于(yu)在線強化學習策(ce)略,不斷從用戶交互歷史中(zhong)優化搜(sou)索(suo)策(ce)略和(he)報告(gao)質量。
在科學(xue)智能(AI for Science)領域(yu),高(gao)瓴(ling)人工(gong)智能學(xue)院在基礎算(suan)(suan)(suan)法(fa)平(ping)臺、圖機器學(xue)習計算(suan)(suan)(suan)平(ping)臺取得(de)重要成果,研發首個基于國(guo)產深度學(xue)習框架計圖的圖機器學(xue)習算(suan)(suan)(suan)法(fa)庫Jittor-Geometric,為科學(xue)計算(suan)(suan)(suan)提(ti)供了更(geng)高(gao)效的國(guo)產化解決方案。
在微(wei)觀(guan)和(he)介觀(guan)尺度(du),該學(xue)院研發了一系列基于幾何學(xue)習的端到(dao)端預測與生成模型,為(wei)小分(fen)子藥(yao)(yao)物(wu)(wu)設(she)計(ji)(ji)、抗體藥(yao)(yao)物(wu)(wu)設(she)計(ji)(ji)、蛋白質藥(yao)(yao)物(wu)(wu)設(she)計(ji)(ji)、高分(fen)子藥(yao)(yao)物(wu)(wu)設(she)計(ji)(ji)開拓了新方法路徑。
在宏(hong)觀(guan)(guan)和超宏(hong)觀(guan)(guan)尺(chi)(chi)度尺(chi)(chi)度,提出了數據與機理(li)雙驅動新(xin)一代智能科學(xue)計算框(kuang)架(jia),解(jie)決了大規模湍流加速仿真、缺失(shi)觀(guan)(guan)測(ce)多(duo)物理(li)場生成、無人(ren)機飛(fei)行氣(qi)動實(shi)時預(yu)測(ce)、精準臨近降水預(yu)報等挑戰難(nan)題。
二、博士生創業項目獲千萬融資,本科生打造多模態音樂生成模型
在(zai)科研的同時,中國(guo)人(ren)民大學高(gao)瓴人(ren)工智能學院(yuan)也(ye)注(zhu)重(zhong)培養學生(sheng)(sheng)的創(chuang)新、創(chuang)業(ye)精神,學院(yuan)學生(sheng)(sheng)已(yi)在(zai)多模態AI、AI+法律、AI+藝術等前沿(yan)領域打造了相關產品,從(cong)本科生(sheng)(sheng)階(jie)段到博士生(sheng)(sheng)階(jie)段,均有學生(sheng)(sheng)投(tou)身創(chuang)業(ye)。
多(duo)(duo)(duo)模(mo)態(tai)大(da)模(mo)型創企(qi)智子(zi)引擎的創始團隊主要來自中國人(ren)民大(da)學高瓴人(ren)工(gong)智能學院,創始人(ren)高一釗(zhao)是高瓴人(ren)工(gong)智能學院級2020級直(zhi)(zhi)博生。從參與國內(nei)第一個(ge)多(duo)(duo)(duo)模(mo)態(tai)大(da)模(mo)型項(xiang)目悟道·文瀾開始,智子(zi)引擎團隊一直(zhi)(zhi)處在國產(chan)多(duo)(duo)(duo)模(mo)態(tai)技術的前沿(yan)。
智(zhi)子引擎(qing)已(yi)(yi)完成(cheng)(cheng)圖(tu)生(sheng)(sheng)(sheng)文(wen)、視頻(pin)(pin)(pin)生(sheng)(sheng)(sheng)文(wen)、文(wen)生(sheng)(sheng)(sheng)視頻(pin)(pin)(pin)、圖(tu)生(sheng)(sheng)(sheng)視頻(pin)(pin)(pin)等多模(mo)態(tai)模(mo)型(xing)的(de)發布,近兩年(nian)已(yi)(yi)連續完成(cheng)(cheng)多輪(lun)融(rong)資并(bing)將自(zi)主研發的(de)多模(mo)態(tai)大(da)模(mo)型(xing)在多行業(ye)落地(di),具體場(chang)景包含:城(cheng)市治(zhi)理(li)、應急(ji)消防、智(zhi)能(neng)巡檢、影像(xiang)內容生(sheng)(sheng)(sheng)成(cheng)(cheng)等。該(gai)公司希望探索在全新、可擴展架構上打造多模(mo)態(tai)大(da)模(mo)型(xing)的(de)技(ji)術路徑。
▲智子引擎發展歷程
高瓴人(ren)工智能學院2021級博士生(sheng)張陽(yang)稱,他(ta)的(de)創業項目(mu)“妙手”是一款聚焦(jiao)AI Agent for Research的(de)自動(dong)化科研平臺,提供從選(xuan)題挖掘、數據收集、模型構建到報告生(sheng)成的(de)全流(liu)程自動(dong)化服務。
用戶(hu)僅需輸入研究方(fang)向或(huo)核心想法,平臺可(ke)在10分鐘內輸出(chu)包含研究背(bei)景、方(fang)法設計、實(shi)證(zheng)結果、圖表分析的完(wan)整實(shi)驗報告(gao)。
▲妙手產品架構
高(gao)瓴人工智能學院2022級博士生孫忠祥的創業項目聚(ju)焦(jiao)法(fa)(fa)(fa)律,打造了大模型驅(qu)動的可信模擬法(fa)(fa)(fa)庭“慧(hui)審(shen)”。項目聚(ju)焦(jiao)法(fa)(fa)(fa)律AI的可落地性(xing)與(yu)可信性(xing),融合法(fa)(fa)(fa)律三段論(lun)推理(li)與(yu)“適應-檢索修(xiu)訂(ding)”框架(jia),模擬真實(shi)審(shen)判(pan)流程,實(shi)現智能法(fa)(fa)(fa)官、原被告、證人等多角色協同。
系統特(te)別強化了(le)公(gong)平性和生成可信(xin)性,解決基(ji)層(ceng)司法資(zi)源緊張、案件處理效率低等問題(ti),助力(li)構(gou)建更高效、更公(gong)開、更可信(xin)的法律服務體系,推(tui)動智慧司法的創新發展。
▲模(mo)擬法庭智能體系(xi)統
高瓴(ling)人工(gong)智能學院2023級博士生涂權打造了(le)AI鏡像(xiang)社交應用“回聲”。用戶可通過自建特質遵循(xun)的擬(ni)人化(hua)社交分(fen)身(shen),由AI主動篩(shai)選興(xing)趣和(he)性格匹配(pei)的對(dui)象并代(dai)勞破(po)冰,過濾無(wu)效社交。
“AI鏡(jing)像(xiang)社交(jiao)”并不替代真(zhen)人連接,而是優化(hua)社交(jiao)漏斗,讓用戶從低(di)效“滑屏”轉向高質互動,最終回歸真(zhen)實(shi)關系(xi)。
▲“回聲”團隊的(de)技(ji)術積累(lei)
高瓴人工智(zhi)能(neng)(neng)學院2023級本科(ke)生(sheng)(sheng)(sheng)張(zhang)景超和團隊一(yi)起打造了(le)WeaveWave多模(mo)態(tai)人工智(zhi)能(neng)(neng)音(yin)(yin)樂生(sheng)(sheng)(sheng)成模(mo)型(xing)。目前,大部分(fen)音(yin)(yin)樂生(sheng)(sheng)(sheng)成模(mo)型(xing)僅支持視覺、文本等單一(yi)模(mo)態(tai),而該模(mo)型(xing)可以同時使用視覺、文本、音(yin)(yin)頻(pin)等內容(rong)作為“靈感”,生(sheng)(sheng)(sheng)成音(yin)(yin)頻(pin)內容(rong),進一(yi)步(bu)提升了(le)音(yin)(yin)樂生(sheng)(sheng)(sheng)成的可控制性。
三、“在AGI時代,最大的風險就是不敢冒風險”
在以“AGI時代的(de)創(chuang)業創(chuang)新”為主題的(de)論壇(tan)上,來自(zi)研(yan)究機構、企業界(jie)和學(xue)術界(jie)的(de)多位嘉賓分享了(le)他們對學(xue)生創(chuang)業的(de)建議。
中(zhong)關村(cun)門頭溝園管委會主(zhu)任譚(tan)李(li)麗見證了(le)許多(duo)創(chuang)業(ye)項目(mu)的孵化,她肯定了(le)高瓴(ling)人工智能學院的“導師帶領+產業(ye)鏈接”孵化模式,但也強調創(chuang)業(ye)需(xu)緊密結合(he)產業(ye)需(xu)求。譚(tan)李(li)麗介紹,門頭溝區(qu)的京(jing)西智谷正(zheng)在空間(jian)載體、人才(cai)安居(ju)、法(fa)律(lv)服務、科技金融(rong)等方向(xiang)為創(chuang)企(qi)提供支(zhi)持(chi)。
國(guo)家級科研機(ji)構北京中關村學(xue)院院長劉鐵(tie)巖建議,學(xue)生應該充分利用在(zai)校(xiao)期間(jian)的機(ji)會,在(zai)創業領域多試錯(cuo),在(zai)這一(yi)階段,試錯(cuo)成本(ben)相對較低。他(ta)認為,創業者應該“以最樂觀的心(xin)態面對挑戰,但以最壞的打(da)算接受結果(guo)。”
劉鐵巖是(shi)中關(guan)村(cun)學(xue)院的(de)第一(yi)位(wei)全職員工,經歷了該學(xue)院從(cong)0到1的(de)“創業”過程。他告誡創業者,不能(neng)“以玩(wan)票的(de)心態(tai)看(kan)待創業”。他在中關(guan)村(cun)學(xue)院鼓勵學(xue)生(sheng)自主立(li)項,從(cong)科研階段開(kai)始對自己(ji)負責(ze),不把導(dao)師作為“最后一(yi)道(dao)防線”。
北京智源人工智能研究院院長王仲遠是中國人民大學校友,結合自身成長經歷分享了對技術、理想與商業現實之間差距的認知。王仲遠鼓勵AGI時代的在校生們積極創業,并強調“在AGI這個時代,最大的風險就是不敢冒風險”。
華為中央軟件院分布式與并行軟件實驗(yan)室主任譚焜觀察到,科技創業者的(de)創業項目通常由技術出發,但仍(reng)需看到商業需求(qiu)是(shi)什么、客(ke)戶在哪里、客(ke)戶的(de)需求(qiu)是(shi)什么。此外,在公司達到一定規模后,如(ru)何構建公司的(de)組織(zhi)架(jia)構、股權(quan)架(jia)構,也是(shi)必(bi)須要注意的(de)問題。
高瓴人工智能(neng)學院長聘(pin)副(fu)教授(shou)許洪騰(teng)從青年教師的角度分享了他對(dui)創業的看法(fa)。據(ju)他回憶,文繼榮(rong)曾說人大高瓴人工智能(neng)學院的發展方向應該類(lei)似斯坦福大學,而非加州理工,前者(zhe)更注重創業文化(hua)和多元(yuan)發展路徑,后者(zhe)更注重象牙塔內的科研。
許洪騰建議,想投(tou)身創(chuang)業(ye)(ye)的學(xue)生(sheng)應該認識到,投(tou)資(zi)人(ren)更看(kan)重(zhong)“人(ren)靠(kao)譜(pu)”而(er)非項目(mu)成敗(bai)。創(chuang)業(ye)(ye)者應該注重(zhong)在創(chuang)業(ye)(ye)過程(cheng)中與投(tou)資(zi)人(ren)建立(li)聯(lian)系(xi),獲(huo)得投(tou)資(zi)人(ren)的信賴(lai),這樣即便某(mou)一項目(mu)失敗(bai)了,還能持續獲(huo)得投(tou)資(zi)。
已經擁(yong)有成(cheng)功創(chuang)業(ye)經歷的高一釗分(fen)享說,創(chuang)業(ye)幫助他(ta)迅(xun)速積(ji)累了在校園內無法獲取(qu)的資源,對個人(ren)成(cheng)長幫助較大。他(ta)鼓勵(li)學生積(ji)極創(chuang)業(ye),因為當以學生身份創(chuang)業(ye)時,即便(bian)項目失(shi)(shi)敗,也不會(hui)面臨過大損失(shi)(shi)。
結語:產學研融合發展,高瓴打造特色人才培養模式
作為國內頂尖(jian)的AI科研與教學機構,高(gao)瓴(ling)人工智能(neng)學院(yuan)過去(qu)6年的發展速度和成果有目共睹。
在國(guo)內AI產業飛速(su)發展、國(guo)產化進程加速(su)之際,高瓴人工智能學院正為產業界源源不斷地輸送高質量AI人才,走出(chu)了一條(tiao)科研(yan)、產業與教(jiao)育融(rong)合的(de)獨特(te)路徑(jing),對國(guo)內的(de)AI教(jiao)育具有一定借鑒意義(yi)。