智東西(公眾號:zhidxcom)
作者 | 王涵
編輯 | 漠影

智東西8月28日報道,最近網上有一個詞特別火,叫“邪修”

通俗來講就是(shi)“不走尋常路”,跳出傳統方法或步驟,卻能簡單高效地(di)達成(cheng)目的(de)。

那科研能不能“邪修”呢?

前幾天,一(yi)個(ge)還(huan)在讀材料研究生(sheng)的(de)(de)朋(peng)友跟(gen)我聊天,提到他們實(shi)(shi)驗室里(li)的(de)(de)新生(sheng)都在“邪(xie)修做實(shi)(shi)驗”。

具體說來就是,用(yong)AI幫忙(mang)總結(jie)文獻,把實(shi)驗結(jie)果(guo)輸給(gei)AI讓其(qi)幫忙(mang)做數據分(fen)析(xi)(xi),還能讓AI根據分(fen)析(xi)(xi)結(jie)果(guo)生(sheng)成(cheng)下一步實(shi)驗改進(jin)方法(fa),得(de)到的(de)結(jie)果(guo)又快又好。

現在帶(dai)動他們整個(ge)實驗室都在用AI,當然老師也(ye)知道這個(ge)情(qing)況(kuang),但基本(ben)屬于默許(xu)狀態,還曾感嘆真(zhen)是生錯了(le)時代。

究竟是什么AI這么好用?他給我甩來一個鏈接,還說你試試就知道了。我點開一看,這是一個科學多模態大模型,叫做『書生』Intern-S1

為了驗證它的能力(li),我(wo)特意翻出(chu)了此前所做實驗的相關圖表(biao),拍照發給(gei)Intern-S1,并(bing)問它:這副材料表(biao)征圖可以顯示出(chu)鈣鈦(tai)礦LED薄膜的哪一(yi)特性(xing)?右圖和左圖在這一(yi)特性(xing)上有什么(me)不同?

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

Intern-S1在很短的時間內就判斷出該(gai)幅圖片是原子力顯微鏡(AFM)的(de)(de)三維形貌圖,并且對(dui)該(gai)圖進(jin)行了(le)詳(xiang)細的(de)(de)解讀,列出了(le)對(dui)比表格(ge)。此外(wai),Intern-S1還生成(cheng)了(le)對(dui)該(gai)實(shi)驗品(pin)的(de)(de)未來改進(jin)方向,可以(yi)給科研人員(yuan)拓寬(kuan)實(shi)驗改進(jin)思(si)路。

值得一提的是,在精準識別化學分子結構并進一步給出科研建議方面,Intern-S1表現比Grok還出色

我給了Intern-S1一(yi)張圖(tu),并(bing)提(ti)問(wen):這個分子式含有(you)Cs、Pb和Br三種元素,根(gen)據(ju)此分子結(jie)構圖(tu),寫出該化學物質(zhi)的(de)(de)分子式,并(bing)介紹其有(you)什么樣的(de)(de)化學性質(zhi),目前有(you)哪方面的(de)(de)應用?

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

作為對比,我也讓(rang)Grok回(hui)答了一下這個問題:

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

可以看到,Grok只是中規中矩地回答問題,并沒有做更多的延展,但Intern-S1還特別生成該化合物研究領域目前所遇到的挑戰,以及未來改進方向,站在了一個科研人的(de)角度思考問題,預判了我的(de)下一步(bu)動作。

除了(le)(le)科研外,我也順(shun)帶(dai)看了(le)(le)一下(xia)它在藝術領(ling)域(yu)的表現(xian)。我把梵高(gao)的畫作《星空》發給Intern-S1,讓它從科學(xue)的邏輯和知識體系進行理性賞析:

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

當然也(ye)還可(ke)以這(zhe)么(me)用(yong),比(bi)如給理工直男解釋防(fang)曬(shai)霜(shuang)和隔離液(ye)、粉底液(ye)的區(qu)別:

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

再比(bi)如,我還能讓(rang)Intern-S1給(gei)我看食品配料表,判斷其是否(fou)適(shi)合減脂期食用(yong):

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

對于我的提問,Intern-S1在分鐘內就給出了準確答案,相對于教科書和學術論文語言的晦澀,Intern-S1的回答簡潔明了、通俗易懂,并且在其他模型還在專注于如何精準地回答問題時,Intern-S1已經可以用科研人的思維進一步思考了,在科學專業知識這方面,確實能打。

Intern-S1的輕量化版本Intern-S1-mini也在前幾天問世了,mini版本只有8B參數但同樣兼具通用能力與專業科學能力,且更加適合快速部署二次開發

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

目前,Intern-S1和Intern-S1-mini都已經開源,Hugging Face上顯示Intern-S1的下載量有5萬多,Intern-S1-mini的下載量也有1000多,非常受歡迎,感興(xing)趣的(de)可以去試一試:

體驗頁面:

//chat.intern-ai.org.cn/

GitHub:

//github.com/InternLM/Intern-S1

HuggingFace:

//huggingface.co/internlm

ModelScope:

//modelscope.cn/models/Shanghai_AI_Laboratory

當然,科(ke)學大(da)(da)模型(xing)(xing)不(bu)算(suan)是一個新鮮事物(wu)。在近幾年(nian),同類型(xing)(xing)的、專注(zhu)于科(ke)學的大(da)(da)模型(xing)(xing)也層(ceng)出不(bu)窮。上海AI實(shi)驗室(shi)的這一成果為什(shen)么能實(shi)現這樣的差異化?

帶(dai)著這樣的疑問,我(wo)深(shen)扒了Intern-S1背后(hou)的技術路(lu)線(xian)和應(ying)用成果,并與上海AI實驗室的青年領軍科學家陳愷進行了一場深(shen)度訪談,最終(zhong)我(wo)得到了答案。

一、AlphaFold破解50年蛋白質難題,AI+Science進入快車道

要講科學大模型,最繞不開的就是AI for Science這(zhe)個話題,這(zhe)就不(bu)(bu)得(de)不(bu)(bu)提到(dao)2024年的諾(nuo)貝爾化學獎。

2024年,諾貝爾化學獎公布將其一半頒給計算蛋白質設計方面的研究者David Baker,另一半則授予了共同開發了AlphaFold的谷歌DeepMind CEO德米斯·哈薩比斯(Demis Hassabis)和John Jumper。

AlphaFold,特別是其在2020年發布的AlphaFold2版本,利用深度學習和人工智能技術,以前所未有的準確性和速度預測蛋白質的三維結構。這使(shi)得原本(ben)需要(yao)數月甚至數年才能完成(cheng)的蛋(dan)白質結構解(jie)析(xi)工(gong)作,現(xian)在可以(yi)在幾小時甚至幾分鐘內完成(cheng),并且準確(que)度可以(yi)媲美甚至在某些情況(kuang)下超越(yue)傳(chuan)統方法。

AI可以通(tong)過(guo)分(fen)析(xi)數百(bai)萬個(ge)已知的(de)(de)蛋白質結構和序(xu)列數據(ju)庫進行(xing)訓練,從而能夠(gou)從僅有的(de)(de)氨基酸序(xu)列推斷出蛋白質的(de)(de)折疊方式。

其實在此之前,AI for Science就已經引起學術和行業的關注。2019-2023年間,全球AI for Science論文發表年均增長率為27.2%,各學(xue)科領(ling)(ling)域(yu)論文發(fa)表(biao)均呈現逐年遞增趨(qu)勢(shi),其(qi)中生命科學(xue)、物理學(xue)和(he)化學(xue)等領(ling)(ling)域(yu)發(fa)表(biao)的人工(gong)智能(neng)應用論文數量最(zui)多(duo)。

中美兩國是當前AI for Science研究大國,近5年間,中國論文發表超過10萬篇居全球第一

但24年諾貝爾化學(xue)獎(jiang)的(de)(de)(de)公(gong)布,再次證明了(le)人工智能(neng)技(ji)術在推動科學(xue)進步方面所扮演(yan)的(de)(de)(de)關鍵角色,尤其是通過像(xiang)AlphaFold這樣的(de)(de)(de)突(tu)破(po)性(xing)應用(yong),不僅加快了(le)科學(xue)研究(jiu)的(de)(de)(de)步伐(fa),還拓寬了(le)我們(men)對生命科學(xue)、物(wu)理(li)學(xue)和化學(xue)等(deng)領域內復雜問題(ti)的(de)(de)(de)理(li)解。

隨著(zhu)全球(qiu)范圍內AI for Science的熱度(du)持續升溫,越來越多(duo)的研究者和(he)機構(gou)開始(shi)探索如何利(li)用人工智能來解決更(geng)多(duo)基礎科(ke)學難(nan)題。

在這一背景(jing)下,『書生(sheng)』科學多模態大模型Intern-S1應(ying)運而生(sheng)。

值得關注的是,在開源策略層面,上海AI實驗室比谷歌DeepMind更“豪爽”

Intern-S1發布即開源。除(chu)了(le)基礎模型外,上海AI實驗室(shi)還一(yi)口氣開(kai)源(yuan)了(le)大模型研發(fa)(fa)與應用所需(xu)的全鏈路工具體系,并(bing)已構建(jian)擁有(you)數十萬活躍開(kai)發(fa)(fa)者的開(kai)源(yuan)社(she)區。

谷歌DeepMind AlphaFold3從(cong)發(fa)布到開放相隔長(chang)達半年(nian),且僅為部(bu)分開放:模型權重需(xu)申請獲取,商業(ye)用(yong)途受限。

二、主打多模態和通專融合,化學、材料、地球科學全面超越Grok-4

相較于同類科學大模型,Intern-S1有2個突出的特別之處,那就是多模態和“通專融合”

據了解,在綜合多模態通用能力評估中,Intern-S1的得分和國內外一流模型不相上下,能同時較好地理解文(wen)本和圖(tu)像(xiang)內容。該評(ping)估為多項通用任務評(ping)測基準均(jun)分,這樣的結(jie)果說明它在不同場景任務中,既有(you)穩定的表現,也能適應復雜情況。

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

而在由多個領域專業評測集組成的科學能力測試里,Intern-S1的表現超過了Grok 4等最新的閉源模型。這些評測涉及物理、化學、材料、生物等領域的復雜專業任務,進一步證實了Intern-S1在科研場景中具備較強的邏輯性準確性

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

Intern-S1是怎么在多模態(tai)領域答出這樣(yang)的高(gao)分(fen)答卷(juan)的?

陳愷告訴智東西,原來,Intern-S1新增了動態Tokenizer和時序信號編碼器,實(shi)現(xian)了支持多種復雜科學模(mo)態數據處理(li)的功(gong)能(neng)(neng),所以才(cai)能(neng)(neng)夠實(shi)現(xian)材料科學與(yu)生(sheng)物制藥、天(tian)文巡天(tian)、天(tian)體碰(peng)撞、地(di)震臺網記錄的地(di)震波(bo)形等多類科學模(mo)態進(jin)行(xing)深(shen)度(du)融合。

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

此外,Intern-S1通過架構上的創新,對科學模態數據的理解和處理效率有了明顯提高。比如,它對化學分子式的壓縮率比DeepSeek-R1要高出70%以上。在一系列基于科學模態的(de)專(zhuan)業任(ren)務(wu)中,Intern-S1不(bu)僅用的(de)算力更(geng)(geng)少,表現(xian)也更(geng)(geng)出色。

之前市場中的科學大模型,或者說專業領域的行業大模型,通常都會強調自己過硬的專業能力,而在Intern-S1發布會上,“通專融合”這個(ge)詞(ci)出現頻率很高。

當被問到上海AI實驗室專注走“通專融合”技術路線的原因時,陳愷解釋稱:“通專融合的技術路線,能讓模型在通用能力保持的同時做到專業能力精進,把垂類能力構建成本大幅降低。

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

智東西了解到,一方面,Intern-S1會借助大量通用科學數據來拓寬自身的知識范圍;另一方面,它還會訓練多個專業模型,生成那些容易理解、邏輯清晰的科學數據,并且通過為特定領域定制的專業驗證(zheng)智能體來把(ba)控這些數(shu)據的質量。

這種閉環的運作方式不斷為其基座模型提供支持,讓Intern-S1既能擁有強大的通用推理能力,又具備多項專業能力,從而實現了“一個模型就能解決多項專業任務”這一科學智(zhi)能領域(yu)的突(tu)破(po)。

跳出技術角度,陳愷特別補充,科學領域的前沿突破,往往需要不同專業能力的交叉融合遷移,通專融合能更好促進未來科學發現。

陳愷還介紹,Intern-S1的研發團隊在訓練系統算法兩方面一起下功夫搞創新,成功讓大型多模態MoE(混合專家)模型在FP8精度下,能高效又穩定地進行強化學習訓練,而且訓練成本比最近公開的其他MoE模型低了10倍

從系統層面來看,Intern-S1用了訓推分離的RL方案,靠自己研發的推理引擎來進行FP8精度的大規模異步推理,效率很高;還通過數據并行均衡策略,減輕了長思維鏈解碼時出現的長尾問題。訓練的時候用了分塊式FP8訓練,效率提升不少,這套(tao)訓練系統之后(hou)也會開(kai)源。

再看算法方面,基于Intern·Bootcamp搭建的大規模多任務交互環境,研發團隊提出了“Mixture of Rewards”混合(he)獎(jiang)勵學(xue)習(xi)算(suan)法,能把多種獎(jiang)勵和(he)反饋信號(hao)融合(he)到一起(qi),聽起(qi)來有點像(xiang)“因(yin)材施教(jiao)”。

比如在容易驗證的任務上,就用RLVR模式來訓(xun)練(lian),通過規則、驗證器或(huo)者交互環(huan)境來提(ti)供獎(jiang)勵(li)信號;而像對話、寫作這(zhe)類不好驗證的任務,就用獎(jiang)勵(li)模型(xing)給出的獎(jiang)勵(li)信號來一(yi)起訓(xun)練(lian)。

三、能查科研數據,還能聯機實驗設備,科學發現平臺同步推出

在落地應用上,智東西發現,以Intern-S1為底座的『書生』科學發現平臺Intern-Discovery也同步推出了。

Intern-Discovery以Intern-S1為核心,整合了專業智能體、海量科研數據及實驗設備,可以給全球研究者提供從假設到驗證的一站式科研支撐,目前平臺已開放全球試用申請

萬物皆可“邪修”?科研黨靠這個開源大模型“開掛”:能解化學題、能分析AFM圖,有8B輕量版還能二次開發

陳愷向智(zhi)東(dong)西透露,實驗室非常(chang)歡迎與各大高校和(he)研(yan)究所等機構進行深度合作(zuo)。

根據公(gong)開信息(xi),在Intern-Discovery的基礎上,上海(hai)AI實驗(yan)室(shi)聯合臨港實驗(yan)室(shi)、上海(hai)交通大學(xue)、復旦大學(xue)、MIT等研究機(ji)構,共(gong)同(tong)參與(yu)構建了多智能(neng)體(ti)虛擬疾病學(xue)家系(xi)統“元生”(OriGene)。

在治療癌癥上,OriGene的作用非常大。目前,其僅用了兩個月就已在肝細胞癌和全球第三大癌癥的結直腸癌治療上分別提出兩個新靶點GPR160和ARG2,并已在臨床(chuang)樣本(ben)、類器官(guan)和(he)人(ren)源(yuan)化動物實驗中得到驗證(zheng)。

結語:Intern-S1展現AI賦能科學新圖景

隨(sui)著(zhu)技術(shu)的持續迭代,科(ke)研人員與(yu)AI工具的協同將進一(yi)步深化。通用大模型與(yu)專用模型的優勢互(hu)補(bu),可能在更多科(ke)學(xue)領域發揮作用。

Intern-S1所(suo)采用的(de)(de)“通專融合”技術(shu)路徑,為平衡模型的(de)(de)通用性(xing)(xing)與專業性(xing)(xing)提(ti)供了一種實踐(jian)方案,AI技術(shu)與科(ke)學研(yan)究的(de)(de)結合不斷(duan)拓展著科(ke)研(yan)手(shou)段的(de)(de)邊界。