
智東西(公眾號:zhidxcom)
編譯 |? 徐豫
編輯 |? 心緣
智東西10月12日消息,全球頂尖科(ke)(ke)學(xue)學(xue)術期(qi)刊《Nature》于10月10日發表了一篇科(ke)(ke)學(xue)家利用人工(gong)(gong)智能(AI)工(gong)(gong)具做科(ke)(ke)學(xue)研究(jiu)(jiu)的行業觀察,發現AI工(gong)(gong)具正在(zai)改變(bian)傳統的科(ke)(ke)研工(gong)(gong)作方式。目前,許多AI工(gong)(gong)具可以幫研究(jiu)(jiu)人員在(zai)大量文獻中(zhong)篩(shai)選出(chu)所需資料,從而使科(ke)(ke)學(xue)研究(jiu)(jiu)更加高效。
這些用于科學研究(jiu)檢索(suo)的(de)AI工(gong)具基于大語言模型(LLM),其不(bu)僅可(ke)(ke)以(yi)搜集、篩(shai)選現(xian)(xian)有研究(jiu)文獻(xian),還可(ke)(ke)以(yi)總結(jie)、列舉文中的(de)關(guan)鍵發現(xian)(xian)。背后的(de)AI公司不(bu)斷(duan)提升這些模型的(de)性能,并定期推(tui)出(chu)新的(de)AI工(gong)具。
《Nature》雜(za)志(zhi)采(cai)訪了(le)多位(wei)AI科學檢(jian)索工(gong)具的開發者和使(shi)用(yong)者后,匯集了(le)他(ta)們的實(shi)際上(shang)手體驗,以及使(shi)用(yong)這些AI工(gong)具的潛在風(feng)險。
一、科學家用AI工具了解科研方向、收集科研資料、撰寫文獻綜述
據《Nature》統計,市(shi)面上(shang)最受歡迎的(de)AI科學檢索工具包(bao)括Elicit、Consensus和You,它們(men)為研究人員(yuan)提供了多種(zhong)高(gao)效完成文獻綜述的(de)方式。
1、美國AI論文生成公司Elicit:自動化完成文獻綜述
當研究(jiu)人員在Elicit中輸入一個研究(jiu)問題后,該(gai)AI工具會(hui)列出相關論文,并總結這些論文的主要發(fa)現。
在此基(ji)礎(chu)上,研(yan)究人員(yuan)還可以針對某(mou)(mou)一(yi)(yi)篇(pian)論文繼續提(ti)問,以及指定留下某(mou)(mou)一(yi)(yi)本期刊或某(mou)(mou)一(yi)(yi)種研(yan)究類型的內容。
2、美國AI學術搜索引擎公司Consensus:可視化科研行業共識
公司同名(ming)AI工具Consensus可(ke)以幫研究人員搜(sou)集(ji)、整理(li)科學界對某個科學課題有(you)哪(na)些說法和爭議。
舉個例子,當(dang)研(yan)究(jiu)人員輸入“氯胺(an)酮可以治療抑(yi)郁癥嗎(ma)”這個問題后,該(gai)AI工具會(hui)生成一(yi)個“Consensus meter(共識度(du)(du)量器)”,其會(hui)總(zong)結支持、反對(dui)或不確定該(gai)假設的論點和論據,以顯示科學界(jie)對(dui)上述問題的共識程度(du)(du)。
▲Consensus meter(共(gong)識(shi)度量器(qi))可以更直觀地展示科研(yan)行業共(gong)識(shi)(圖源:《Nature》)
Consensus的首席執行官Eric Olson(埃里克·奧(ao)爾森(sen))稱,其AI工具雖然(ran)不能替代研究人員去深(shen)入(ru)分(fen)析論文(wen)內容,但可以有效幫助他們(men)速覽研究動態(tai)并歸納主流研究方向。
3、美國AI學術搜索引擎公司You:個性化科研研究
You方面自稱其(qi)同名AI工具“You”,是第一(yi)個結(jie)合(he)了文獻最新(xin)引(yin)用數(shu)據(ju)的(de)AI檢(jian)索工具。該(gai)AI工具為研究人員提供(gong)了探索研究問題的(de)多種模式(shi),例如(ru)其(qi)“genius mode(天(tian)才(cai)模式(shi))”會以圖表的(de)形式(shi)反饋檢(jian)索結(jie)果。
上(shang)個月,You還推出了一款允許多人協作的(de)AI工(gong)具。研發(fa)人員(yuan)可以合作定制、共享個性化的(de)AI聊天框,令其自動執行諸(zhu)如事實核查之類的(de)特定任務。
二、AI科研檢索工具支持多語種,有望打破學術交流語言壁壘
除(chu)了熱(re)門的Elicit、Consensus和(he)You外,其他AI檢索工具也在探索利用AI技術(shu)提(ti)升科研效(xiao)率的更多應用場景。
美國(guo)AI生(sheng)物學(xue)(xue)知識問答(da)平臺(tai)BioloGPT能夠針對生(sheng)物學(xue)(xue)問題,生(sheng)成總結性的、更有深(shen)度的回答(da),是大量垂直于單一學(xue)(xue)科的AI工具之一。
今年9月,英國一站式(shi)(shi)科研(yan)服務公司Clarivate推出了一個(ge)AI檢索(suo)(suo)工(gong)(gong)具(ju),研(yan)究人員可以用其快(kuai)速調用Web of Science數據庫中的內容(rong)。Clarivate方面稱,基于該AI檢索(suo)(suo)工(gong)(gong)具(ju),研(yan)究人員輸入一個(ge)研(yan)究問題后(hou),可以以圖(tu)譜的形式(shi)(shi)查看(kan)相關(guan)的論文摘要、科研(yan)主題和引用文獻,并且能(neng)看(kan)到每一篇參考(kao)文獻的標注(zhu),從而更高效地找出關(guan)鍵論文及其論點。
此(ci)外,即(ji)便Web of Science中(zhong)收錄的(de)(de)是(shi)英文論(lun)文,Clarivate的(de)(de)AI檢(jian)索工具(ju)也可(ke)以用英語(yu)外的(de)(de)其他語(yu)言(yan)總(zong)結(jie)論(lun)文中(zhong)的(de)(de)關鍵(jian)信(xin)息。在Clarivate產(chan)品副(fu)總(zong)裁Francesca Buckland(弗朗西斯卡·巴克蘭德)看(kan)來,將多語(yu)言(yan)的(de)(de)翻譯(yi)能力融入AI檢(jian)索工具(ju)背后的(de)(de)大模型中(zhong),是(shi)一件(jian)“非常(chang)具(ju)有潛力”的(de)(de)事情,它可(ke)以減少全(quan)球科研(yan)資源不平等(deng)的(de)(de)情況。
▲研究(jiu)人員可以用Clarivate的(de)AI工(gong)具,梳理Web of Science數(shu)據庫(ku)中的(de)內容(圖(tu)源:《Nature》)
三、建議利用AI檢索工具各自的優勢查資料,但要記得核查
當被《Nature》問及“最好用的AI檢索(suo)工具是什么”時,加(jia)拿大流行病學(xue)家Razia Aliani(拉齊婭·阿利(li)亞尼)說:“我認為(wei)這通常取(qu)決于(yu)實(shi)際研(yan)究(jiu)目的。”目前(qian)她在(zai)澳大利(li)亞一家非營利(li)性的文獻綜述公(gong)司(si)工作,公(gong)司(si)名(ming)為(wei)Covidence。
如(ru)果需要(yao)了解某個科研主題的不同觀點和共識,Aliani會傾向于使用Consensus。但要(yao)審核大型數據庫時,她(ta)會選擇用其(qi)他AI檢索工具(ju),比(bi)如(ru)Elicit。
在Elicit上(shang)拋出(chu)初(chu)(chu)始(shi)研究(jiu)方向(xiang)后,Aliani會根據(ju)該AI工具的(de)檢(jian)索結果,排除與研究(jiu)方向(xiang)無關(guan)(guan)的(de)論(lun)文(wen),然后深入剩余的(de)關(guan)(guan)聯(lian)性更(geng)強的(de)文(wen)獻,以微調初(chu)(chu)始(shi)研究(jiu)方向(xiang)。
她認為,AI科研(yan)檢索工具不僅節省了時間,還(huan)能提高(gao)科研(yan)工作質量、激發創造力并(bing)減輕(qing)科研(yan)壓力。
Anna Mills(安娜(na)·米爾斯)在美國加利福(fu)尼亞州的(de)馬林學(xue)院(yuan)教授基礎(chu)寫作課(ke)程,平常也會涉及有關如何開展(zhan)研(yan)究過程的(de)課(ke)程。她雖然很想(xiang)向學(xue)生推薦這些AI檢索(suo)工具(ju),但同時也擔心這些工具(ju)會妨礙(ai)學(xue)生深入理(li)解一些學(xue)術研(yan)究。
相(xiang)較于用(yong)AI檢索工具獲取科研信(xin)息,她(ta)更希望教會學生(sheng)如何辨別AI檢索結果(guo)中的錯誤(wu),從而培(pei)養他們辯證使用(yong)AI工具的能力。
美國AI生(sheng)物學知識問答平(ping)臺BioloGPT的(de)創始人Conner Lambden(康納·蘭登(deng))也(ye)認(ren)為(wei)(wei):“學會對一切事物保持懷疑態度,包括(kuo)你(ni)自(zi)己在用的(de)研(yan)究方法,是成為(wei)(wei)一名優秀(xiu)的(de)科學家的(de)必經之路。”
四、AI錯誤引用文獻,有科學家因此停用,開發者正補救
AI大(da)模型在檢索(suo)過程中時不時出(chu)現“幻覺”,已(yi)是一個老生(sheng)常談(tan)的問題。在AI界,“”幻覺(Hallucination)”是指(zhi)AI模型編(bian)造、引用、輸出(chu)一些具(ju)有(you)誤導性的、虛(xu)假的、無中生(sheng)有(you)的信息(xi)。
而對于ChatGPT等(deng)主(zhu)流AI聊天機(ji)器人回答準確性的擔憂,也蔓延到了AI科學(xue)檢(jian)索(suo)工(gong)具(ju)上。多位研究人員提醒應(ying)謹(jin)慎使(shi)用這些AI科學(xue)檢(jian)索(suo)工(gong)具(ju)。
用AI檢索工具做(zuo)科研(yan)時,常見(jian)的(de)錯(cuo)誤有編造統計數據、誤解(jie)引用的(de)論文、AI大模型的(de)偏見(jian)。
體育(yu)科(ke)學(xue)家(jia)Alec Thomas(亞歷克·托馬斯)目前在瑞士的洛(luo)桑大學(xue)做(zuo)研究,他曾一度“非(fei)常欣賞AI檢索(suo)工具”。
然(ran)而,在親自試用一些AI檢索工(gong)具后(hou),他的態度卻發生了180度大轉(zhuan)彎。Thomas決定(ding)放棄(qi)使用這些AI檢索工(gong)具,原因是他發現AI生成的答案中有“非常嚴(yan)重(zhong)的基(ji)礎性錯誤”。
例如,他用AI檢(jian)索工具(ju)研究(jiu)“參與體(ti)育活動對患有飲食失調的(de)人的(de)影響(xiang)”時,AI引(yin)用了一篇與研究(jiu)問題毫無關系的(de)論(lun)文(wen)來(lai)生成研究(jiu)結(jie)論(lun)。
Thomas直言:“我們不(bu)會相信一(yi)個公認可能隨時會出現(xian)幻覺的人(ren)類(lei),那又憑什么去(qu)相信有(you)類(lei)似癥(zheng)狀(zhuang)的AI呢?”
據多(duo)位接(jie)受《Nature》采訪的(de)AI檢(jian)索工(gong)具開(kai)發者透露,他們已經(jing)采取了安(an)全(quan)措施,以提高AI檢(jian)索的(de)準確性。
美國AI論(lun)文(wen)生成(cheng)公司Elicit的(de)項目開發負(fu)責人(ren)James Brady(詹姆斯·布拉迪)稱,該(gai)公司十(shi)分重視AI檢索工具的(de)準確(que)性問(wen)題,正在使用多個(ge)安全(quan)系統檢查AI回答中的(de)錯誤。
英國一站式科研服務(wu)公(gong)司Clarivate產品副(fu)總裁Buckland則稱,Web of Science的(de)(de)AI工具有“可(ke)靠(kao)的(de)(de)保護機(ji)制”,以(yi)規避AI生成帶有欺騙性的(de)(de)、不準確的(de)(de)內容。在測試(shi)期間,她(ta)的(de)(de)研發團隊曾與大約1.5萬名研究人(ren)員共(gong)同整(zheng)合反饋,以(yi)調(diao)試(shi)AI檢索(suo)的(de)(de)準確性。
盡(jin)管經過開發者(zhe)的(de)(de)不(bu)斷糾(jiu)偏(pian),AI檢索(suo)工(gong)具的(de)(de)使用體驗有所改善,美國AI學術搜索(suo)引擎公司Consensus的(de)(de)CEO Olson卻認為,這非但不(bu)能(neng)根治(zhi)AI的(de)(de)“幻(huan)覺”,還可能(neng)會加(jia)重“病情”。
Olson解(jie)釋道,通過人(ren)為反饋調試的(de)AI檢索(suo)工(gong)具,傾向于得出對人(ren)類有益的(de)答案,并且會(hui)因此自(zi)主填補一些不存(cun)在的(de)事實。
結語:未來的AI工具需要比拼專業度
從《Nature》的(de)調查中(zhong),我(wo)們可以(yi)看到AI檢索的(de)應(ying)用(yong)場(chang)景,已(yi)經逐漸向細分(fen)領域滲透。
這(zhe)也意味著(zhu),類似(si)于(yu)AI科研檢索領域,未來AI大模型及其(qi)產品對專業性(xing)、準確性(xing)有著(zhu)更(geng)嚴格的要求。
目前來看(kan),面向專(zhuan)業(ye)領域微調后的(de)AI模(mo)型,出現“幻(huan)覺”的(de)概(gai)率和頻率會有(you)所降(jiang)低,而其存在的(de)偏見問題則不能光靠(kao)技術更新(xin)來解(jie)決。
李飛(fei)飛(fei)于2015年聯(lian)合創建了AI4All項目,旨在吸納更(geng)多(duo)諸如女(nv)性、有色人(ren)種、工薪階層的(de)(de)AI人(ren)才,以減輕開發AI大模型(xing)過程中存在的(de)(de)偏見(jian)。
Andrew Hoblitzell(安(an)德魯·霍布里策爾)是印度的一名生成(cheng)式AI研究人員,他已在(zai)多所(suo)大(da)學開設了圍(wei)繞AI4All項目的講座。
在(zai)他(ta)看來,AI檢索工具可以在(zai)一定程(cheng)度(du)上為科研過程(cheng)提供(gong)支(zhi)持,但前提是科學(xue)家(jia)要(yao)親自(zi)驗(yan)證過AI生成的信息。
Hoblitzell稱(cheng):“現階(jie)段,這些AI檢索工具應該是科研的輔助(zhu)工具,而(er)不是最終(zhong)的成果來(lai)源。”
來(lai)源:《Nature》