
智東西(公眾號:zhidxcom)
編 | 季瑜生
導語:利用AI技術,結合網站歷史評估、外部渠道評價以及文本分析,麻省理工大學團隊推出了準確率高達65%的假新聞檢測系統。
智(zhi)東西10月(yue)8日(ri)消息,近日(ri),麻省理(li)工(gong)大學團(tuan)隊聯合塔爾計算(suan)所(suo)宣布將利(li)用人工(gong)智(zhi)能(neng)進行假(jia)新聞鑒(jian)別,準確率可(ke)達65%。
“真(zhen)實”作(zuo)為新聞最基本的(de)(de)(de)要(yao)素,在當下(xia)卻變得益發(fa)稀缺(que)。無論(lun)是(shi)(shi)早(zao)些年(nian)的(de)(de)(de)震驚(jing)業界的(de)(de)(de)珍(zhen)妮特.庫(ku)克事(shi)件還是(shi)(shi)近(jin)些年(nian)各種網站以及(ji)社交媒體(ti)上層(ceng)出不窮的(de)(de)(de)小道消息,人們生活的(de)(de)(de)信息世界里正充斥著大量無法辨別的(de)(de)(de)虛假信息。
三月份(fen)的(de)(de)一個調查顯示,有一半(ban)的(de)(de)美國人都在新聞網站上見(jian)到過有偏向性的(de)(de)新聞,而多(duo)數的(de)(de)受訪者則(ze)表示無(wu)法(fa)辨別新聞的(de)(de)真實性。
那么該(gai)如(ru)何辨別這些虛假消息呢?麻省理工學院的研究(jiu)人員以(yi)及(ji)塔爾(er)計(ji)算所宣布已經創建了一個可以(yi)鑒(jian)別信息來(lai)源(yuan)以(yi)及(ji)可信度、偏見程度的AI系統。該(gai)系統將在于比利時布魯塞爾(er)舉行的2018年EMNLP大會上公開發(fa)布。
該系統搜集(ji)了(le)1,066個帶有Media Bias / Fact Check的網(wang)站開放(fang)數據集(ji)。然(ran)后根據網(wang)站本(ben)身的文章、維(wei)基百科頁面、Twitter帳戶甚至URL等來源,系統對新聞進行(xing)了(le)“真實程度(du)”“偏見程度(du)”的打分。
該系統的創見性在于采用了多維度(du)內容評測,除過文本內容提(ti)取外(wai)新聞(wen)來源、網(wang)絡數據流量結構、社交媒體評價都(dou)是重(zhong)要參考渠道。
▲MIT人工智能系統利用多維度(du)測(ce)評對信(xin)息真(zhen)實性(xing)進行(xing)核查
其中,維基百(bai)(bai)科是(shi)(shi)一(yi)個(ge)重要(yao)參(can)考渠道(dao)。一(yi)般維基百(bai)(bai)科里(li)網站(zhan)的詞條內容(rong)越長(chang),網站(zhan)內容(rong)的真實性也就越高(gao)。此外(wai),維基百(bai)(bai)科里(li)的標(biao)簽(qian)評價也是(shi)(shi)一(yi)大參(can)考要(yao)素,洋蔥新聞(wen)的維基百(bai)(bai)科頁面標(biao)記為(wei)偏左,Drudge Report的維基百(bai)(bai)科頁面標(biao)記則(ze)為(wei)保守。
另外(wai),值得(de)一(yi)提的是,該(gai)系統采用支持向量機(SVM)來評估新聞(wen)的真(zhen)實度與偏見程(cheng)度。其中(zhong),真(zhen)實性(xing)分為(wei)高、中(zhong)、低(di)三點,政治偏向性(xing)分為(wei)極左(zuo)(zuo)、左(zuo)(zuo)、中(zhong)偏左(zuo)(zuo)、中(zhong)偏右、右、極右七點。
▲MIT的(de)研究結果表明,具有“極(ji)端”偏見(jian)性(xing)(xing)和低(di)準確性(xing)(xing)的(de)出版物(wu)之(zhi)間(jian)存在相關性(xing)(xing)。
除過消息來源分(fen)(fen)析(xi)以(yi)外,內容分(fen)(fen)析(xi)也是一(yi)大主要(yao)方式,系(xi)統會在每個(ge)新聞網(wang)站上分(fen)(fen)析(xi)50到150篇文(wen)章,并對其(qi)中的語言進(jin)行(xing)檢(jian)查(cha)。
一些(xie)(xie)具有(you)明顯傾向性(xing)的新(xin)聞網站(zhan)為(wei)了挑起讀者的情(qing)(qing)緒(xu),相(xiang)較主流網站(zhan),經(jing)常會使用一些(xie)(xie)比(bi)較有(you)辨(bian)識(shi)度(du)的語(yu)言。比(bi)如(ru)假新(xin)聞網站(zhan)會經(jing)常使用一些(xie)(xie)夸張或者情(qing)(qing)緒(xu)化(hua)的詞(ci)語(yu),左傾媒體則會高頻(pin)使用“公平”“互惠”。
根據麻(ma)省理(li)工(gong)大(da)學團隊(dui)的說法,該系(xi)(xi)統(tong)只需(xu)要150篇文章(zhang)就可(ke)以(yi)確定是否可(ke)以(yi)對新(xin)的信源做出評估。通過(guo)這一系(xi)(xi)統(tong),AI在預測(ce)新(xin)聞真(zhen)實性方面具有(you)大(da)約65%的準確率,在檢測(ce)偏見(jian)程度時(shi)大(da)約有(you)70%的準確性。
不(bu)過,麻省理工大學(xue)并不(bu)是唯(wei)一使用人工智能(neng)來(lai)做(zuo)假(jia)新聞分(fen)析的(de)。
谷歌的Jigsaw人工(gong)智能(neng)系統會自動對(dui)讀(du)者的評論做出(chu)評價。Facebook則(ze)長期堅持利用人工(gong)智能(neng)技術來進行新(xin)聞篩查,近期還收購了總部位于倫敦的創業公(gong)司(si)Bloomsbury AI,以幫助(zhu)其識別假新(xin)聞。
不(bu)過一些專家對此也表示出了懷疑(yi)態度。
卡(ka)內基梅隆大學(xue)機器人(ren)研究(jiu)所(Carnegie Mellon University Robotics Institute)科學(xue)家Dean Pomerleau在接受(shou)外(wai)媒(mei)the Verge的采訪時(shi)表示,人(ren)工智能對(dui)于文本中一(yi)些(xie)比較隱(yin)晦的虛假信息(xi)以及偏向(xiang)性內容缺乏足夠的理解(jie)能力,但(dan)是這也正是辨別假新聞(wen)的時(shi)候(hou)最重要的技(ji)能之一(yi)。
盡管人們對于人工(gong)智能(neng)核(he)(he)查新(xin)聞(wen)真(zhen)實(shi)性的能(neng)力(li)表示懷疑,但是事實(shi)證(zheng)明(ming)人工(gong)核(he)(he)查的效果似乎也并不理(li)想。
今(jin)年,谷(gu)歌其新聞報道(dao)欄下(xia)線了“事實核查”(Fact Check)的標簽,因(yin)為此前有保守派媒體(ti)曾指責谷(gu)歌上(shang)經過了核查的新聞依舊存在著偏(pian)見嫌(xian)疑。
更令人灰心的是,根據Gartner預(yu)測(ce),如果維持當前現狀,人工智能(neng)也好人工核(he)查也好,都沒辦法跟上假新聞的制造速(su)度(du)。到2022年,發(fa)達國家的大多數人會看(kan)到比真(zhen)實信息還要多的虛假信息。
文(wen)章來(lai)源:pop sci 、venture beat