智東西(公眾號:zhidxcom)
編譯 | 屈望苗
編輯 | 江心白

智(zhi)東西(xi)5月8日(ri)消息,在上周舉行的美國填字(zi)游(you)(you)戲錦(jin)標賽(American Crossword Puzzle Tournament,ACPT)上,一位人工智(zhi)能選手從1000多名參(can)賽者(zhe)中脫穎而(er)出,獲得勝(sheng)利,它(ta)就是填字(zi)游(you)(you)戲程序“菲爾博士(Dr. Fill)”。

盡管在兩道題(ti)上出現了錯誤,但Dr. Fill仍(reng)在一分(fen)鐘(zhong)內完成了游(you)戲,比最快(kuai)的人類參賽者快(kuai)了整整兩分(fen)鐘(zhong)。Dr. Fill的背后有(you)著加州(zhou)大(da)(da)學伯克利(li)分(fen)校(UC Berkeley)伯克利(li)自然語言(yan)處(chu)理小組(zu)的強大(da)(da)支持,它會分(fen)析題(ti)目線索(suo)生成答(da)案(an)列表(biao),并(bing)根(gen)據數據庫中的800多萬組(zu)線索(suo)和答(da)案(an)來解謎。

一、神經網絡與數據庫加持

Dr. Fill是(shi)由(you)計算機科學家馬(ma)特·金斯伯格(ge)(Matt Ginsberg)制作的,他同時也是(shi)一名填字(zi)游戲制作者。

自(zi)2012年以來,金斯伯(bo)格就開(kai)始(shi)讓Dr. Fill非正式地參加ACPT,并在每(mei)年的(de)比賽(sai)中對它(ta)的(de)軟件進行(xing)改(gai)進。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲馬特·金(jin)斯伯(bo)格(Matt Ginsberg)和Dr. Fill

而(er)在今(jin)年,金(jin)斯伯(bo)格與加州大(da)學伯(bo)克(ke)利分校(UC Berkeley)的伯(bo)克(ke)利自然語言處理小(xiao)組合作,該(gai)小(xiao)組由教(jiao)授丹·克(ke)萊恩(en)(Dan Klein)領導的研(yan)究生和本科生組成。

克萊恩是(shi)自然語言處(chu)理(li)和無監(jian)督學習領域的(de)專家(jia),他曾獲(huo)得2016 AMiner自然語言處(chu)理(li)領域十大(da)最(zui)具影響力學者(zhe)獎(jiang)。AMiner是(shi)由清華(hua)大(da)學創(chuang)立的(de)新(xin)一代智能(neng)型科技情報平臺。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲丹·克萊(lai)恩(Dan Klein)

就在ACPT開始前兩周,他們共同為Dr. Fill開發(fa)了一個混合系統。其中,伯(bo)克利小組用神經網絡的方(fang)法來(lai)(lai)幫助(zhu)Dr. Fill分析線索,而金斯伯(bo)格編寫(xie)了用來(lai)(lai)填寫(xie)游戲(xi)網格的代碼。

Dr. Fill還有一(yi)個包含(han)800多萬條線(xian)索(suo)和(he)答案的訓練數據(ju)庫,這(zhe)些數據(ju)來自以往在各種媒(mei)體上(shang)出現過的填(tian)字游戲(xi)。為了解決(jue)謎題,它的程序會參考以往的線(xian)索(suo)和(he)答案。

和(he)人類一樣,當面對(dui)新的(de)(de)挑戰時,Dr. Fill必須(xu)依靠經(jing)驗,尋找新舊問題之間的(de)(de)聯系。

例如,ACPT 2021中第二題(ti)的答案(an),就是(shi)(shi)一(yi)個長單詞后加上后綴-ITY構(gou)成的新詞。不過幸運(yun)的是(shi)(shi),類似的題(ti)目曾出現在2010年《洛杉磯時報(the Los Angeles Times)》發表(biao)的一(yi)個填字(zi)游(you)戲中,Dr. Fill的數據(ju)庫當中包含了這道題(ti),所以(yi)它順(shun)利地解出了答案(an)。

二、會分析題目線索,還能篩選答案

盡管Dr. Fill的數據庫十分龐(pang)大,但它并不能靠“抄作業”拿第一。

在實際的(de)(de)解題(ti)過程中,Dr. Fill會分(fen)析題(ti)目(mu)線索(suo),并(bing)生(sheng)成與題(ti)目(mu)線索(suo)匹配的(de)(de)候選答(da)案列表,根據可能(neng)性對它們(men)進行排序(xu),并(bing)檢查它們(men)是否能(neng)填字游戲(xi)網(wang)格(ge)中和其他單詞恰當連接。只要題(ti)目(mu)給出(chu)(chu)了足夠的(de)(de)上下文語境(jing),Dr. Fill就能(neng)最終(zhong)解出(chu)(chu)正確答(da)案。

例如,對于“imposing groups”這個線(xian)索(suo),Dr. Fill將(jiang)正確(que)的答案“ARRAYS”列為首選詞。“imposing”一詞從未出(chu)現在與(yu)正確(que)答案相(xiang)關的線(xian)索(suo)中(zhong),但(dan)這些(xie)線(xian)索(suo)中(zhong)出(chu)現過(guo)其(qi)他同義(yi)詞,如“impressive”,這使(shi)Dr. Fill可以推斷出(chu)語義(yi)上的聯(lian)系,并解出(chu)正確(que)答案。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲Dr. Fill從題目線索直(zhi)接推斷(duan)出正確答(da)案

Dr. Fill還會將(jiang)字(zi)母(mu)進行交叉(cha)比對來篩選正確(que)答(da)案(an)。比如,在五(wu)個(ge)字(zi)母(mu)的答(da)案(an)中,知道第(di)二個(ge)字(zi)母(mu)是(shi)O,答(da)案(an)的線(xian)索是(shi)“Aw, that’s a shame!(太可(ke)惜了(le)!)”,它就可(ke)以找到正確(que)的答(da)案(an)“SO SAD”。

AI贏得填字游戲冠軍!打敗1000多名人類選手

▲Dr. Fill將字母(mu)進行交叉(cha)比對來(lai)篩選答案

題目中(zhong)涉(she)及雙關(guan)語(yu)或其他(ta)文字(zi)游戲(xi)的(de)線(xian)索會(hui)比較麻煩,不過(guo),伯克利的(de)神經網絡系統使(shi)Dr. Fill能(neng)夠識別出這類線(xian)索。克萊恩解釋說,雖(sui)然這些(xie)語(yu)義(yi)上的(de)把戲(xi)無法(fa)明確(que)地教給(gei)Dr. Fill,但通過(guo)機器學習,它能(neng)明白要尋找沒有(you)常規線(xian)索那(nei)么(me)直接的(de)選項。

三、人腦仍勝在跳躍性邏輯

《紐(niu)約時(shi)報》的(de)填字游戲編輯威爾(er)·肖茨(Will Shortz)指出(chu),今年的(de)ACPT可能發揮了Dr. Fill的(de)優(you)勢,因為“每一個答案都是語義(yi)簡單(dan),很好(hao)理解(jie)的(de)”。肖茨說(shuo),他(ta)對(dui)Dr. Fill的(de)獨創性感(gan)到敬畏,但(dan)他(ta)認為人類參賽者在很多(duo)方面仍有優(you)勢。

他說(shuo):“現在,仍然(ran)是人類更擅長(chang)像(xiang)填(tian)字游戲這樣非邏輯(ji)的現實世界(jie)問題(ti)(ti)。”在他看來,即使是在比較(jiao)簡單的題(ti)(ti)目中,Dr. Fill仍然(ran)會(hui)犯一些(xie)人類不會(hui)犯的錯誤。

克萊(lai)恩也看到(dao)了這一(yi)點,同時他也提到(dao),在(zai)自然語言(yan)處理領域經常會出現類似的(de)(de)挑戰。例如,人(ren)(ren)類的(de)(de)大(da)腦經常進行所謂的(de)(de)“多跳推理”,就是(shi)說,人(ren)(ren)腦會利(li)用很多不(bu)直接(jie)相關的(de)(de)知識完(wan)成一(yi)個跳躍性的(de)(de)推理。

而要(yao)教會人(ren)工(gong)智能(neng)遵循這(zhe)(zhe)樣的(de)(de)邏輯(ji)跳躍,就意味(wei)著人(ren)們要(yao)從(cong)很(hen)多間(jian)接表(biao)意的(de)(de)語言中(zhong)提取并歸(gui)納(na)出表(biao)達的(de)(de)邏輯(ji)。但在當下,Dr. Fill仍然難以(yi)理解(jie)這(zhe)(zhe)些不是“大白話”的(de)(de)語言。

克(ke)萊恩認(ren)為,Dr. Fill這次的表現只是我們從填字游戲的線索中解讀自然語(yu)言意義的第(di)一步(bu)。當涉及到表意特別委婉的語(yu)言樣本時(shi),克(ke)萊恩說(shuo):“那(nei)些難(nan)倒(dao)人們的語(yu)言更會難(nan)倒(dao)Dr. Fill。”

結語:AI自然語言處理進階,從輸出到“思考”

Dr. Fill在(zai)APCT中的(de)勝利標(biao)志了人工智能在(zai)自然(ran)語(yu)言處理方面的(de)進步。也就是說(shuo),人工智能已經不僅可以實現(xian)簡單的(de)自然(ran)語(yu)言交(jiao)流(liu),而且還能“理解”比(bi)較復雜的(de)語(yu)義(yi)、“思考”如何解謎(mi)。

在未來,隨著科學家們對(dui)自然語(yu)言的意義拆解更(geng)(geng)加深入和(he)系統化,這些人工智能(neng)的“思考”能(neng)力或許還會(hui)更(geng)(geng)接近人腦、更(geng)(geng)加強大。

來源:Wired