智東西(公眾號:zhidxcom)
編譯 | 屈望苗
編輯 | 江心白

智東西4月3日消(xiao)息,據The Verge報道,OpenAI最近宣(xuan)布,其人(ren)工智能(neng)文(wen)本生成(cheng)器GPT-3現已被數(shu)萬開發者用于300多個不同的(de)應(ying)用程序(xu),每天輸(shu)出45億(yi)詞之多。

報(bao)道稱,雖然GPT-3生成的大(da)部(bu)分(fen)文本都(dou)很生澀,但如此(ci)大(da)的輸(shu)出(chu)量(liang)也反映出(chu),AI文本生成技(ji)術的規(gui)模、影響和商業潛力正在(zai)不斷增(zeng)長。

一、約2000億個單詞的訓練,讓機器“開口說話”

GPT-3的全稱叫生成預訓(xun)練轉換器-3 (Generative Pretrained Transformer-3),這套強(qiang)大的“大型(xing)語言模型(xing)”于2020年6月問世,訓(xun)練了大約2000億個單詞,估計花(hua)費了數千萬美元(yuan)。

目(mu)前(qian),文(wen)本生成(cheng)是機(ji)器學(xue)(xue)習(xi)的一(yi)大(da)趨勢。人(ren)(ren)工(gong)智能(neng)系(xi)統從(cong)互聯(lian)網上抓取大(da)量的單詞進(jin)行學(xue)(xue)習(xi),并(bing)根據各種提(ti)示生成(cheng)文(wen)本。學(xue)(xue)習(xi)完成(cheng)后(hou),機(ji)器就可以實現(xian)一(yi)系(xi)列功能(neng),比如創作小(xiao)說(shuo)、編寫(xie)潦(liao)草的代碼,以及讓用戶對話歷史人(ren)(ren)物等。

二、眾多公司申請使用GPT-3通用API以構建服務

獲(huo)取GPT-3底(di)層代碼(ma)是(shi)OpenAI的一(yi)項商(shang)業服(fu)務(wu)。GPT-3與微軟簽訂了(le)獨家協議,允許微軟獨家訪問(wen)GPT-3程序的底(di)層代碼(ma)。

不過,任(ren)何(he)公司(si)都(dou)可以申(shen)請使用GPT-3的通用API,并(bing)在此基礎上(shang)構建(jian)服務(wu)。目前已經(jing)有數百(bai)家公司(si)這樣做了。

美國(guo)一家名為Viable的(de)客戶反(fan)饋分析公(gong)司采用(yong)了(le)GPT-3,從調查、服務(wu)臺票、實(shi)時聊天記(ji)錄和評論中識別出“主題和情緒”;美國(guo)的(de)AI虛擬(ni)形(xing)象公(gong)司Fable Studio使用(yong)這個程序實(shi)現了(le)用(yong)戶跟虛擬(ni)形(xing)象的(de)對話(hua);美國(guo)舊金山(shan)的(de)人工智能搜(sou)索平臺Algolia也在用(yong)它改進(jin)自己的(de)網絡搜(sou)索產品,然后賣給(gei)其他客戶。

三、難逃同質化、文本質量堪憂,應用仍存難點

GPT-3的大(da)量(liang)使用對OpenAI以(yi)及微(wei)(wei)軟來說都是(shi)好消息,因為(wei)微(wei)(wei)軟Azure云計算平臺能夠為(wei)OpenAI提(ti)供更強大(da)的技(ji)術支持,但(dan)并非(fei)所有(you)創(chuang)業公司都對此感興趣。

據分(fen)析(xi)人(ren)士觀點,如果不(bu)是(shi)真正擁有這項技術,那么一家(jia)公(gong)司全靠GPT-3來(lai)構(gou)建(jian)業務是(shi)十分(fen)不(bu)明智的選(xuan)擇。

主要原因在于,盡管使用GPT-3能(neng)讓(rang)公(gong)司(si)和業務的(de)創建更加簡(jian)單,但自己的(de)競(jing)爭對手也同樣(yang)能(neng)這么做。就(jiu)算能(neng)通過品牌和用戶界面讓(rang)公(gong)司(si)業務打出差異化(hua),技術背后所產生(sheng)的(de)大量(liang)收益還是歸OpenAI所有。

與此同時(shi),GPT-3的智(zhi)能(neng)文本輸出質量也(ye)存(cun)在(zai)令人(ren)擔憂的問(wen)題。和(he)許多算法一樣,GPT-3也(ye)會(hui)(hui)吸收和(he)放大(da)有(you)害(hai)的偏(pian)見(jian),這有(you)時(shi)會(hui)(hui)讓它犯下“愚蠢的錯(cuo)誤”。例(li)如(ru),在(zai)使(shi)用GPT-3構(gou)建(jian)的醫療聊天機器人(ren)進行測試時(shi),該模型曾鼓勵“有(you)自(zi)殺傾向”的病人(ren)去自(zi)殺。

日產45億詞!“地表最強語言模型”GPT-3已落地300多個應用

▲測試中(zhong),GPT-3鼓(gu)勵有自殺傾向的(de)用(yong)戶言(yan)論(lun)

去年(nian)9月4日,蒙特雷的米(mi)德爾伯里國際研究(jiu)所的兩名研究(jiu)人員在airXiv平臺上發布了一篇論文(wen),文(wen)章提(ti)到,GPT-3在生成激進文(wen)本方面遠遠超(chao)過上一個版本GPT-2。對(dui)此,OpenAI也在開(kai)發工具,幫(bang)助(zhu)用戶更好地控制GPT-3生成文(wen)本。

結語:機器對話來臨,還需摸索前進

OpenAI的“45億字(zi)”里程碑說明了,像(xiang)GPT-3這樣(yang)的智能文本(ben)生成工(gong)具目前已經在大量(liang)生成機器對話(hua),并(bing)且已經被開發(fa)者(zhe)大量(liang)地采(cai)用。

但當前來看,實際(ji)應用(yong)中算(suan)法(fa)還是(shi)會(hui)造成錯誤、不公和偏見,過于(yu)依賴算(suan)法(fa)未必(bi)是(shi)好事。這(zhe)類問題仍然值得關注,因為AI文(wen)本生成的機(ji)器對話還會(hui)繼續下去、甚(shen)至愈(yu)演(yan)愈(yu)烈。

或許(xu)在未來(lai),我們會迎來(lai)一個充滿機器(qi)人生成對話的世界。

來源:The Verge