日产45亿词！“地表最强语言模型”GPT-3已落地300多个应用

智東西（公眾號：zhidxcom）
編譯 | 屈望苗
編輯 | 江心白

智東西4月3日消(xiao)息，據The Verge報道，OpenAI最近宣(xuan)布，其人(ren)工智能(neng)文(wen)本生成(cheng)器GPT-3現已被數(shu)萬開發者用于300多個不同的(de)應(ying)用程序(xu)，每天輸(shu)出45億(yi)詞之多。

報(bao)道稱，雖然GPT-3生成的大(da)部(bu)分(fen)文本都(dou)很生澀，但如此(ci)大(da)的輸(shu)出(chu)量(liang)也反映出(chu)，AI文本生成技(ji)術的規(gui)模、影響和商業潛力正在(zai)不斷增(zeng)長。

一、約2000億個單詞的訓練，讓機器“開口說話”

GPT-3的全稱叫生成預訓(xun)練轉換器-3 （Generative Pretrained Transformer-3），這套強(qiang)大的“大型(xing)語言模型(xing)”于2020年6月問世，訓(xun)練了大約2000億個單詞，估計花(hua)費了數千萬美元(yuan)。

目(mu)前(qian)，文(wen)本生成(cheng)是機(ji)器學(xue)(xue)習(xi)的一(yi)大(da)趨勢。人(ren)(ren)工(gong)智能(neng)系(xi)統從(cong)互聯(lian)網上抓取大(da)量的單詞進(jin)行學(xue)(xue)習(xi)，并(bing)根據各種提(ti)示生成(cheng)文(wen)本。學(xue)(xue)習(xi)完成(cheng)后(hou)，機(ji)器就可以實現(xian)一(yi)系(xi)列功能(neng)，比如創作小(xiao)說(shuo)、編寫(xie)潦(liao)草的代碼，以及讓用戶對話歷史人(ren)(ren)物等。

二、眾多公司申請使用GPT-3通用API以構建服務

獲(huo)取GPT-3底(di)層代碼(ma)是(shi)OpenAI的一(yi)項商(shang)業服(fu)務(wu)。GPT-3與微軟簽訂了(le)獨家協議，允許微軟獨家訪問(wen)GPT-3程序的底(di)層代碼(ma)。

不過，任(ren)何(he)公司(si)都(dou)可以申(shen)請使用GPT-3的通用API，并(bing)在此基礎上(shang)構建(jian)服務(wu)。目前已經(jing)有數百(bai)家公司(si)這樣做了。

美國(guo)一家名為Viable的(de)客戶反(fan)饋分析公(gong)司采用(yong)了(le)GPT-3，從調查、服務(wu)臺票、實(shi)時聊天記(ji)錄和評論中識別出“主題和情緒”；美國(guo)的(de)AI虛擬(ni)形(xing)象公(gong)司Fable Studio使用(yong)這個程序實(shi)現了(le)用(yong)戶跟虛擬(ni)形(xing)象的(de)對話(hua)；美國(guo)舊金山(shan)的(de)人工智能搜(sou)索平臺Algolia也在用(yong)它改進(jin)自己的(de)網絡搜(sou)索產品，然后賣給(gei)其他客戶。

三、難逃同質化、文本質量堪憂，應用仍存難點

GPT-3的大(da)量(liang)使用對OpenAI以(yi)及微(wei)(wei)軟來說都是(shi)好消息，因為(wei)微(wei)(wei)軟Azure云計算平臺能夠為(wei)OpenAI提(ti)供更強大(da)的技(ji)術支持，但(dan)并非(fei)所有(you)創(chuang)業公司都對此感興趣。

據分(fen)析(xi)人(ren)士觀點，如果不(bu)是(shi)真正擁有這項技術，那么一家(jia)公(gong)司全靠GPT-3來(lai)構(gou)建(jian)業務是(shi)十分(fen)不(bu)明智的選(xuan)擇。

主要原因在于，盡管使用GPT-3能(neng)讓(rang)公(gong)司(si)和業務的(de)創建更加簡(jian)單，但自己的(de)競(jing)爭對手也同樣(yang)能(neng)這么做。就(jiu)算能(neng)通過品牌和用戶界面讓(rang)公(gong)司(si)業務打出差異化(hua)，技術背后所產生(sheng)的(de)大量(liang)收益還是歸OpenAI所有。

與此同時(shi)，GPT-3的智(zhi)能(neng)文本輸出質量也(ye)存(cun)在(zai)令人(ren)擔憂的問(wen)題。和(he)許多算法一樣，GPT-3也(ye)會(hui)(hui)吸收和(he)放大(da)有(you)害(hai)的偏(pian)見(jian)，這有(you)時(shi)會(hui)(hui)讓它犯下“愚蠢的錯(cuo)誤”。例(li)如(ru)，在(zai)使(shi)用GPT-3構(gou)建(jian)的醫療聊天機器人(ren)進行測試時(shi)，該模型曾鼓勵“有(you)自(zi)殺傾向”的病人(ren)去自(zi)殺。

日產45億詞！“地表最強語言模型”GPT-3已落地300多個應用

▲測試中(zhong)，GPT-3鼓(gu)勵有自殺傾向的(de)用(yong)戶言(yan)論(lun)

去年(nian)9月4日，蒙特雷的米(mi)德爾伯里國際研究(jiu)所的兩名研究(jiu)人員在airXiv平臺上發布了一篇論文(wen)，文(wen)章提(ti)到，GPT-3在生成激進文(wen)本方面遠遠超(chao)過上一個版本GPT-2。對(dui)此，OpenAI也在開(kai)發工具，幫(bang)助(zhu)用戶更好地控制GPT-3生成文(wen)本。

結語：機器對話來臨，還需摸索前進

OpenAI的“45億字(zi)”里程碑說明了，像(xiang)GPT-3這樣(yang)的智能文本(ben)生成工(gong)具目前已經在大量(liang)生成機器對話(hua)，并(bing)且已經被開發(fa)者(zhe)大量(liang)地采(cai)用。

但當前來看，實際(ji)應用(yong)中算(suan)法(fa)還是(shi)會(hui)造成錯誤、不公和偏見，過于(yu)依賴算(suan)法(fa)未必(bi)是(shi)好事。這(zhe)類問題仍然值得關注，因為AI文(wen)本生成的機(ji)器對話還會(hui)繼續下去、甚(shen)至愈(yu)演(yan)愈(yu)烈。

或許(xu)在未來(lai)，我們會迎來(lai)一個充滿機器(qi)人生成對話的世界。

來源：The Verge

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

一、約2000億個單詞的訓練，讓機器“開口說話”

二、眾多公司申請使用GPT-3通用API以構建服務

三、難逃同質化、文本質量堪憂，應用仍存難點

結語：機器對話來臨，還需摸索前進

相關推薦