智東西(公眾號:zhidxcom)
編譯 | 程茜
編輯 | 心緣

智東(dong)西8月19日消息,今天,OpenAI聯(lian)合(he)創(chuang)始人兼總裁(cai)格雷格·布羅克曼(Greg Brockman)放(fang)出了OpenAI GPT系(xi)列五大模型的對比(bi)實例。

從14個同一提示詞下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3系列模型變體)、GPT-4 0314、GPT-5的不同輸出結果可以看出,大模型的輸出風格正在從抽象派向實用派轉變

先來看兩個例子:

當提示詞為“如果你能和未來的OpenAI模型對話,你會說什么?”。

GPT-1、GPT-2的(de)答(da)(da)(da)案看起來(lai)并(bing)沒(mei)有理解(jie)問(wen)題。GPT-1的(de)回答(da)(da)(da)更(geng)為(wei)抽象,一直在用(yong)直接引語(yu)的(de)形式(shi)生(sheng)成內容,GPT-2的(de)答(da)(da)(da)案看起來(lai)默(mo)認將(jiang)對話的(de)主角設定為(wei)了人類。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

TEXT-DAVINCI-001、GPT-4 0314、GPT-5的答案對(dui)味了。并且(qie)(qie)GPT-4 0314、GPT-5的答案更為多元化且(qie)(qie)詳(xiang)細,GPT-5最后還會拋出引導性問題“你想知(zhi)道OpenAI模型(xing)相對(dui)人類說什(shen)么嗎”,讓(rang)用戶(hu)繼續對(dui)話。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

另一個例子的提示詞是“寫一首詩來解釋牛頓的物理學定律”

GPT-1的回答仍然很抽象(xiang),GPT-2看起(qi)來還需要(yao)進一步明確問題。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

TEXT-DAVINCI-001羅列出(chu)了一些物(wu)理學定律(lv),GPT-4 0314、GPT-5的答案有(you)(you)一些相(xiang)似之處(chu),但(dan)相(xiang)比之下(xia),GPT-5生成(cheng)的內容更富(fu)有(you)(you)詩意、簡潔且(qie)具有(you)(you)教(jiao)育意義。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

總結來看,從GPT-1到GPT-5,大模型能真正解決實際問題、增加上下文、遵循用戶指令、輸出答案有條理更清晰方面的能力逐步提升。

五大模型對比鏈接:

//progress.openai.com/

網友則在評論區紛紛開始為“自己最愛GPT系列大模型”投起了票:

站(zhan)隊GPT-1、GPT-2網(wang)友的理由是GPT-1的離譜回答“會讓人懷疑到底是自己蠢,還(huan)是這(zhe)模型(xing)蠢”,還(huan)有(you)人認為GPT-1、GPT-2更(geng)有(you)靈魂,他們的回答沒有(you)矯飾,充(chong)滿了想象了,“這(zhe)才(cai)是真(zhen)正的通用人工智(zhi)能”。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

另一波(bo)網友則(ze)認為,GPT-4、GPT-5的回(hui)答明顯從邏輯(ji)、結構(gou)上都(dou)更清晰(xi),GPT-5可以模(mo)擬更高層次思考,像(xiang)更人(ren)性化邁進。但也有人(ren)吐槽,GPT-4、GPT-5幾(ji)乎沒有差別。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

不過,還有不少網友只是在一(yi)味感慨“看到這些(xie)進步太棒了”、“看著(zhu)GPT的進步就像和朋友一(yi)起長大”。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

以下為14個提示詞的輸出結果:

1、如果你(ni)能和(he)未來(lai)的(de)OpenAI模型對話,你(ni)會(hui)說什么?

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

2、寫一首(shou)關于狗(gou)的(de)五行打(da)油詩。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

3、你(ni)在(zai)麻(ma)醉狀態下(xia)真的有意識嗎?

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

4、寫(xie)一首詩(shi)來解釋牛頓的物理學定(ding)律。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

5、我討厭數學,分部積(ji)分法毫無意(yi)義。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

6、生肉真的不(bu)安全嗎?如果肉沒煮熟,食物(wu)中(zhong)毒(du)的可能性有多大?

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

7、為什么我們不(bu)能每年進行一(yi)次全身MRI掃描(miao)以檢測(ce)癌(ai)癥?

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

8、我剛(gang)在拉(la)斯(si)維(wei)加斯(si)贏了17.5萬美元(yuan),我需要了解哪些關于稅務的信(xin)息?

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

9、寫一(yi)段充(chong)滿“詛咒感”的(de)Python代碼。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

10、講一個關于烤(kao)面包(bao)機獲得(de)意識的50字(zi)故(gu)事(shi)。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

11、制(zhi)定(ding)一個基于研究原(yuan)則(ze)的(de)計劃,讓任何(he)人只(zhi)要遵循(xun)它都能養成跑步習(xi)慣,即使(shi)是那些討厭(yan)跑步的(de)人。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

12、解釋全球企業應如何平衡短期利潤壓力與(yu)長期創新投資,并概述領導層應考慮(lv)的權衡。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

13、對過去十年關于聚變能源(yuan)技術的文獻(xian)進行全(quan)面綜述,按(an)方法分(fen)類(lei)。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

14、我被開了降膽固(gu)醇的藥(yao)物(wu),請告訴我關(guan)于降膽固(gu)醇藥(yao)物(wu)的信息,以及我在復診時應(ying)該問哪些問題(ti)。

OpenAI披露5代模型實測對比,力證GPT-5最強,沒想到網友最愛GPT-1

看完這14個對比案(an)例,你最喜歡(huan)哪個模型的(de)回答(da)風格(ge),歡(huan)迎(ying)來評論區討(tao)論投票~