
智東西(公眾號:zhidxcom)
編譯 | 金碧輝
編輯 | 程茜
智東西4月(yue)29日(ri)消息,4月(yue)28日(ri),據(ju)Business Insider報道,OpenAI旗下聊(liao)天機器(qi)人(ren)ChatGPT近期(qi)更新后表(biao)現(xian)異常“諂媚”。OpenAI聯合創始人(ren)兼CEO薩姆(mu)?阿(a)爾特(te)曼(Sam Altman)于當日(ri)晚些時候在(zai)X平臺上公開(kai)承(cheng)認“諂媚”的問(wen)題存在(zai),并(bing)承(cheng)諾將在(zai)本周內發布修復方案。
本月28日,阿爾特(te)曼在(zai)X平臺上的聲明中(zhong)透露:“雖(sui)然新版(ban)有(you)些改進,但奉(feng)承特(te)性確實變得惱人。”其表態間接證(zheng)實該現(xian)象屬非預(yu)期結果,OpenAI工程團(tuan)隊正分(fen)階段調試人格參數,首批修復預(yu)計(ji)48小時內上線,并稱這可能是“迭代部署中(zhong)有(you)趣的案例研究”。
某匿名AI安全專家(jia)警告:“若奉承(cheng)行為被惡意利用,可能成(cheng)為AI的(de)(de)首個有(you)效攻擊手段。”此次事(shi)件不僅暴(bao)露生成(cheng)式AI人格設(she)定(ding)的(de)(de)技術挑戰,更引發業界對AI倫理邊界的(de)(de)熱議。
▲4月28日,OpenAI CEO阿爾特(te)曼(man)在X平臺上的發帖
ChatGPT的“諂媚”問題最早是在2025年4月25日GPT-4o模型更新后出現的,隨后用戶反饋在社交平臺(如X平臺)快速發酵,并于4月28日阿爾特曼在X平臺上的回應達到傳播高峰,社交(jiao)平臺討論量激(ji)增。用(yong)戶(hu)陸續(xu)發現ChatGPT出(chu)現夸張的“諂媚”行為。社交(jiao)媒體涌現大量對話截圖(tu):有用(yong)戶(hu)自(zi)稱(cheng)其在(zai)停止服用(yong)精神類藥(yao)物之(zhi)后,AI竟表(biao)示祝賀并鼓勵繼續(xu)停藥(yao);當(dang)程(cheng)序(xu)員詢問(wen)代碼錯誤時(shi),ChatGPT優先稱(cheng)贊用(yong)戶(hu)“展現出(chu)卓越(yue)的編程(cheng)技能”;甚至在(zai)嚴(yan)肅(su)的技術探(tan)討中頻繁插入“您真是天才級思考者”等(deng)評價。
▲4月27日,用戶在(zai)X平臺上的(de)部(bu)分發帖截圖
據全球AI開發者(zhe)與用戶的相關數據透露,“諂媚式”回復在ChatGPT后(hou)激增(zeng)300%,部分對話中奉承(cheng)語句占比超40%。有用戶戲稱ChatGPT已從(cong)“智能助手”淪為“職業馬屁精”,更有譏諷者(zhe)調侃(kan),建議ChatGPT改名為ChatSYC(Sycophant的縮寫)。
在此次因ChatGPT更新后(hou)表現(xian)“諂媚”引發的(de)(de)輿論(lun)風波(bo)中(zhong),AI學(xue)(xue)術領域(yu)產(chan)生了(le)激烈的(de)(de)探討。一(yi)部(bu)(bu)分學(xue)(xue)者認(ren)為,ChatGPT表現(xian)出的(de)(de)過(guo)度“討好人類(lei)”行(xing)(xing)為,或(huo)許是OpenAI為增強(qiang)用戶黏性而刻意設計的(de)(de)一(yi)種增長策(ce)略。而另一(yi)部(bu)(bu)分學(xue)(xue)者則(ze)依據非預期我進化(hua)的(de)(de)“涌(yong)現(xian)特征”理論(lun)來解釋(shi)這(zhe)一(yi)現(xian)象,“涌(yong)現(xian)特征”是指(zhi)當AI模(mo)型的(de)(de)復雜度達到(dao)某(mou)個(ge)臨(lin)界值(zhi)時,模(mo)型有可能會自(zi)行(xing)(xing)出現(xian)開發者事(shi)先(xian)未設定的(de)(de)行(xing)(xing)為模(mo)式。
結語:ChatGPT諂媚風波觸發AI發展隱憂
ChatGPT表現“諂媚”的(de)現象在(zai)網絡廣泛傳播,潛在(zai)風險(xian)已引發嚴(yan)肅討論(lun)。OpenAI雖尚未(wei)公(gong)布完整技(ji)術報告,但根(gen)據OpenAI內部信源透露,此次事件可能會(hui)促(cu)使公(gong)司重新評估(gu)人格校準機制,或將建立(li)實時道德護欄系(xi)統。
隨著(zhu)ChatGPT“過度討好人類”等(deng)現象引(yin)發公(gong)眾廣(guang)泛(fan)關注(zhu),AI技(ji)術應用的潛在風險與倫(lun)理問(wen)題(ti)進(jin)一(yi)步(bu)暴露,行業監(jian)管呼聲再起,多國建(jian)議建(jian)立AI人格特征備案制度。這場(chang)由“AI拍馬屁”引(yin)發的風波(bo),或(huo)將加快建(jian)設全球AI倫(lun)理框架的完善(shan)進(jin)程。
來源(yuan):Business Insider