
智東西(公眾號:zhidxcom)
編譯 | Glu
編輯 | 李水青
智東西6月18日消息,據外媒(mei)The Information報道,各(ge)國之間對待AI抓取數據的(de)不同做(zuo)法有(you)沖突,或許(xu)還會導(dao)致政(zheng)治、經(jing)濟的(de)緊張局勢。
本周三(san),歐盟主要(yao)的(de)立法機(ji)構歐洲議(yi)會(hui)已通過了一項(xiang)名為《人工智能法案(an)》(AI Act)的(de)法律草案(an),這是世界上(shang)第一步監管(guan)AI的(de)法案(an)。今年3月底,意大利(li)數據(ju)保(bao)護機(ji)構以不符(fu)合歐洲數據(ju)保(bao)護各項(xiang)規定為由,禁用了ChatGPT。盡管(guan)意大利(li)后來撤銷(xiao)了這個禁令,但(dan)不難看出(chu)AIGC(生(sheng)成式AI)的(de)立法問(wen)題(ti)受(shou)到了各界關注(zhu)。
▲歐洲議會討論《人(ren)工智(zhi)能(neng)法(fa)案》
一、OpenAI或以非盈利為由,避開數據侵權爭議
The Information記者認為,AIGC引發的爭(zheng)議主要還是在于數(shu)(shu)(shu)據(ju)。數(shu)(shu)(shu)據(ju)可(ke)以幫(bang)助訓練大(da)語(yu)言(yan)(yan)模(mo)型,大(da)語(yu)言(yan)(yan)模(mo)型又能為ChatGPT、谷歌Bard等(deng)聊天(tian)機器人提供動力,所以數(shu)(shu)(shu)據(ju)很(hen)重要,這些數(shu)(shu)(shu)據(ju)則通(tong)常是通(tong)過挖掘公開(kai)內容、訪(fang)問數(shu)(shu)(shu)據(ju)存儲庫和(he)掃描大(da)型開(kai)放(fang)數(shu)(shu)(shu)據(ju)集(ji)獲得的。
但(dan)在挖掘數據(ju)的過程(cheng)中,難免會(hui)抓(zhua)取(qu)到受版權保護(hu)的內容,這(zhe)引(yin)發了各界人士的擔(dan)憂。一(yi)些歐洲(zhou)數據(ju)保護(hu)監管機構擔(dan)憂AIGC在處理個人數據(ju)時“亂來”,畢竟它們沒有法律依據(ju),也不需要遵守GDPR(《一(yi)般數據(ju)保護(hu)條例(li)》)原(yuan)則;美國聯邦貿易委員會(hui)也對OpenAI和其他大型(xing)語言模型(xing)缺乏問責(ze)制、治理提出了質疑(yi)。
管理(li)數字技術的法(fa)律還處于相對初級(ji)階段,但歷史上的例子或許(xu)可(ke)以(yi)給立法(fa)部門一(yi)些提示,如曾經(jing)深陷(xian)版(ban)權(quan)爭議的谷(gu)歌圖書,它曾被(bei)作家協會起訴,但谷(gu)歌最(zui)終勝訴了(le),因(yin)為(wei)法(fa)院在(zai)因(yin)為(wei)權(quan)衡版(ban)權(quan)侵權(quan)問(wen)題時,考慮了(le)“實用性”以(yi)及“充分改造性”等問(wen)題。
與谷歌圖書一(yi)樣,AIGC的立法最終(zhong)其實就是(shi)要回答一(yi)個問題,即大模(mo)型(xing)的數據使(shi)用(yong)是(shi)否侵犯版(ban)(ban)權。OpenAI可能(neng)會爭辯說,大模(mo)型(xing)只是(shi)從(cong)他人的工作(zuo)中學習,并(bing)產生的一(yi)種類似于獨立思考的模(mo)式,因此(ci),版(ban)(ban)權保護(hu)并(bing)不適用(yong)。
此外,OpenAI的非(fei)營(ying)利性公(gong)(gong)司(si)結構可能為(wei)它的數據(ju)獲取(qu)提供保護(hu)(hu)。2019年,OpenAI的架構進行了(le)調整,調整后(hou)變身為(wei)兩家機(ji)構——營(ying)利性機(ji)構OpenAI LP和最初的非(fei)營(ying)利機(ji)構OpenAI。雖然盈利性公(gong)(gong)司(si)OpenAI LP正在從(cong)版權保護(hu)(hu)材(cai)料中獲益(yi),但最初收集版權的是(shi)非(fei)盈利組(zu)織(zhi)(zhi)OpenAI。而許(xu)多(duo)國家在侵權保護(hu)(hu)方面,不涉及非(fei)營(ying)利組(zu)織(zhi)(zhi)、科學研究人(ren)員(yuan)、記者和其他為(wei)公(gong)(gong)共利益(yi)工作的人(ren)。
二、歐盟稱將出臺幾十項法律,包括禁止企業利用活人數據
The Information記者認為,如果非要(yao)說的(de)話,那(nei)就是OpenAI的(de)崛(jue)起(qi)時機、地點都(dou)不(bu)那(nei)么正確(que)。
此刻,歐洲正(zheng)準備結束過往20年所采取的不(bu)干(gan)涉、放任市場戰略,并開始(shi)在大型(xing)科(ke)技平臺(tai)上展示(shi)其監管(guan)力量。歐盟稱(cheng)其將出臺(tai)幾十項新的法律,它(ta)希望建立一個(ge)完全(quan)規范的技術生態系統,尊重其公民(min)的權利和自由。
從這(zhe)個(ge)意義(yi)上說,數據保護(hu)監管(guan)機(ji)(ji)構對(dui)OpenAI的(de)(de)打擊與內(nei)容創作者對(dui)谷歌圖(tu)書的(de)(de)訴(su)訟威(wei)脅明顯不同。一方(fang)面,歐洲的(de)(de)GDPR將數據保護(hu)確立(li)為(wei)一項基本(ben)權利,OpenAI正(zheng)好給歐洲一個(ge)絕妙機(ji)(ji)會(hui)來(lai)“殺雞儆猴”,因為(wei)對(dui)OpenAI的(de)(de)監管(guan)可(ke)能(neng)也會(hui)震(zhen)懾到其他數據驅動的(de)(de)公司,迫(po)使他們遵守這(zhe)些規(gui)則;另一方(fang)面,除非在某(mou)些特定條件下,企業禁止利用(yong)可(ke)識別活人的(de)(de)有(you)關信息(xi)。
即使OpenAI能(neng)把處理個人(ren)數(shu)據的(de)(de)(de)行為合理化,該公司仍必須(xu)遵守(shou)公平、準確和合法(fa)目的(de)(de)(de)等數(shu)據保護原則(ze)。此外,GPT的(de)(de)(de)訓練數(shu)據集自(zi)2021年(nian)9月以來一(yi)直(zhi)保持固(gu)定(ding),這讓人(ren)對其提供相關信息的(de)(de)(de)能(neng)力產(chan)生懷疑。
但(dan)到目(mu)前(qian)為(wei)止(zhi),ChatGPT最大的(de)(de)(de)問(wen)題是(shi)數據(ju)處理的(de)(de)(de)不(bu)透明,即使是(shi)其開發(fa)人(ren)員也無(wu)法完全(quan)解釋(shi)該(gai)模(mo)型是(shi)如何得(de)出結論的(de)(de)(de)。迄今(jin)為(wei)止(zhi),機器學(xue)習研究(jiu)很少(shao)能夠使這些過程清晰可(ke)見。OpenAI可(ke)以(yi)(yi)考慮動態更(geng)新ChatGPT,以(yi)(yi)確保(bao)模(mo)型是(shi)根據(ju)當前(qian)數據(ju)進行訓練的(de)(de)(de);還可(ke)以(yi)(yi)在用戶設計功(gong)能投資,以(yi)(yi)確保(bao)用戶不(bu)會(hui)在不(bu)知不(bu)覺中交出他們的(de)(de)(de)數據(ju)。
三、美歐數據制度差異大,美國或成AI創企避風港
目(mu)(mu)前,各國在(zai)數據保(bao)護制度存在(zai)許(xu)多(duo)差距,最終(zhong)可能導致(zhi)兩(liang)種(zhong)結果:要么AI公(gong)司(si)在(zai)全(quan)球(qiu)范圍遵守更(geng)嚴格(ge)的歐盟法(fa)(fa)律;要么我們可能會(hui)目(mu)(mu)睹全(quan)球(qiu)分(fen)裂,美國采取更(geng)加自(zi)由放任的做法(fa)(fa),可能會(hui)成(cheng)為那些(xie)希望繼續在(zai)更(geng)少限制下運營(ying)的公(gong)司(si)的避(bi)風港。但最終(zhong)的方向還是(shi)取決于主要利益相關者(zhe),即政府、公(gong)司(si)和(he)公(gong)眾(zhong)是(shi)否愿意參與有意義(yi)的對話并(bing)找到共同點(dian)。
隨著ChatGPT等(deng)AIGC技(ji)術與法律的斗爭不(bu)斷展(zhan)開,我們(men)需要記(ji)住歷史的教(jiao)訓,并努(nu)力(li)在這個快(kuai)速發展(zhan)的環境中,找到保護個人權利與促(cu)進創新之(zhi)間(jian)的平(ping)衡點。
結語:AIGC立法仍需各國共同協商
面(mian)對長期(qi)以來的AIGC數據侵權、缺乏問(wen)責、監管混亂等爭議,歐(ou)盟(meng)于本周三(san)在法律(lv)監管上邁出了重要(yao)的一步(bu),出臺了較為嚴格的《人工智能法》以保障(zhang)公眾(zhong)數據安全。
但(dan)面(mian)對大模型的(de)數據爬(pa)取,各國采取了不(bu)同的(de)措施,如美國的(de)自(zi)(zi)由方式則較為自(zi)(zi)由、溫和。最終,對AIGC的(de)監管很有可能變成(cheng)國家(jia)與(yu)企(qi)業的(de)結盟問(wen)題,導(dao)致全球分(fen)裂。為了避(bi)免這種分(fen)裂局(ju)面(mian),AIGC的(de)立方還需要各國共同討(tao)論與(yu)協商AIGC的(de)未來走向。
來(lai)源:The Information