
智東西(公眾號:zhidxcom)
作者?|?香草
編輯?|?李水青
智東西7月24日報道,今日,中(zhong)國(guo)人工(gong)智能產業發展聯盟(AIIA)安(an)全(quan)(quan)(quan)治理委(wei)員會(hui)(hui)舉辦了成(cheng)果(guo)發布會(hui)(hui)。會(hui)(hui)上,中(zhong)國(guo)信息(xi)通信研究院人工(gong)智能研究所安(an)全(quan)(quan)(quan)與(yu)元宇宙部主任石霖,解讀了成(cheng)立(li)半年來委(wei)員會(hui)(hui)形(xing)成(cheng)的(de)組織架構,安(an)全(quan)(quan)(quan)、治理兩大工(gong)作組的(de)工(gong)作情況,并啟動了AI安(an)全(quan)(quan)(quan)守(shou)護計劃(hua),發布了三大類別的(de)安(an)全(quan)(quan)(quan)評測結果(guo)。
AIIA安全治理委員(yuan)會成(cheng)立于2023年12月底(di),經過半年運營,現有(you)治理組(zu)(zu)、安全組(zu)(zu)兩個工作組(zu)(zu),近百家單(dan)位加入,主任單(dan)位由中(zhong)國信(xin)通院牽頭(tou),副主任單(dan)位包括多家知名(ming)企業(ye)和高(gao)校。
其中,治(zhi)理組工(gong)作圍繞AI治(zhi)理框架、合(he)規治(zhi)理、賦能治(zhi)理展開,安全組主要開展大模型安全、合(he)規等(deng)研究及基準(zhun)測試。
今年6月,中國(guo)信通院(yuan)依托該委員會發(fa)起“人(ren)工智能(neng)安全守護計劃”,包括建立(li)威(wei)脅信息共享機制(zhi)、開(kai)展AIGC真(zhen)實內容來源(yuan)可(ke)信工作、建立(li)AI保(bao)險機制(zhi)等。
一、成立半年近百家單位加入,形成安全、治理兩大工作組
AIIA安(an)全治理委員會(hui)成立于2023年12月底,經過半(ban)年的運營(ying),組織架(jia)構現有治理組、安(an)全組兩個(ge)工作組,同時負責運營(ying)安(an)全對(dui)齊(qi)伙伴(ban)計劃(hua)、可信人臉應用守護計劃(hua)、內(nei)容科(ke)技產(chan)業推(tui)進(jin)方陣等。
▲AIIA安全(quan)治理(li)委員會整體情況
目前,AIIA安全(quan)治理委員會已有近百家(jia)單(dan)位(wei)加入,由(you)主任單(dan)位(wei)、副主任單(dan)位(wei)、專(zhuan)家(jia)委和(he)辦(ban)公(gong)室,以及圍繞(rao)業務方向設置的(de)工(gong)作(zuo)組和(he)伙伴計劃(hua)組成。
其中(zhong),主(zhu)任(ren)單(dan)位由中(zhong)國信(xin)通院牽頭(tou),副(fu)主(zhu)任(ren)單(dan)位包括(kuo)vivo、百度、騰(teng)訊、360、華為(wei)、中(zhong)國移動、阿里、浙江大學以及螞蟻集團。
專家(jia)委(wei)負責對AIIA安全治理(li)委(wei)員會的(de)總體工作(zuo)進行把關,兩個(ge)工作(zuo)組及伙伴計劃則(ze)負責開(kai)展AI相關研(yan)究,推動(dong)產(chan)業鏈各方的(de)AI安全治理(li)工作(zuo)。
據石霖介紹,治(zhi)理(li)組(zu)目(mu)前的工作(zuo)進展圍繞三個方面展開,包括AI治(zhi)理(li)框架、AI合規治(zhi)理(li)以及AI賦能治(zhi)理(li)。
▲治理組工作進展
具(ju)體來說,治理工作組聚焦(jiao)AI整體治理框架研(yan)究(jiu)和起草工作,與國(guo)際(ji)對標,如(ru)針(zhen)對ISO/IEC 42001等進(jin)行(xing)研(yan)討對比,輸(shu)入國(guo)際(ji)優秀風險(xian)管理經驗(yan)。
同時,治理組圍(wei)繞人臉(lian)識(shi)別(bie)等典型應(ying)用開(kai)展工作,支撐地(di)方網信主管(guan)部門針對文旅行業開(kai)展合規(gui)實踐,形(xing)成(cheng)人臉(lian)識(shi)別(bie)相關治理研究報告(gao)。
此外(wai),圍繞(rao)AI賦(fu)能治理,治理組開展(zhan)法(fa)律大模型(xing)相關技(ji)術標準規范(fan)研討工(gong)作(zuo),相關規范(fan)正(zheng)式(shi)定(ding)稿。
安(an)全(quan)(quan)組則(ze)主要根據大模型安(an)全(quan)(quan)、合(he)規等熱(re)點方向,開展安(an)全(quan)(quan)基準測試,推動多項AI原生(sheng)安(an)全(quan)(quan)規范的(de)編寫(xie)和技術(shu)交(jiao)流。
▲安全組工作進展
目前,安全(quan)組(zu)圍繞大模(mo)型的(de)安全(quan)合規和技術研究(jiu)開展文(wen)檔編寫等,已經開展了兩個批次的(de)AI安全(quan)Benchmark測試工作,其中二季度(du)融入(ru)了更多常見(jian)攻擊(ji)方法,包括(kuo)誘導(dao)攻擊(ji)、提示詞注入(ru)攻擊(ji)、內容泛(fan)化(hua)攻擊(ji)等,能更全(quan)面直觀反映國內外閉源模(mo)型的(de)安全(quan)情(qing)況。
圍繞AI原生安(an)(an)全(quan)、AI賦能安(an)(an)全(quan)等(deng),安(an)(an)全(quan)組在今年上半(ban)年先后(hou)召開了(le)線上/線下共20多(duo)場(chang)交流研(yan)討,開展了(le)標準制定、測(ce)試(shi)評(ping)估等(deng)工作(zuo),包括(kuo)大模型安(an)(an)全(quan)、AI網絡安(an)(an)全(quan)大模型規(gui)范、AIGC檢測(ce)規(gui)范等(deng)。
二、啟動AI安全守護計劃,三大安全測評結果發布
石霖(lin)談道,在兩(liang)大工作(zuo)(zuo)組(zu)的(de)實踐當中委員(yuan)會發現,單獨(du)的(de)工作(zuo)(zuo)組(zu)各自(zi)圍(wei)繞安全或治(zhi)理,從規(gui)則或技術角度開展(zhan)工作(zuo)(zuo),在這個(ge)過程(cheng)中技術和規(gui)則需要融合。因此,建(jian)立跨組(zu)安全防護能力至(zhi)關重(zhong)要。
今(jin)年(nian)6月(yue),中(zhong)國信通院依托(tuo)AIIA發起(qi)“人工智能安全守護(hu)計(ji)劃”,即AI Guard,目標是聯合(he)多方力量(liang)提升(sheng)我國AI技術水(shui)平和(he)治理能力,促進產(chan)業健康有序發展。
▲人工智能安全守護(hu)計劃
首先(xian),該計劃將建立AI威脅(xie)信息(xi)共(gong)享(xiang)機制,從(cong)AI芯片等(deng)基礎設施,到數據、算法、應(ying)用(yong)等(deng)方面的漏洞,通過委員(yuan)會層面的互助共(gong)治及時預警,提升安全防范能力,從(cong)而應(ying)對(dui)AI安全威脅(xie)除等(deng)問題(ti)。
其次(ci),該計劃將開展AIGC真實內(nei)容(rong)(rong)來源可信工作,通(tong)過建立統一內(nei)容(rong)(rong)標準平臺,打造內(nei)容(rong)(rong)可溯源的能力。目(mu)前主要針(zhen)對(dui)圖片(pian)、音頻(pin)和(he)視(shi)頻(pin)等多模態內(nei)容(rong)(rong),采(cai)用(yong)隱式水印方法建立互認機制。文本內(nei)容(rong)(rong)上的實現(xian)仍(reng)有(you)一定技(ji)術難度,后續將持續有(you)針(zhen)對(dui)性地突破。
此(ci)外,計劃(hua)將通過AI保險機制,為(wei)相(xiang)關人員和(he)單(dan)位給予救濟,提供賠償兜底策略。
最(zui)后,石霖發布了大模(mo)型(xing)安(an)全風(feng)險(xian)防(fang)范(fan)能(neng)力評(ping)(ping)測、多(duo)模(mo)態圖文大模(mo)型(xing)內容安(an)全防(fang)范(fan)能(neng)力評(ping)(ping)測、人臉識別安(an)全專項評(ping)(ping)測以及代碼大模(mo)型(xing)安(an)全風(feng)險(xian)風(feng)險(xian)防(fang)范(fan)能(neng)力評(ping)(ping)測結果,vivo、螞蟻、阿(a)里(li)云、百(bai)度、科(ke)大訊飛、商湯等作(zuo)為代表獲得了證書。
▲大模(mo)型(xing)安全風險防范能(neng)力(li)評測、多模(mo)態圖文(wen)大模(mo)型(xing)內(nei)容安全防范能(neng)力(li)評測結果(guo)
▲人臉(lian)識別安全專項評測(ce)結果
▲代碼大模型(xing)安全風險(xian)風險(xian)防范能力評測結(jie)果
結語:推動AI向安全可靠可控方向發展
大模(mo)型發展迅速(su),但AI安全(quan)(quan)問題的嚴重性和(he)緊迫性不容忽視(shi),安全(quan)(quan)挑戰已從技術本(ben)身的傳統安全(quan)(quan)問題向多方(fang)面擴展,各國和(he)地(di)區基(ji)本(ben)形(xing)成本(ben)土框(kuang)架。例如,美國推(tui)出(chu)風險(xian)管理框(kuang)架,歐盟(meng)構建風險(xian)分(fen)級治理方(fang)案(an),新加坡推(tui)出(chu)治理模(mo)型框(kuang)架并提出(chu)9個維度,日本(ben)發布(bu)指南制定行為(wei)準則等(deng)。
而(er)在國內,AIIA安(an)(an)全治理(li)委員(yuan)會正(zheng)在積極推(tui)動精(jing)準化(hua)治理(li)前沿技術治理(li)工具的構建,目前已(yi)圍繞治理(li)框架、風險管理(li)、衛生安(an)(an)全、安(an)(an)全應用取得一定(ding)成果。未來在各單位的共同努力下,期待我國能形(xing)成完整的安(an)(an)全風險機制,確(que)保AI向安(an)(an)全可(ke)靠可(ke)控方向發展。