智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月(yue)22日報道,近(jin)年來,視頻換臉、合成語(yu)音、修復影像、虛擬(ni)數字人等越來越頻繁(fan)的出現在社交娛樂、影視制作、教(jiao)育、廣告營銷(xiao)等領域,發展(zhan)出多元化(hua)的商業(ye)應用。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》
▲由朱(zhu)茵飾演(yan)的(de)(de)黃蓉被換成楊冪的(de)(de)臉

這些應用的背后,是深度合成技(ji)術在發(fa)揮作用。

深度合(he)成(cheng)技(ji)術,是指用以深度學(xue)習、虛擬(ni)現(xian)實為代(dai)表(biao)的生成(cheng)合(he)成(cheng)類算法,制作文本、圖像、音頻(pin)、視(shi)頻(pin)、虛擬(ni)場景等信息(xi)的技(ji)術。

而在(zai)使用(yong)需(xu)求不斷(duan)涌(yong)現(xian)的同時,部分(fen)惡意利用(yong)該技(ji)術(shu)生成(cheng)的音(yin)視(shi)頻,如篡改人臉的色情視(shi)頻、偽(wei)造人臉視(shi)頻破解身份核驗等應(ying)用(yong),不僅給個(ge)人、企(qi)業造成(cheng)了聲譽(yu)損害(hai)和財產損失,也對社(she)會、國(guo)家安全(quan)造成(cheng)威(wei)脅。

為(wei)了對人工(gong)智(zhi)(zhi)能和深度合(he)成技術的健康(kang)發展提供參(can)考和指引,清華大學(xue)人工(gong)智(zhi)(zhi)能研究院(yuan)、北京瑞(rui)萊智(zhi)(zhi)慧科技有限公司、清華大學(xue)智(zhi)(zhi)媒研究中心、國(guo)家工(gong)業信息安全發展研究中心、北京市大數據中心近日聯合(he)發布(bu)《深度合(he)成十大趨勢報告(2022)》(以下簡(jian)稱《報告》)。

《報告》從技術研究、領(ling)域應用、發(fa)展趨勢等多(duo)個方面,全面深入地介紹和(he)研判深度合成(cheng)技術及應用帶來的機遇與(yu)挑戰(zhan),并就其發(fa)展與(yu)治(zhi)理給(gei)出(chu)切實可(ke)行的建(jian)議和(he)措施。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

一、落地多領域,深度合成內容迎爆發式增長

深度合成的(de)圖像、視(shi)(shi)頻(pin)、音頻(pin)、文本等(deng)內容,例如熱門影視(shi)(shi)劇片段、話(hua)題明(ming)星的(de)換臉(lian)視(shi)(shi)頻(pin)等(deng)等(deng),具有極強的(de)娛(yu)樂性與(yu)傳(chuan)播性。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》▲深度(du)合成技(ji)術進行視頻“換(huan)臉”處(chu)理

隨著技術日臻成熟(shu),越來越多創作者在互聯網上發布和分(fen)享深度合(he)成內容,數量逐(zhu)年高速(su)增長。

《報告》顯示,在(zai)國內(nei)外主流音視頻網(wang)站、社交媒體平臺上,2021年(nian)(nian)新發布(bu)的深度合成視頻數量(liang)較2017年(nian)(nian)已增長10倍以上。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

其中,深度合成(cheng)視頻(pin)數(shu)量最(zui)多的(de)類型(xing)(xing)是影視音樂,涉及(ji)電(dian)影、電(dian)視劇、音樂等內(nei)容(rong);第二是科(ke)技教育(yu),此類視頻(pin)關注對深度合成(cheng)技術(shu)的(de)講解(jie)和討(tao)論,分享(xiang)最(zui)新(xin)的(de)研究成(cheng)果等。排名第三到第五(wu)的(de)視頻(pin)類型(xing)(xing)分別是生(sheng)活、娛樂和資訊類。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》
▲“AI修復百年前北京城2.0”視頻片段

用流暢手語解(jie)說北京冬(dong)奧會谷(gu)愛凌(ling)奪冠的手語AI合(he)成主(zhu)播“小聰”、登(deng)上2021年央視春晚的虛(xu)擬偶(ou)像(xiang)洛天(tian)依等(deng)虛(xu)擬數(shu)字人均應用了(le)深度(du)合(he)成技(ji)術。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

在影視制作(zuo)(zuo)領域(yu),深度合成技術(shu)已經(jing)成為受(shou)劣跡藝(yi)人行為拖累的作(zuo)(zuo)品的救場工具,《長安十二時(shi)辰(chen)》、《光榮時(shi)代》等影視作(zuo)(zuo)品均采(cai)用這一技術(shu)。

與(yu)此同(tong)時,深(shen)度合成(cheng)內容的(de)(de)關注度也呈指數級增(zeng)長,通過(guo)對互(hu)動數據進行統計,2021年新發布的(de)(de)深(shen)度合成(cheng)視頻的(de)(de)點贊數已超過(guo)3億(yi)。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

此(ci)前(qian)“英國女(nv)王發(fa)表(biao)圣誕賀(he)詞”、“阿湯哥表(biao)演硬件(jian)魔術”等一系(xi)列(lie)深度合成視頻曾火爆“出圈”,引發(fa)平臺用戶(hu)大量熱(re)討(tao)。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》
▲英國Channel 4制(zhi)作了惡搞版女王圣(sheng)誕致(zhi)辭

瑞萊智慧CEO田天表(biao)(biao)示,研究論文(wen)的(de)持續增加、開源(yuan)技術工具(ju)和大量代表(biao)(biao)性(xing)方(fang)法的(de)涌(yong)現(xian),令深度合成(cheng)(cheng)內容(rong)的(de)效果更(geng)(geng)加逼真(zhen)(zhen)、制作也更(geng)(geng)加高效,尤(you)其(qi)是(shi)生成(cheng)(cheng)對抗網絡(GAN)等算法的(de)出現(xian),讓(rang)合成(cheng)(cheng)內容(rong)達到了(le)“真(zhen)(zhen)假難辨”的(de)程度。

相關數據顯示,2017年以(yi)來(lai)深度合成(cheng)領域的論文數量正持續增長。其(qi)中針對圖像類生成(cheng)視頻(pin)的研(yan)究占比最高,達(da)到64%,音頻(pin)和文本占比分別為12%和24%。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

一些面向公(gong)眾開發的合成類產品也陸續推出,視頻、語(yu)音和(he)文本形(xing)式的服務最為普遍。

例如支持風格(ge)定(ding)制的(de)特效視頻制作(zuo)軟件等(deng)(deng)風靡網絡;語音方(fang)向衍生(sheng)出了語音導航、有聲讀(du)物、自(zi)動新聞(wen)播報(bao)等(deng)(deng)應用;文本合成則在新聞(wen)報(bao)道、詩(shi)文創(chuang)作(zuo)、聊(liao)天問(wen)答等(deng)(deng)方(fang)面發(fa)揮著(zhu)重要作(zuo)用。

深度(du)合成技(ji)術還極大地(di)豐富了(le)虛擬數字空(kong)間的信息內容,為(wei)“元宇(yu)宙(zhou)”等新商業思(si)維提供支撐。

阿里(li)巴(ba)巴(ba)安(an)全感知與認知智能部(bu)負責人(ren)薛輝說,比如虛擬人(ren)、數字(zi)人(ren)即是深度合成的主要(yao)(yao)應用(yong),也(ye)是“元宇(yu)宙”的重要(yao)(yao)組(zu)成部(bu)分。

清華大學(xue)新(xin)聞與傳(chuan)播(bo)學(xue)院常務副院長陳(chen)昌(chang)鳳認為,深度合(he)成(cheng)將重新(xin)定(ding)義虛(xu)擬數字化空(kong)間,從傳(chuan)播(bo)社會學(xue)意義上看,一(yi)個新(xin)的人類生存場(chang)景(jing)將以深度合(he)成(cheng)技術為基石展開(kai)。

二、風險加劇,技術檢測成重要應對舉措

深(shen)度合成激發了(le)新(xin)內容創(chuang)造力的同時,也帶來了(le)新(xin)的威脅。

2017年。名為“Deepfakes”的用戶利用深度合成技術制作的成人視頻在Reddit社區中瘋狂傳播,迫于公眾輿論壓力,Reddit網站將該用戶封號。?

該用戶隨即在全球最大代(dai)碼(ma)開源(yuan)平臺GitHub上公開了實現該技(ji)術(shu)的源(yuan)代(dai)碼(ma),瞬時引發了技(ji)術(shu)愛好者(zhe)的廣泛關注與(yu)討論,并引爆了創造和豐富(fu)深度合(he)成相關技(ji)術(shu)項(xiang)目及代(dai)碼(ma)的風潮(chao)。

統計數據顯示,2017年以來,深(shen)度合成領域的開(kai)源項目發布(bu)數量持續增長。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

以圖像、音頻、文(wen)本(ben)方向中具有代(dai)表性的(de)5個開源項目(分別可實現(xian)面部替換(huan)、動(dong)作或表情操縱、圖像生成、聲音復刻、文(wen)本(ben)生成)為(wei)例,其Star數量(liang)在2021年均(jun)已突破1萬。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

隨(sui)著技術普及,不法(fa)分(fen)子可輕易偽造(zao)音頻(pin)、視頻(pin),實(shi)施誣陷(xian)、誹謗、詐騙、勒索(suo)等違法(fa)行為,甚至捏造(zao)國(guo)家政要言論擾(rao)亂社會與政治(zhi)秩序。

例(li)如在2018年4月,有技術(shu)團隊(dui)制(zhi)作了美國(guo)前總統奧巴馬的(de)(de)換臉視頻,視頻中的(de)(de)假“奧巴馬”罵(ma)當時任美國(guo)總統的(de)(de)特朗普(pu)是(shi)“徹頭徹尾的(de)(de)白癡”。

2021年(nian)10月,安(an)徽合肥(fei)警方曾查獲一起非法利用深度(du)合成技術偽造(zao)手(shou)機(ji)用戶人臉動態視頻破解身份核驗,為黑灰產業提供注冊(ce)虛擬手(shou)機(ji)卡(ka)等技術支(zhi)撐(cheng)的案件。近年(nian)來,類似(si)事件開始更多的進入公眾視野(ye)。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

深度合成內容模糊了真實和虛假的邊界(jie),將對社會信任(ren)(ren)、媒體信任(ren)(ren)、政治信任(ren)(ren)產生巨大的影響。

陳昌鳳認為,虛(xu)假內容(rong)的高難度(du)甄別影響了事(shi)實核查的有效性,在(zai)社(she)會重大事(shi)件或政治事(shi)件節點(dian)上,深(shen)度(du)合成(cheng)技術可能被(bei)用于(yu)操作(zuo)輿(yu)論(lun)意見,借助社(she)交媒體(ti),使(shi)虛(xu)假信(xin)息短時間內引發(fa)產生病毒式擴散,激(ji)化(hua)社(she)會矛盾。

負面風險不斷(duan)加(jia)劇,如何有效甄別深度(du)合(he)成(cheng)內(nei)容就成(cheng)為了關鍵(jian),但(dan)隨(sui)著(zhu)合(he)成(cheng)質量的不斷(duan)提升,傳統(tong)基于生物(wu)特征的鑒別方式越(yue)來越(yue)難(nan)發揮作用。

在浙江大學網絡空(kong)間安全學院院長任奎看來,目前對深度合成的檢(jian)測(ce)主(zhu)要依賴于人工智(zhi)能模型,依賴于訓練數據的完(wan)備性,包(bao)括檢(jian)測(ce)器泛(fan)用性低、公開數據集適用性、數據敏感等,這些都將帶來諸(zhu)多挑(tiao)戰(zhan)。

中國(guo)工程院(yuan)院(yuan)士(shi)鄔賀(he)銓認為,深度合成的治理有(you)兩(liang)項要點。第(di)一,要持續(xu)發展技(ji)術(shu),不能(neng)“一刀切”地禁止,避(bi)免阻(zu)礙正向應用與創新。第(di)二(er),衍生出的安全問題要從源頭上解決,利用技(ji)術(shu)創新、技(ji)術(shu)對(dui)抗(kang)等方(fang)式,持續(xu)提(ti)升和迭代檢測技(ji)術(shu)的能(neng)力。

田天也談道,新(xin)型(xing)偽(wei)造(zao)方法層出不窮、網絡傳播環境的日趨(qu)復雜,加上基于檢(jian)測算法存在漏洞缺(que)陷等,反深偽(wei)檢(jian)測技(ji)術面(mian)臨(lin)“強對抗性(xing)”,需(xu)要持續更新(xin)與迭代(dai)。

《報告(gao)》顯示,目前學術界(jie)(jie)和(he)產業界(jie)(jie)均已(yi)對反深偽檢測投入了大量研究,Meta、谷歌、微軟等機構均推(tui)出了深度合成視頻認證(zheng)的方法或產品。

在(zai)國內(nei),清(qing)華大學、中(zhong)科大等高校在(zai)深(shen)度偽造內(nei)容檢測(ce)方面取得顯著成(cheng)果。

清華大學孵化(hua)團隊瑞(rui)萊智慧(hui)RealAI、騰訊優圖實 驗室等企業機構已構建人臉合成檢(jian)測(ce)(ce)(ce)平臺(tai)(tai)并發布針對性的檢(jian)測(ce)(ce)(ce)產品,支(zhi)持對多種(zhong)換臉方(fang)法(fa)進(jin)行檢(jian)測(ce)(ce)(ce)。例(li)如,瑞(rui)萊智慧(hui)推(tui)出的深度(du)偽造內容檢(jian)測(ce)(ce)(ce)平臺(tai)(tai)DeepReal擁有工(gong)業級的檢(jian)測(ce)(ce)(ce)性能和(he)應(ying)對實網環境對抗變化(hua)的檢(jian)測(ce)(ce)(ce)能力。

清華(hua)大學人工智能研(yan)究(jiu)院基礎理論研(yan)究(jiu)中(zhong)心主任朱軍(jun)認(ren)為(wei),深(shen)度合(he)成(cheng)檢測面(mian)臨持續的(de)(de)攻防和博弈,未來還需融合(he)多模(mo)態內(nei)容的(de)(de)取(qu)證(zheng)分析、基于數字水印的(de)(de)溯源技術等多方面(mian)能力,實現精準識別。

三、構建多維度治理機制,引導技術良性發展

深度(du)合成技術的良(liang)性發展,離(li)不開多(duo)維(wei)度(du)治理機(ji)制(zhi)的探索。

《報告》顯示(shi),除(chu)了(le)發展深(shen)度偽造內(nei)容檢測技術(shu)以外(wai),近幾年來(lai),針對深(shen)度合成(cheng)技術(shu)惡意(yi)使用所帶來(lai)的挑戰,世界各國紛紛出臺相(xiang)關法律法規(gui),探索深(shen)度合成(cheng)的治(zhi)理路徑(jing)。

國際方面(mian),美國從聯邦和(he)州(zhou)層面(mian)進行(xing)專門(men)立法(fa),歐盟將深(shen)(shen)度合成納(na)入(ru)《通(tong)用(yong)數據保(bao)護條例(li)(GDPR)》等現有法(fa)律框架規制。此外,德國、新加坡、英(ying)國、韓國等國家,均(jun)有適(shi)用(yong)于深(shen)(shen)度合成技術(shu)相關(guan)犯罪案件審理的法(fa)律法(fa)規。

我(wo)國也在積極(ji)探尋有效的治理機制。

2019年11月起先(xian)后(hou)出臺的(de)《網絡音視頻(pin)信(xin)息(xi)服務管理規定》、《網絡信(xin)息(xi)內(nei)容(rong)生(sheng)態(tai)治理規定》、《中華人民共和(he)國民法(fa)(fa)典(dian)》、《互(hu)聯網信(xin)息(xi)服務算法(fa)(fa)推薦管理規定》,均對生(sheng)成(cheng)合成(cheng)類內(nei)容(rong)等提出了不(bu)同程度的(de)監(jian)管要求。

今年1月,國(guo)家網信辦(ban)公布了《互聯網信息服(fu)務深度合(he)成(cheng)管理(li)規定(征求意見稿)》,對深度合(he)成(cheng)內容的用(yong)途、標記、使(shi)用(yong)范圍以及濫(lan)用(yong)處罰作(zuo)出了具體規定。

AI換臉、合成語音爆發式增長!清華發布《深度合成十大趨勢報告》

對(dui)于深度合成內容治理路徑的(de)探(tan)索,陳昌(chang)鳳認為可(ke)以(yi)從技術、倫理與法制(zhi)等幾個方(fang)面(mian)(mian)努力,技術方(fang)面(mian)(mian),通過政府與社會(hui)組織參(can)與、協同治理;倫理方(fang)面(mian)(mian),確立和(he)倡導相關的(de)深度合成原則。

中國社(she)科(ke)院哲學所(suo)科(ke)技哲學研(yan)究(jiu)室主(zhu)任(ren)段(duan)偉(wei)文建(jian)議(yi),對(dui)深度合(he)成技術(shu)引(yin)發的社(she)會、法律和倫理問題(ti),應展開有系統性(xing)(xing)、前瞻性(xing)(xing)的跨學科(ke)研(yan)究(jiu),對(dui)其可(ke)能出現(xian)的高(gao)風險應用場景,進(jin)行有針對(dui)性(xing)(xing)的治理與監(jian)管。

中(zhong)科院自(zi)動化所研究(jiu)員、聯合國(guo)教(jiao)科文組織AI倫理特(te)設專家組專家曾毅則(ze)倡(chang)導產研發展(zhan)自(zi)律自(zi)治,在他看來,在法(fa)律法(fa)規不完全成熟及(ji)體系(xi)化之前,產業界(jie)自(zi)身應(ying)強化“理論先(xian)行(xing)”意識,作為產業共(gong)同體共(gong)同防范濫(lan)用(yong)、嚴禁惡用(yong)。

對外經濟貿易大學(xue)(xue)法學(xue)(xue)院副(fu)教授(shou)許可談道,社會層面(mian)應(ying)加大宣(xuan)傳普及力(li)度(du),強化公(gong)民對深(shen)度(du)合(he)成等人工(gong)智能技術(shu)的(de)認識,提高全社會的(de)防(fang)范意識,推動公(gong)民作為(wei)負(fu)責任(ren)的(de)深(shen)度(du)合(he)成技術(shu)的(de)使用者,主(zhu)動標識合(he)成內容(rong)并積(ji)極踐行社會監督。

對此,田天(tian)也有類似的(de)觀(guan)點,深度偽造的(de)本(ben)質(zhi)問(wen)題(ti)是(shi)透明度不足(zu),因此提(ti)高公眾對深度合(he)成技(ji)術的(de)認知尤為重要,只有將門檻降低到所有受眾能夠在(zai)共同的(de)框架下去認識、討論、理解這個問(wen)題(ti)的(de)時候,深度合(he)成技(ji)術才能健康良性發展。

結語:深度合成急需有法可依

總體(ti)來(lai)看,隨著深(shen)度(du)合成技術逐漸成熟,合成過程更(geng)加高效、內容(rong)更(geng)為逼真(zhen),越來(lai)越多(duo)的相關正(zheng)向應用(yong)正(zheng)產(chan)生豐富的商(shang)用(yong)價值。同(tong)時(shi)面(mian)對當前技術仍存在的不安全隱患,檢測深(shen)度(du)偽(wei)造的技術還需持續(xu)研究(jiu)與迭代(dai)。

《報告》提出建議,監(jian)管部門需提前進行前瞻(zhan)布局,在(zai)(zai)保護深(shen)度合(he)成技(ji)術良性發(fa)展的(de)基(ji)礎上(shang),制(zhi)訂(ding)針對不(bu)良深(shen)度合(he)成引用的(de)配套法規(gui),管理條例(li);同時各(ge)方(fang)應(ying)與(yu)時俱進落(luo)實好新的(de)規(gui)范要(yao)求(qiu),并(bing)在(zai)(zai)此前提下不(bu)斷追求(qiu)技(ji)術突(tu)破,不(bu)斷開拓深(shen)度合(he)成技(ji)術應(ying)用場景(jing),創(chuang)立示范標(biao)桿(gan),形成對人工智(zhi)能(neng)行業整體的(de)帶動效(xiao)應(ying),從而促進新技(ji)術的(de)持續健康發(fa)展。