
近年來, 隨著(zhu)人(ren)工智能、計算(suan)機視覺、大數據、云計算(suan)、芯片等技術的迅速發(fa)展,人(ren)臉識(shi)別(bie)技術取得了(le)長足的進步并且在眾(zhong)多場(chang)景中得以成功應用并大規模商業化(hua)普(pu)及,為經濟(ji)社會的發(fa)展以及人(ren)們日常生活帶來便捷(jie) 。
就(jiu)市場(chang)發(fa)(fa)展(zhan)趨(qu)(qu)勢而(er)言, 人(ren)臉識別(bie)應用場(chang)景雖(sui)然滲(shen)透各個(ge)行業場(chang)景, 但市場(chang)規模增長趨(qu)(qu)勢出現分化, 國內市場(chang)呈(cheng)現從算(suan)法競(jing)爭(zheng)到芯(xin)片(pian)全產業鏈激(ji)烈競(jing)爭(zheng)的(de)(de)(de)狀(zhuang)態(tai); 就(jiu)技術發(fa)(fa)展(zhan)層面, 邊(bian)(bian)(bian)緣(yuan)端 SOC 芯(xin)片(pian)算(suan)力的(de)(de)(de)提升使得人(ren)臉識別(bie)系統中的(de)(de)(de)部分甚(shen)至全部算(suan)法可(ke)以運(yun)行在邊(bian)(bian)(bian)緣(yuan)設備(bei)上, 從而(er)使云邊(bian)(bian)(bian)結合已(yi)成為(wei)人(ren)臉識別(bie)產品(pin)和應用方案的(de)(de)(de)發(fa)(fa)展(zhan)趨(qu)(qu)勢。
本期(qi)的(de)(de)智能內參,我們(men)推薦全國信息技(ji)(ji)術標(biao)準化技(ji)(ji)術委員會的(de)(de)研究報(bao)告(gao)《2020 年人(ren)臉識別行業(ye)(ye)研究報(bao)告(gao)》,從(cong)技(ji)(ji)術特(te)點(dian)、行業(ye)(ye)發展(zhan)趨勢和標(biao)準化現狀三(san)方面還原人(ren)臉識別技(ji)(ji)術的(de)(de)最新發展(zhan)狀況。
本期內(nei)參來源:全國信息(xi)技術標準化(hua)技術委員會(hui)
原標題:
《2020 年人臉識(shi)別行(xing)業研究報告(gao)》
作者:蔣慧 等
一、什么是人臉識別?
人臉(lian)識別(bie) ( Face Recognition) 是一種(zhong)基于人的面部特征(zheng)信息進行(xing)身(shen)份識別(bie)的生物特征(zheng)識別(bie)技(ji)術 。 近年(nian)來(lai) , 隨著(zhu)人工智能 、 計算機視覺 、 大數據 、 云計算 、 芯片等(deng)技(ji)術的迅速發展 , 人臉(lian)識別(bie)技(ji)術取得(de)了(le)長足(zu)的進步并且在眾多場(chang)景中得(de)以(yi)成功應用 。
廣義(yi)的人(ren)(ren)臉(lian)識(shi)別(bie)(bie)(bie)實際包(bao)括構建人(ren)(ren)臉(lian)識(shi)別(bie)(bie)(bie)系(xi)統(tong)的一系(xi)列相關技術 , 包(bao)括人(ren)(ren)臉(lian)視(shi)圖采集 、 人(ren)(ren)臉(lian)定位 、 人(ren)(ren)臉(lian)識(shi)別(bie)(bie)(bie)預處理 、 身份確(que)認以及身份查(cha)找等(deng) ; 而狹義(yi)的人(ren)(ren)臉(lian)識(shi)別(bie)(bie)(bie)特指(zhi)通過人(ren)(ren)臉(lian)進行(xing)身份確(que)認或者(zhe)身份查(cha)找的技術和(he)系(xi)統(tong) 。 此外(wai) , 部分應用場(chang)景下還可能涉及質量評價 、 活(huo)體檢(jian)測等(deng)算法模(mo)塊。
人臉識(shi)別的應(ying)用模式主(zhu)要包括三種:
(1)、人(ren)(ren)臉驗證 (Face Verification) : 判定(ding)兩張人(ren)(ren)臉圖像是否(fou)屬(shu)于(yu)同(tong)一個人(ren)(ren) ,常用于(yu)身份認證如人(ren)(ren)證核驗 。
(2)、人臉(lian)辨識 ( Face Identification) : 給定一張人臉(lian)圖像 , 判斷是否在(zai)注冊庫(ku)中 , 若(ruo)在(zai)則返回具體(ti)的(de)身(shen)份(fen)信息 , 常用于靜態檢索(suo)或(huo)動(dong)態布控 。
(3)、人臉聚(ju)類(lei) ( Face Clustering) : 給定一(yi)批(pi)人臉圖(tu)像(xiang) , 將相同(tong)(tong)人的(de)(de)(de)圖(tu)像(xiang)歸類(lei)到同(tong)(tong)一(yi)個類(lei) , 不同(tong)(tong)人的(de)(de)(de)劃(hua)分為不同(tong)(tong)的(de)(de)(de)類(lei) , 常(chang)見的(de)(de)(de)應用有(you)智(zhi)能(neng)相冊 、 一(yi)人一(yi)檔等(deng) 。
1、發展歷程
人(ren)(ren)臉識別(bie)的(de)研究開始于 20 世(shi)紀 60 年代 , 到(dao) 90 年代進(jin)入了(le)(le)初級應(ying)用(yong)階段 ,主(zhu)要停留在學(xue)(xue)術研究和小范圍的(de)實驗室(shi)環(huan)境應(ying)用(yong) , 直(zhi)到(dao) 2012 年后(hou)的(de)深度學(xue)(xue)習(xi)的(de)復(fu)興 , 人(ren)(ren)臉識別(bie)技術取(qu)得(de)歷史(shi)性的(de)進(jin)步 , 真正實現大規模商業化普(pu)及 , 且識別(bie)能力(li)已(yi)經遠(yuan)遠(yuan)超過了(le)(le)人(ren)(ren)類的(de)常規辨識度 。
目前 , 從(cong)全球人(ren)臉(lian)識別技術(shu)領域的(de)應用(yong)場(chang)景布局來(lai)看(kan) , 安防 、 金融 、 交通 、 樓宇(yu)等是(shi)相對較(jiao)為成(cheng)熟(shu)的(de)領域 , 而在零(ling)售 、 廣告 、 智能設備 、 教育 、 醫療(liao) 、 娛樂等領域也均有較(jiao)多應用(yong)場(chang)景 , 為經濟(ji)社(she)會的(de)發展以及人(ren)們日常生(sheng)活的(de)便捷(jie)帶來(lai)了(le)新機(ji)遇 。
2、政策現狀
隨(sui)著人(ren)工(gong)智能技術(shu)(shu)(shu)水平的迅(xun)速發(fa)展與經濟發(fa)展水平的穩(wen)步踏進 , 在(zai)大(da)數據應用(yong)的帶(dai)領(ling)下(xia) , 人(ren)臉識(shi)別(bie)技術(shu)(shu)(shu)在(zai)智慧城市(shi) 、 安防(fang)市(shi)場等行業得到了廣闊的應用(yong) ,與此同時人(ren)臉識(shi)別(bie)技術(shu)(shu)(shu)應用(yong)過程所涉及的監(jian)管(guan)問(wen)題也面臨著越來越高的挑戰(zhan) 。面對目(mu)前(qian)正飛(fei)速發(fa)展的人(ren)臉識(shi)別(bie)技術(shu)(shu)(shu) , 我國制定了一系列政策來促進其更健康的發(fa)展。
2017 年 7 月 , 國(guo)務院發(fa)布 《 新(xin)一代(dai)人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)發(fa)展(zhan)規劃(hua) 》 ( 國(guo)發(fa) 〔 2017 〕 35 號 )指出建(jian)設安(an)全便捷的智(zhi)(zhi)能(neng)(neng)社(she)會(hui) , 圍(wei)繞行政管(guan)理 、 司法管(guan)理 、 城市管(guan)理 、環(huan)境保護等(deng)社(she)會(hui)治(zhi)理的熱點(dian)難點(dian)問(wen)題 , 促進人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)技(ji)術(shu)應用 , 推動社(she)會(hui)治(zhi)理現代(dai)化 。同(tong)時 , 圍(wei)繞社(she)會(hui)綜合(he)治(zhi)理 、 新(xin)型犯罪偵查 、 反(fan)恐等(deng)迫切(qie)需求 , 提(ti)出研發(fa)視頻圖像信息分析(xi)識(shi)別(bie)(bie)技(ji)術(shu) 、 生物特征識(shi)別(bie)(bie)技(ji)術(shu)的智(zhi)(zhi)能(neng)(neng)安(an)防與警(jing)用產品 , 建(jian)立智(zhi)(zhi)能(neng)(neng)化監測平臺的要求。
全(quan)國(guo)人(ren)(ren)大在(zai) 2018 年修正(zheng)的 《 中(zhong)華人(ren)(ren)民共和國(guo)反恐怖主義法(fa) 》 第(di)五十條(tiao)提到 :公安機關調查恐怖活動嫌(xian)疑(yi) , 可以(yi)依照有關法(fa)律規定(ding)對(dui)嫌(xian)疑(yi)人(ren)(ren)員進行盤問 、 檢查 、 傳喚 , 可以(yi)提取或者采集肖像 、 指紋(wen) 、 虹膜圖像等人(ren)(ren)體生物識別信息和血液 、 尿液 、 脫落細胞等生物樣本 , 并留存其簽名 。
2019 年 9 月(yue) , 中國人民銀(yin)行印發(fa)的 《 金(jin)融(rong)科(ke)技 ( FinTech ) 發(fa)展(zhan)規(gui)劃(hua) ( 2019-2021 年 ) 》 ( 以下(xia)簡稱(cheng)規(gui)劃(hua) ) , 明確提(ti)出構建適應互聯網(wang)時(shi)代的移動終端可信(xin)(xin)環(huan)境 , 充分利用可信(xin)(xin)計算(suan)(suan) 、 安全(quan)多方計算(suan)(suan) 、 密碼算(suan)(suan)法 、 生(sheng)物識(shi)別等(deng)信(xin)(xin)息技術(shu),建立健全(quan)兼顧安全(quan)與便捷的多元化(hua)身份認證體(ti)系 , 不斷豐富金(jin)融(rong)交易驗證手(shou)段,保障移動互聯環(huan)境下(xia)金(jin)融(rong)交易安全(quan) , 提(ti)升(sheng)金(jin)融(rong)服務的可得(de)性 、 滿意(yi)度與安全(quan)水平 。
同時 , 《 規劃 》 也提出強化需求引領作(zuo)用(yong) , 主(zhu)動(dong)適應數(shu)(shu)字(zi)經濟環境下市場需求的(de)快速變(bian)化 , 在保障客戶信息安(an)全的(de)前提下 , 利用(yong)大數(shu)(shu)據 、 物(wu)聯網等(deng)技術(shu)分(fen)析客戶金融需求 , 借助機器學習 、 生物(wu)識別 、 自(zi)然語(yu)言(yan)處理(li)等(deng)新一代人(ren)工智(zhi)能(neng)技術(shu) , 提升金融多媒體數(shu)(shu)據處理(li)與理(li)解能(neng)力 , 打造 “ 看憧文字(zi) ” 、 “ 聽懂語(yu)言(yan) ” 的(de)智(zhi)能(neng)金融產品與服務 , 這也為人(ren)臉識別的(de)安(an)全應用(yong)提供了思路(lu) 。
2019 年 9 月 , 工業(ye)和(he)信息(xi)化部公開(kai)征(zheng)求對 《 關于促進網(wang)絡(luo)安(an)全(quan)產業(ye)發展(zhan)的指導意(yi)見(jian) 》 ( 征(zheng)求意(yi)見(jian)稿 ) , 表(biao)示支持構建基于商(shang)用密碼(ma) 、 指紋識別(bie)(bie) 、 人臉識別(bie)(bie)等技術的網(wang)絡(luo)身份認證體系 , 著力(li)提升支撐網(wang)絡(luo)安(an)全(quan)管理 、 應對有組織高強度攻擊的能力(li) , 明確了生物(wu)特征(zheng)識別(bie)(bie)技術在網(wang)絡(luo)安(an)全(quan)產業(ye)發展(zhan)中的重(zhong)要意(yi)義 。
2020 年(nian) 11 月初(chu) 《 中華人(ren)民共和國國民經(jing)濟和社(she)會發(fa)展第十四(si)個五年(nian)規(gui)劃綱要 ( 建(jian)議稿(gao) ) 》 ( 以下簡稱(cheng) 《 建(jian)議稿(gao) 》 ) 全文發(fa)布(bu) , 其中明確提(ti)出加快(kuai)壯大新(xin)(xin)一代信息技(ji)(ji)術 、 生(sheng)物技(ji)(ji)術等產(chan)業(ye) , 推動互(hu)聯網 、 大數據 、 人(ren)工(gong)智能等同各產(chan)業(ye)深度融合 , 培(pei)育新(xin)(xin)技(ji)(ji)術 、 新(xin)(xin)產(chan)品 、 新(xin)(xin)業(ye)態 、 新(xin)(xin)模式 。
發(fa)(fa)展數字(zi)經(jing)濟 , 加強數字(zi)社(she)會(hui)(hui) 、 數字(zi)政府建(jian)(jian)設(she) , 提(ti)升公共(gong)服務(wu) , 社(she)會(hui)(hui)治(zhi)理等數字(zi)化智能水平(ping) 。 同時提(ti)出(chu)(chu) , 統籌發(fa)(fa)展和安全 , 建(jian)(jian)設(she)更高水平(ping)的(de)平(ping)安中國 , 加強社(she)會(hui)(hui)治(zhi)安防(fang)控體系建(jian)(jian)設(she) 。該規劃的(de)出(chu)(chu)臺(tai)為人臉(lian)識別(bie)技(ji)術和行(xing)業未來 5 年的(de)發(fa)(fa)展規定(ding)了目標和方向 。
信息(xi)安(an)全(quan)層面(mian) , 2016 年(nian) 11 月(yue)全(quan)國(guo)人(ren)大(da)(da)通過的(de) 《 網(wang)絡(luo)安(an)全(quan)法(fa) 》 中將個人(ren)生物識(shi)別信息(xi)的(de)管理進一(yi)步細化 , 范圍進一(yi)步明確 。 國(guo)家網(wang)信辦有(you)關負責人(ren)表示(shi),《 網(wang)絡(luo)安(an)全(quan)法(fa) 》 的(de)公(gong)布(bu)和施行不僅保障廣大(da)(da)群(qun)眾的(de)切身(shen)利益(yi) , 還有(you)利于(yu)高新技術的(de)應用 , 進而激發(fa)互聯網(wang)的(de)巨大(da)(da)潛力 。
2020 年 7 月由(you)全國(guo)人大公布的 《 數(shu)(shu)據(ju)(ju)(ju)安(an)全法 》 草案為(wei)數(shu)(shu)據(ju)(ju)(ju)加(jia)上 “ 防護罩 ” , 明(ming)確數(shu)(shu)據(ju)(ju)(ju)活動的紅線 , 將來在 “ 數(shu)(shu)據(ju)(ju)(ju)主權 、 數(shu)(shu)據(ju)(ju)(ju)經營 、 數(shu)(shu)據(ju)(ju)(ju)交易 ” 等方面 , 通(tong)過法律條(tiao)文的形式(shi) , 推(tui)動數(shu)(shu)據(ju)(ju)(ju)時(shi)代的快速發展(zhan) 。 國(guo)家堅持保(bao)(bao)障數(shu)(shu)據(ju)(ju)(ju)安(an)全與(yu)發展(zhan)并(bing)重 , 鼓勵(li)研發數(shu)(shu)據(ju)(ju)(ju)安(an)全保(bao)(bao)護技(ji)術 ,積極推(tui)進(jin)數(shu)(shu)據(ju)(ju)(ju)資源(yuan)開發利(li)用 , 保(bao)(bao)障數(shu)(shu)據(ju)(ju)(ju)依法有序自由(you)流動 。
2020 年 10 月 21日全國人(ren)大公布的(de)(de) 《 個人(ren)信(xin)息(xi)(xi)(xi)保護法 ( 草案 ) 》 規定了個人(ren)信(xin)息(xi)(xi)(xi)是以(yi)電子或(huo)者其(qi)他方式(shi)記(ji)錄的(de)(de)與已識(shi)別(bie)或(huo)者可(ke)識(shi)別(bie)的(de)(de)自然人(ren)有關(guan)的(de)(de)各(ge)種信(xin)息(xi)(xi)(xi) ; 規定了個人(ren)信(xin)息(xi)(xi)(xi)的(de)(de)處理包括個人(ren)信(xin)息(xi)(xi)(xi)的(de)(de)收集 、 存(cun)儲 、 使用 、 加工 、 傳輸 、 提供(gong) 、 公開等活動的(de)(de)要求(qiu) 。
二、技術細節
1、 人臉識別技術原理
當今(jin)主流的(de)人(ren)臉(lian)(lian)(lian)(lian)識(shi)(shi)別(bie)(bie)(bie)算法 , 主要包(bao)括人(ren)臉(lian)(lian)(lian)(lian)檢(jian)測 、 人(ren)臉(lian)(lian)(lian)(lian)預處理(li) 、 特(te)征項提(ti)取 、比對識(shi)(shi)別(bie)(bie)(bie) 、 活(huo)體鑒別(bie)(bie)(bie)五大(da)步驟 。 其中人(ren)臉(lian)(lian)(lian)(lian)檢(jian)測 、 人(ren)臉(lian)(lian)(lian)(lian)預處理(li) 、 特(te)征項提(ti)取可(ke)統稱為人(ren)臉(lian)(lian)(lian)(lian)視(shi)圖解析過程 , 即(ji)從視(shi)頻(pin)和圖像中檢(jian)測出人(ren)臉(lian)(lian)(lian)(lian) , 通過圖像質量判(pan)斷(duan)(duan) ,選取合適(shi)的(de)人(ren)臉(lian)(lian)(lian)(lian)圖片 , 提(ti)取人(ren)臉(lian)(lian)(lian)(lian)特(te)征向(xiang)量 , 用(yong)于后續比對識(shi)(shi)別(bie)(bie)(bie) ; 比對識(shi)(shi)別(bie)(bie)(bie)處理(li)可(ke)以分(fen)為人(ren)臉(lian)(lian)(lian)(lian)驗(yan)證 ( 1 :1 ) 和人(ren)臉(lian)(lian)(lian)(lian)辨識(shi)(shi) ( 1 :N ) 兩(liang)類 ; 活(huo)體鑒別(bie)(bie)(bie)算法用(yong)以判(pan)斷(duan)(duan)人(ren)臉(lian)(lian)(lian)(lian)識(shi)(shi)別(bie)(bie)(bie)處理(li)中的(de)人(ren)臉(lian)(lian)(lian)(lian)圖像 , 是否采(cai)集自(zi)真實人(ren)體 。
在實(shi)際應用(yong)(yong)中(zhong) , 除了上述(shu)人(ren)臉識(shi)別算法(fa) , 前(qian)端視圖(tu)采集技術(shu)(shu) 、 人(ren)臉數據存(cun)儲技術(shu)(shu) 、 應用(yong)(yong)軟件管理技術(shu)(shu)也是人(ren)臉識(shi)別技術(shu)(shu)應用(yong)(yong)中(zhong)重要的技術(shu)(shu)部(bu)分(fen) 。
2、 人臉識別的研究機構介紹
人(ren)臉(lian)(lian)識(shi)別(bie)作為(wei)最受關注的生物特征識(shi)別(bie)技(ji)術(shu) , 國內外有眾多科研院所 、 高等院校 、 企(qi)業等機構開展(zhan)人(ren)臉(lian)(lian)識(shi)別(bie)相(xiang)關技(ji)術(shu)的研究 、 開發和應(ying)用 。 截止(zhi) 2020年(nian) 10 月 , 據企(qi)查查數據統計 , 全國共有 10443 家(jia)企(qi)業的名稱(cheng) 、 產品 、 品牌 、經營范圍涵蓋 “ 人(ren)臉(lian)(lian)識(shi)別(bie) ” , 從(cong)成立時間來(lai)看 , 近 5 年(nian)相(xiang)關企(qi)業數量不斷劇增(zeng) ,2019 年(nian)成立了 1955 家(jia), 2020 年(nian)僅 10 月前就新(xin)增(zeng) 1139 家(jia) 。
科研機構。人臉(lian)(lian)識(shi)(shi)別技術(shu)(shu)廣受(shou)學(xue)(xue)術(shu)(shu)和產業研(yan)究(jiu)機(ji)構(gou)關注 。 全(quan)球范圍內(nei) , 有眾多(duo)知(zhi)名學(xue)(xue)術(shu)(shu)機(ji)構(gou)在(zai)從事人臉(lian)(lian)識(shi)(shi)別領域(yu)的(de)技術(shu)(shu)研(yan)究(jiu) , 比較有代表性的(de)人臉(lian)(lian)識(shi)(shi)別技術(shu)(shu)研(yan)究(jiu)機(ji)構(gou)包括(kuo)斯坦福大(da)學(xue)(xue) 、 加州大(da)學(xue)(xue)伯克(ke)利(li)分(fen)校 、 美國馬薩諸塞大(da)學(xue)(xue) 、 牛津大(da)學(xue)(xue) 、 多(duo)倫多(duo)大(da)學(xue)(xue) 、 香港中文大(da)學(xue)(xue) 、 中科院自動化(hua)所 、 清華大(da)學(xue)(xue)等 。
(1)、斯坦福大學(xue)。斯坦福大學(xue)是最早在人臉識別(bie)(bie)技(ji)術(shu)上(shang)取得突破的(de)研(yan)究機構(gou)之(zhi)一 。 由華人科學(xue)家李飛(fei)(fei)飛(fei)(fei)教授領街的(de)計算機視(shi)覺(jue)(jue)(jue)實驗室 , 通過每年(nian)度基于 ImageNet 數據庫舉辦的(de)大規模視(shi)覺(jue)(jue)(jue)識別(bie)(bie)挑戰(zhan)賽 ( ILSVRC) , 極大的(de)促進了(le)人臉識別(bie)(bie)和計算機視(shi)覺(jue)(jue)(jue)技(ji)術(shu)的(de)發展 。
近期 , 斯坦(tan)福(fu)大學的研究團隊(dui)研發出一(yi)款人臉跟蹤(zong)軟(ruan)(ruan)件 Face2Face, 它可以通過(guo)攝像(xiang)頭捕捉(zhuo)用戶的動(dong)作(zuo)和(he)面部表情 , 然后使(shi)用 Face2Face 軟(ruan)(ruan)件驅動(dong)視(shi)頻(pin)中(zhong)的目標人物做出一(yi)模一(yi)樣(yang)的動(dong)作(zuo)和(he)表情 , 效果極其(qi)逼(bi)真 。 這項技術使(shi)用一(yi)種密集光度一(yi)致性方法 (dense photometric consistency measure) 來實時跟蹤(zong)源(yuan)和(he)目標視(shi)頻(pin)中(zhong)的面部表情 。
研究人員們(men)稱 ,由(you)于(yu)源(yuan)素材與被拍攝者(zhe)之(zhi)間快(kuai)速而有效的變形傳遞 , 從而使復制面部(bu)表情成為可(ke)能 。 由(you)于(yu)嘴形與其(qi)所(suo)說的內容高(gao)度匹(pi)配 , 因此(ci)可(ke)以產生非常準確 、 可(ke)信的契合 。
(2)、加(jia)(jia)州大學(xue)(xue)(xue)伯克利分(fen)校。加(jia)(jia)州大學(xue)(xue)(xue)伯克利分(fen)校是國(guo)外人(ren)臉(lian)識(shi)(shi)別技術研(yan)究(jiu)的重要發源(yuan)地 , 早(zao)在(zai) 2005年(nian)(nian)就有關于(yu)人(ren)臉(lian)識(shi)(shi)別相(xiang)關研(yan)究(jiu)的理(li)論工作 。 其(qi)中馬(ma)毅 2008 年(nian)(nian)發表的 Sparsity and Robustness in Face Recognition, 在(zai)谷歌學(xue)(xue)(xue)術已獲得 6321 余次的引用(yong) , 在(zai)深度神經網絡(luo)被大家廣泛應用(yong)之(zhi)前 , 是主(zhu)流的人(ren)臉(lian)識(shi)(shi)別算法(fa) 。 在(zai)這篇文章中作者把(ba)稀疏表示理(li)論應用(yong)到人(ren)臉(lian)識(shi)(shi)別這個(ge)場景中 , 提出了一個(ge)通用(yong)分(fen)類算法(fa)用(yong)于(yu)人(ren)臉(lian)識(shi)(shi)別 。
這個(ge)新的(de)(de)(de)框架為(wei)人臉(lian)識別(bie)領域的(de)(de)(de)兩個(ge)關鍵課題(特(te)征(zheng)項提取和對遮擋的(de)(de)(de)魯棒性(xing))上(shang)提供了(le)更好(hao)的(de)(de)(de)理論(lun)指導。此外,該實驗(yan)室近期(qi)在(zai)用低維模型(xing)處理高維數(shu)據、 特(te)征(zheng)選擇等理論(lun)方(fang)向上(shang)有(you)一(yi)(yi)定(ding)的(de)(de)(de)產出, 提出了(le)一(yi)(yi)種(zhong)新型(xing)特(te)征(zheng)選擇方(fang)法 (Conditional Covariance Minimization, CCM) , 該方(fang)法基于(yu)最小化條件協方(fang)差(cha)算子(zi)的(de)(de)(de)跡來(lai)進行特(te)征(zheng)選擇, 取得了(le)較(jiao)為(wei)突出的(de)(de)(de)效果 。
(3)、美(mei)國(guo)(guo)馬薩諸(zhu)塞大學。美(mei)國(guo)(guo)馬薩諸(zhu)塞大學也是國(guo)(guo)外(wai)人(ren)(ren)(ren)臉識別技術研究的重要發源地(di) , 開源了(le)知名的人(ren)(ren)(ren)臉檢測(ce)(ce)數據庫 FDDB 和人(ren)(ren)(ren)臉識別數據集 LFWo FDDB 是全世界(jie)最具(ju)權威的人(ren)(ren)(ren)臉檢測(ce)(ce)評測(ce)(ce)平臺之(zhi)一 , 其中包含 2845 張(zhang)圖(tu)片 , 共有 5171 個人(ren)(ren)(ren)臉作為測(ce)(ce)試集 。測(ce)(ce)試集范圍包括(kuo)不同姿(zi)勢 、 不同分辨率 、 旋轉和遮擋等圖(tu)片 , 同時包括(kuo)灰度圖(tu)和彩色圖(tu) , 截止到(dao)目前(qian) FDDB 所公布的評測(ce)(ce)集仍然代表了(le)目前(qian)人(ren)(ren)(ren)臉檢測(ce)(ce)的世界(jie)最高(gao)水平 。
馬(ma)薩(sa)諸塞(sai)大(da)學還(huan)在 2007 年建立了(le)人(ren)臉(lian)識(shi)別(bie)評測數據集 LFW, 用于評測非約束條件下的人(ren)臉(lian)識(shi)別(bie)算法性(xing)能 , 截至到目(mu)前是人(ren)臉(lian)識(shi)別(bie)領(ling)域使(shi)用最廣泛(fan)的評測集合 。 該數據集由(you) 13000 多張(zhang)(zhang)全世界知名(ming)(ming)人(ren)士互聯(lian)網自然場景不(bu)同朝(chao)向 、 表情和光照環境人(ren)臉(lian)圖片組成 , 共 5000 多人(ren) , 其中 1680 人(ren)有 2 張(zhang)(zhang)或 2張(zhang)(zhang)以(yi)上人(ren)臉(lian)圖片 。 每張(zhang)(zhang)人(ren)臉(lian)圖片都有其唯一(yi)的姓名(ming)(ming) ID 和序號加以(yi)區分 。 LFW測試正確(que)率 , 代表了(le)人(ren)臉(lian)識(shi)別(bie)算法在處理不(bu)同種族 、 光線 、 角度 、 遮(zhe)擋等情況下識(shi)別(bie)人(ren)臉(lian)的綜合能力。
(4)、牛(niu)津大學(xue)。牛(niu)津大學(xue) VGG (視覺(jue)幾何)組實驗(yan)室從 2015 年開始人(ren)臉(lian)(lian)識(shi)別(bie)相關研(yan)究 ,包(bao)括具有影響力的(de)(de)(de)人(ren)臉(lian)(lian)數據庫的(de)(de)(de)發(fa)布以及(ji)深度人(ren)臉(lian)(lian)識(shi)別(bie)算法的(de)(de)(de)研(yan)究 。 該實驗(yan)室 2015 年在 BMVC 發(fa)表的(de)(de)(de) a Deep Face Recognition” 論(lun)文在谷歌學(xue)術已獲得3600 余次的(de)(de)(de)引用 , 其中(zhong)發(fa)布的(de)(de)(de) VGG-Face 已成為深度人(ren)臉(lian)(lian)識(shi)別(bie)領域最常用的(de)(de)(de)數據庫之 一 。
2018 年發布(bu)了大規模人臉(lian)識(shi)別數據 VGG — Face2, 是(shi) VGG-Face的(de)第二個(ge)版本 , 包含 331 萬(wan)圖片(pian) , 9131 個(ge) ID, 平均圖片(pian)數為 362.6, 且覆蓋(gai)了大范圍的(de)姿態 、 年齡和種族等 。 VGG-Face2 發布(bu)兩年 , 已(yi)經獲得了 800 余次引(yin)用(yong) 。 此(ci)外(wai) , 該(gai)實驗室近(jin)期(qi)在人臉(lian)識(shi)別置信度預測 、 基于(yu)集合的(de)人臉(lian)識(shi)別等子方向上 , 每年產出一(yi)定(ding)量的(de)學術(shu)工作 。
(5)、多倫多大學(xue)。加(jia)拿大多倫多大學(xue)是基于(yu)深(shen)度(du)學(xue)習的人臉(lian)識別技(ji)術發(fa)展的重要推手之一 。著名 “ 神經(jing)網絡(luo)之父 ” Geoffrey Hinton 是該校的代(dai)表性學(xue)者 , 在 Hinton 的帶領下(xia) ,多倫多大學(xue)的研究者將反(fan)向傳播 (Back Propagation) 算法(fa)應(ying)用到(dao)神經(jing)網絡(luo)與(yu)深(shen)度(du)學(xue)習 , 通(tong)過應(ying)用這項算法(fa)技(ji)術 , 人臉(lian)識別技(ji)術的識別性能得到(dao)極(ji)大提高 。
近期(qi) , 多(duo)倫多(duo)大學的(de)研究人員在人臉(lian)識別隱私保護(hu)技(ji)術領域(yu)取到了一(yi)些新(xin)的(de)進展 , 開發了一(yi)種(zhong)動(dong)態干擾算(suan)法(fa)來(lai)進行(xing)人臉(lian)隱私保護(hu) 。 這(zhe)種(zhong)技(ji)術原理基(ji)于(yu) “ 對抗(kang)性訓練 ” , 通(tong)過建立起兩種(zhong)相(xiang)互對抗(kang)的(de)算(suan)法(fa) , 當發現某種(zhong)檢(jian)測(ce)算(suan)法(fa)正(zheng)在尋找臉(lian)部特(te)征 , 干擾算(suan)法(fa)會自(zi)動(dong)調整(zheng)這(zhe)些特(te)征 , 在照片(pian)中產生非(fei)常細微的(de)干擾 , 通(tong)過這(zhe)些干擾來(lai)阻礙整(zheng)個(ge)檢(jian)測(ce)系(xi)統的(de)檢(jian)測(ce)效(xiao)果 。
(6)、香(xiang)港中文(wen)大(da)學。作為最(zui)早(zao)投(tou)入深(shen)(shen)度學習技術(shu)研發的(de)(de)華人團(tuan)隊 , 在(zai)多(duo)年布(bu)局的(de)(de)關(guan)鍵(jian)技術(shu)基礎之(zhi)上(shang) , 香(xiang)港中文(wen)大(da)學教授湯曉鷗率領(ling)的(de)(de)團(tuan)隊迅速取得技術(shu)突破(po) 。 2012 年國(guo)際計算(suan)視(shi)覺與模式(shi)識(shi)別會(hui)議(yi) ( CVPR ) 上(shang)僅有的(de)(de)兩篇深(shen)(shen)度學習文(wen)章均出自(zi)其實驗室 ;2011-2013 年間在(zai)計算(suan)機視(shi)覺領(ling)域兩大(da)頂級會(hui)議(yi) ICCV 和 CVPR 上(shang)發表(biao)了 14 篇深(shen)(shen)度學習論(lun)文(wen) , 占據全世界在(zai)這兩個會(hui)議(yi)上(shang)深(shen)(shen)度學習論(lun)文(wen)總(zong)數 ( 29 篇)的(de)(de)近一(yi)半(ban) 。 他在(zai) 2009 年獲(huo)得計算(suan)機視(shi)覺領(ling)域兩大(da)最(zui)頂尖的(de)(de)國(guo)際學術(shu)會(hui)議(yi)之(zhi)一(yi) CVPR最(zui)佳論(lun)文(wen)獎 , 這是 CVPR 歷史上(shang)來自(zi)亞洲的(de)(de)論(lun)文(wen)首次獲(huo)獎 。
(7)、中(zhong)科院自(zi)動化(hua)(hua)所。中(zhong)科院自(zi)動化(hua)(hua)所是國內(nei)領(ling)先的模式識(shi)(shi)別領(ling)域(yu)研(yan)究機(ji)構 。 多年來 , 在人(ren)臉(lian)(lian)識(shi)(shi)別領(ling)域(yu)開展了(le)廣泛的研(yan)究 。 自(zi)動化(hua)(hua)所李子青(qing)研(yan)究員(yuan)領(ling)導的人(ren)臉(lian)(lian)識(shi)(shi)別研(yan)究團隊 ,提出了(le)基于(yu)近紅(hong)外(wai)的人(ren)臉(lian)(lian)識(shi)(shi)別技術 , 對光照(zhao)變化(hua)(hua)影響的處理(li)有(you)較好的效果 ,并(bing)將該技術應用于(yu) 2008 年北京奧運(yun)會安保項目 。
自動化所(suo)孫哲南研(yan)究員團隊 , 在生成對抗網絡基礎(chu)上提出高(gao)保真(zhen)度的(de)(de)姿(zi)態不(bu)變模型 (High Fidelity Pose Invariant Model, HF — PIM) 來(lai)克服人臉識別任務中最為經典的(de)(de)姿(zi)態不(bu)一致問題 。實驗結(jie)果表明 , 該(gai)方(fang)法(fa)在基準數據集(ji)上的(de)(de)表現的(de)(de)視覺效果和定量性(xing)能指標(biao)都優于(yu)目前最好的(de)(de)基于(yu)對抗生成網絡的(de)(de)方(fang)法(fa) 。 此外(wai) , HF-PIM 所(suo)支(zhi)持(chi)的(de)(de)生成圖像分辨(bian)率也在原有方(fang)法(fa)的(de)(de)基礎(chu)上提升了一倍 。
(8)、清華大學。清華大學是國內最早(zao)從事人臉(lian)(lian)識(shi)別(bie)技術研(yan)究的研(yan)究機(ji)(ji)構之(zhi)一 。 清華大學蘇(su)光大教授 , 自 1980 年(nian)代就開始了(le)人臉(lian)(lian)識(shi)別(bie)技術研(yan)究工作 。 蘇(su)教授提出了(le) 1 :1 圖像采樣理論和鄰域圖像并(bing)行處(chu)(chu)理機(ji)(ji)理論 , 并(bing)在 2005 年(nian)通過多計算(suan)機(ji)(ji)并(bing)行處(chu)(chu)理技術 , 顯著提高了(le)人臉(lian)(lian)識(shi)別(bie)處(chu)(chu)理的性能 。
這項技術(shu)與(yu) 2012 年由(you)多倫多大(da)學 Hinton 團隊提出(chu)的(de)利用并行計算來提高反向傳播算法的(de)運算效能有(you)異曲同(tong)工之妙 。 同(tong)時 , 蘇教授團隊提出(chu)了最佳二維(wei)人(ren)臉 、 不同(tong)類別(bie)的(de)多特征描述(shu)以及MMP — PCA 等一系列(lie)人(ren)臉識(shi)別(bie)的(de)理(li)論和方法 。
科技類企業。在(zai)(zai)人(ren)(ren)臉識(shi)別(bie)技(ji)術(shu)(shu)(shu)研(yan)究(jiu)(jiu)(jiu)領(ling)域 , 眾多科技(ji)類企(qi)業(ye)也起到(dao)了(le)至關重(zhong)要的作用 。 微(wei)軟亞洲研(yan)究(jiu)(jiu)(jiu)院(yuan)較早就開(kai)始(shi)了(le)人(ren)(ren)臉識(shi)別(bie)技(ji)術(shu)(shu)(shu)研(yan)究(jiu)(jiu)(jiu) , 發表了(le)大量優秀的學(xue)術(shu)(shu)(shu)論文 ,2018 年 , 微(wei)軟亞洲研(yan)究(jiu)(jiu)(jiu)院(yuan)提出的深度學(xue)習殘差(cha)網絡 RESNET, 在(zai)(zai)研(yan)究(jiu)(jiu)(jiu)領(ling)域得到(dao)了(le)廣泛(fan)認可(ke) ; 蘋果公司在(zai)(zai)人(ren)(ren)臉識(shi)別(bie)技(ji)術(shu)(shu)(shu)上進行了(le)深入研(yan)究(jiu)(jiu)(jiu) , 自(zi) 2017 年開(kai)始(shi) ,就在(zai)(zai)其(qi) iphoneX 手(shou)機(ji)上引入了(le)刷(shua)臉解鎖功能(neng) ;
日本電(dian)氣 (NEC) 公(gong)(gong)司也(ye)是國際上(shang)人(ren)臉(lian)識(shi)別技(ji)術(shu)(shu)的(de)先 行者之(zhi) 一 , 很早就提出了基于人(ren)臉(lian)識(shi)別技(ji)術(shu)(shu)的(de)公(gong)(gong)共(gong)安全解決方案(an) ;
國內有(you) “ 人(ren)(ren)工智能四小龍 ” 之稱商(shang)湯(tang) 、 曠視、 依圖 、 云從(cong)等企業(ye) , 在人(ren)(ren)臉領(ling)域(yu)(yu) , 從(cong)學術研(yan)究(jiu)到產業(ye)實踐 , 都(dou)做了大量(liang)的(de)工作 , 在復雜場景(jing) , 大規模處理等領(ling)域(yu)(yu) , 不斷取(qu)得新的(de)成果 ; 國內傳統科技(ji)企業(ye)百度 、 阿里 、 騰訊 、 平安(an)科技(ji) 、 海康 、 大華(hua)等 , 也(ye)在人(ren)(ren)臉識別技(ji)術領(ling)域(yu)(yu)開展(zhan)廣泛深入的(de)研(yan)究(jiu) , 并結合其原有(you)的(de)業(ye)務(wu)領(ling)域(yu)(yu)的(de)場景(jing) , 取(qu)得顯著的(de)技(ji)術研(yan)究(jiu)成果 。
3、人臉識別技術優勢及局限性
技術優勢。在(zai)不同(tong)的生(sheng)物特征(zheng)識(shi)別方法(fa)中 , 人臉識(shi)別技術(shu)有(you)其(qi)自身特殊的優勢(shi) , 因而在(zai)生(sheng)物識(shi)別中有(you)著重要的地位 。
(1)、 非侵擾(rao)性(xing) , 人臉(lian)識別無需干擾(rao)人們的正(zheng)常行為就能較好地達到識別效果 , 只(zhi)要在攝像機(ji)前自然地停留片刻 , 用戶的身(shen)份就會(hui)被正(zheng)確(que)識別 。
(2)、便捷(jie)性 , 人(ren)臉識(shi)別(bie)采(cai)集(ji)(ji)設(she)備簡單 , 使(shi)用(yong)快捷(jie) 。 一般來說(shuo) , 常見的攝像頭(tou)就可以用(yong)來進(jin)行人(ren)臉圖像的采(cai)集(ji)(ji) , 不需特(te)別(bie)復雜(za)的專用(yong)設(she)備 。 圖像采(cai)集(ji)(ji)在數秒內即可完成 。
(3)、友好性 , 通過(guo)人(ren)(ren)臉(lian)識(shi)別(bie)身(shen)份的方法與人(ren)(ren)類的習慣(guan)一致 , 人(ren)(ren)和機器都(dou)可以使(shi)用(yong)人(ren)(ren)臉(lian)圖(tu)片進行識(shi)別(bie) 。
(4)、非接(jie)觸性 , 人臉圖像采(cai)集(ji) , 用戶不需要與設備(bei)直(zhi)接(jie)接(jie)觸 。 另外 , 可(ke)以(yi)在比較(jiao)遠的(de)距(ju)離進行人臉圖像的(de)采(cai)集(ji) 。 裝配了光學變焦鏡頭的(de)攝像頭 , 焦距(ju)可(ke)以(yi)提高到(dao) 10 倍(bei)以(yi)上 , 使景深(shen)范圍擴展(zhan)到(dao) 50 米以(yi)外 , 實現對(dui)遠景清晰拍照(zhao) ,有效采(cai)集(ji)遠處(chu)的(de)人臉圖像 。
(5)、可擴展性(xing) , 在(zai)(zai)人(ren)臉(lian)(lian)識別(bie)后 , 通(tong)過(guo)對識別(bie)結果數據進行(xing)下(xia)一(yi)步處理(li)和應用(yong) , 可以擴展出眾多(duo)實際應用(yong)方案 , 如應用(yong)在(zai)(zai)出入門禁(jin)控制 、 人(ren)臉(lian)(lian)圖(tu)片搜索 、上(shang)下(xia)班(ban)刷卡 、 非(fei)法人(ren)員識別(bie)等各個領域 。
(6)、隱蔽性(xing)(xing)強 , 安(an)全領域對于系統隱蔽性(xing)(xing)有較強要(yao)求 , 人(ren)臉識別在這方面比指紋等方式更具優勢 。
(7)、強(qiang)大的事后追蹤能力 , 系統記錄(lu)的人臉信(xin)息(xi)是非常重要且易于(yu)利(li)用的線索 , 更(geng)加(jia)有利(li)于(yu)進(jin)行事后追蹤應用 。
(8)、準確度高(gao) , 相比于(yu)人體 、 步態等其特(te)征(zheng) , 人臉特(te)征(zheng)具備(bei)更強的鑒(jian)別性(xing)與更低的誤(wu)報率 , 所(suo)能(neng)應用的底庫規(gui)模上高(gao)出許多 , 目前超大規(gui)模 ( 十億級(ji)別 ) 的人臉檢索已經可以實用 。
技術局限。人(ren)臉識(shi)別技術由于相似臉 、 年齡(ling) 、 算法偏見 、 面臨(lin)的(de)場景多樣化以及人(ren)臉圖像更易公開獲(huo)取等原因 , 技術本身也面臨(lin)著一定的(de)局限性 。
(1)、相(xiang)似臉較難解決 。 雙(shuang)胞胎(tai)或者長相(xiang)很相(xiang)近的人臉容(rong)易(yi)識別錯誤 , 而該問題在(zai)目前暫(zan)時沒(mei)有(you)新(xin)技術能(neng)完全(quan)解決 。 NIST 分(fen)析報告指出 , 大部分(fen)情況下雙(shuang)胞胎(tai)仍能(neng)區分(fen)分(fen)數高(gao)低(di) , 但是(shi)往往都(dou)在(zai)閾(yu)值之上 , 在(zai)開放環境(jing)下應用(yong)效果較差(cha) 。
(2)、算法偏見問(wen)題 。 由于當前人(ren)臉(lian)識別(bie)(bie)算法很大程度依賴(lai)于數(shu)據樣(yang)本 ,但是不(bu)(bu)同人(ren)群的人(ren)臉(lian)數(shu)據樣(yang)本存在差別(bie)(bie) , 這導致(zhi)了算法對不(bu)(bu)同地域 、 不(bu)(bu)同年齡人(ren)群的識別(bie)(bie)能力有差別(bie)(bie) 。
美國國家技術標準研究院(yuan) NIST 的(de)檢查表明 , 人臉(lian)識別軟件在不同(tong)地域 、 種族 、 性別 、 年(nian)齡(ling)上存在較(jiao)大差異(yi) 。 比如(ru) , 小孩子 , 老年(nian)人以(yi)及其(qi)他(ta)很(hen)少出現的(de)人種或者膚色(se)的(de)人臉(lian)識別率相對較(jiao)低(di) , 該問題亟需解決(jue) 。
(3)、人(ren)臉(lian)識(shi)(shi)別率易受(shou)多種因(yin)素影響 。 現(xian)有的(de)人(ren)臉(lian)識(shi)(shi)別系統在用(yong)(yong)戶配(pei)合(he) 、采集條件比(bi)較理想(xiang)的(de)情況(kuang)下可以取得令人(ren)滿意的(de)結(jie)果 。 但(dan)是 , 在用(yong)(yong)戶不(bu)配(pei)合(he) 、采集條件不(bu)理想(xiang)的(de)情況(kuang)下 , 會影響現(xian)有系統的(de)識(shi)(shi)別率 。 例如(ru)根據 NIST 的(de)測試(shi)報告 , 戴口(kou)罩情況(kuang)下大部分算法(fa)的(de)錯誤率會提高 1 個數量(liang)級以上 , 跨年齡 、 大角度(du)等(deng)因(yin)素也會造成不(bu)同程(cheng)度(du)的(de)下降 。
(4)、年(nian)齡(ling)變(bian)(bian)化(hua)(hua)的影響 。 隨著年(nian)齡(ling)的變(bian)(bian)化(hua)(hua) , 面部外觀也會變(bian)(bian)化(hua)(hua) , 特別是對于青少年(nian) , 這(zhe)種變(bian)(bian)化(hua)(hua)更加明顯 。 對于不(bu)同的年(nian)齡(ling)段 , 人臉識(shi)別算(suan)法的識(shi)別率也不(bu)同。
(5)、安(an)(an)全性問題(ti) 。 人(ren)臉(lian)(lian)識別系(xi)統信息存儲同(tong)樣會面臨黑客的攻擊 。 所以對數據加(jia)(jia)密很重要 。 隨著技(ji)術(shu)的不斷(duan)提(ti)升 , 人(ren)臉(lian)(lian)識別技(ji)術(shu)在安(an)(an)全性上(shang)需(xu)要加(jia)(jia)強 。
同(tong)時 , 人(ren)臉(lian)暴露度較高(gao) , 相比對其它(ta)生物特征數(shu)據(ju)更容(rong)易實現被(bei)動采集 。 這(zhe)也同(tong)時意味著人(ren)臉(lian)信息的數(shu)據(ju)更容(rong)易被(bei)竊取 , 不(bu)僅可能(neng)侵犯個人(ren)隱(yin)私 , 還會(hui)帶來(lai)財產損失 。 大(da)規模的數(shu)據(ju)庫泄露還會(hui)對一個族群或國家帶來(lai)安全風險(xian) 。
4、 人臉識別技術的發展趨勢
隨著人(ren)(ren)臉(lian)(lian)(lian)識(shi)別(bie)(bie)技(ji)(ji)術(shu)(shu)的廣泛應用 , 也在(zai)不斷促進(jin)技(ji)(ji)術(shu)(shu)本身持續發(fa)展(zhan) 。 基(ji)礎算(suan)法研究 、 人(ren)(ren)臉(lian)(lian)(lian)重建技(ji)(ji)術(shu)(shu) 、 戴口(kou)罩人(ren)(ren)臉(lian)(lian)(lian)識(shi)別(bie)(bie) 、 3D 人(ren)(ren)臉(lian)(lian)(lian)識(shi)別(bie)(bie)技(ji)(ji)術(shu)(shu) 、 新(xin)型人(ren)(ren)臉(lian)(lian)(lian)采(cai)集技(ji)(ji)術(shu)(shu) 、人(ren)(ren)臉(lian)(lian)(lian)聚類(lei)技(ji)(ji)術(shu)(shu) 、 和低質量人(ren)(ren)臉(lian)(lian)(lian)識(shi)別(bie)(bie)技(ji)(ji)術(shu)(shu) , 是產業界(jie)和學術(shu)(shu)界(jie)關注的熱點(dian)課題 ,也預示了人(ren)(ren)臉(lian)(lian)(lian)識(shi)別(bie)(bie)技(ji)(ji)術(shu)(shu)的發(fa)展(zhan)趨勢 。
基礎(chu)算(suan)(suan)法技術熱(re)點包括模(mo)型結(jie)(jie)構(gou)設(she)計 、 損失函數(shu)設(she)計 、 無監(jian)督(du) / 半(ban)監(jian)督(du)學(xue)習(xi)算(suan)(suan)法和分布(bu)式自(zi)學(xue)習(xi)算(suan)(suan)法等 。 模(mo)型結(jie)(jie)構(gou)設(she)計目前主(zhu)要有手工設(she)計與網絡結(jie)(jie)構(gou)搜索(suo) (NAS) 兩種思路 。 ICCV 2019 輕量(liang)級(ji)人臉識別 (Lightweight Face Recognition) 競賽結(jie)(jie)果顯示 , 雖然對大(da)模(mo)型場(chang)景下結(jie)(jie)構(gou)改進帶來(lai)的提升(sheng)則較(jiao)為有限 , 但是輕量(liang)級(ji)場(chang)景下網絡結(jie)(jie)構(gou)改進對于識別率提升(sheng)較(jiao)為明顯 。
損失函(han)數設計的(de)(de)核心在(zai)于學習具備鑒(jian)別性且足(zu)夠魯棒的(de)(de)特征 。 近年來基于度量學習與各(ge)類 margin — based 方法逐漸(jian)成為主(zhu)流。 在(zai)特征提(ti)取加速方面(mian) , 主(zhu)要的(de)(de)方法有(you)輕量級網絡 、 模型(xing)蒸惚 、 稀(xi)疏量化等 ; 在(zai)特征比(bi)對(dui)加速方面(mian) , 主(zhu)要的(de)(de)思路有(you)量化以及各(ge)類近似最近鄰檢索技術 。
低(di)質(zhi)(zhi)量(liang)人(ren)臉(lian)識別技(ji)術。在實際的(de)動態應用場(chang)景下 , 人(ren)臉(lian)識別技(ji)術由于場(chang)景的(de)不可控因素 , 采集到(dao)的(de)圖片質(zhi)(zhi)量(liang)與(yu)訓練圖片的(de)質(zhi)(zhi)量(liang)有很(hen)大差異 , 如人(ren)臉(lian)偏(pian)轉 , 大幅度(du)側臉(lian) ; 運動模糊和失(shi)焦模糊 ; 遮擋物(例如口罩 , 墨(mo)鏡) ; 低(di)的(de)光(guang)照強度(du)和對比度(du) ; 視頻傳輸由于編解碼(ma)過程產生的(de)人(ren)臉(lian)信息丟失(shi)等 , 這(zhe)些(xie)因素導致準確率(lv)極度(du)下降 。
針(zhen)對(dui)(dui)這些(xie)具體問題 , 研究(jiu)人(ren)員提出綜合利用(yong)各(ge)種圖(tu)(tu)(tu)像(xiang)增強技(ji)術和(he)(he)圖(tu)(tu)(tu)像(xiang)生(sheng)成(cheng)技(ji)術對(dui)(dui)人(ren)臉識別算法準確(que)率(lv)進行(xing)(xing)提升(sheng)的方(fang)法 , 如采用(yong)對(dui)(dui)抗式生(sheng)成(cheng)網絡對(dui)(dui)攝像(xiang)頭的風(feng)格進行(xing)(xing)遷移 , 采用(yong)基于深(shen)度學習的方(fang)法對(dui)(dui)小尺寸(cun)模(mo)糊(hu)(hu)人(ren)臉進行(xing)(xing)超分辨率(lv)重(zhong)建和(he)(he)基于注意力機制對(dui)(dui)人(ren)臉圖(tu)(tu)(tu)片進行(xing)(xing)去模(mo)糊(hu)(hu)處理等 。
此外 , 3D 人臉識(shi)別技術也(ye)可以有效解(jie)決復雜場景下(xia)人臉單模態魯棒(bang)性(xing)不足問(wen)題(ti) , 如(ru)大角度 、 遮擋引(yin)起的效果下(xia)降問(wen)題(ti) , 常(chang)用的融(rong)(rong)合(he)策略(lve)有相似度融(rong)(rong)合(he) 、 特征融(rong)(rong)合(he) 、 決策融(rong)(rong)合(he)等(deng) 。
戴(dai)口罩人(ren)臉識別(bie)技術。今(jin)年(nian)新型冠(guan)狀病毒疫情(qing)期間戴(dai)口罩人(ren)臉識別(bie)受到較大關注 。 常用的解決(jue)方(fang)法有數據增強 、 遮擋恢復(fu) 、 多部件模(mo)型融合等(deng) , 可應用在人(ren)臉布控(kong) 、 陌生人(ren)檢測 、 無感通行中 , 均不需要(yao)摘下口罩 , 在 30 萬(wan)人(ren)像庫的規模(mo)下 , 戴(dai)口罩人(ren)臉識別(bie)準確率可大于 90% 。
人(ren)臉(lian)聚類無論(lun)是在個人(ren)領域(yu)的相集管(guan)理(li)還是在智慧城市治理(li)領域(yu)都有較為廣(guang)泛(fan)的應用 。 早期主要基于傳(chuan)統的聚類方法如 k-means 等 , 但效果不佳 。 近年(nian)來(lai) , 基于 GCN 的人(ren)臉(lian)聚類方法嶄露頭角 。 實際業(ye)務中 , 時(shi)空信息的挖(wa)掘也是研究(jiu)的熱點 。
特定群(qun)體(ti)(ti)識別技術。針對兒(er)童/老(lao)人(ren) 、 不同(tong)膚色(se)群(qun)體(ti)(ti)的人(ren)臉識別 , 有標簽的數據(ju)較(jiao)少 , 而無標簽的數據(ju)更多些(xie) 。 研究(jiu)人(ren)員(yuan)提出可以利用半監(jian)督/無監(jian)督學習方法(fa)帶來性能(neng)的進一步提升 。 同(tong)時(shi) , 對抗 、 域適應等方法(fa)也是研究(jiu)人(ren)員(yuan)較(jiao)為關(guan)注的方法(fa) 。 在特定群(qun)體(ti)(ti)識別中 , 應考慮如何(he)方便老(lao)年人(ren)使用人(ren)臉識別系(xi)統(tong) 。
為了(le)防范(fan)照片 、 視頻 、 頭模等假體對人臉識別系統的(de)攻擊(ji) , 呈現攻擊(ji)檢測算法也是研究的(de)熱點 , 主要檢測原理(li)包括 :
a ) 離散圖像檢測方式 , 即利用一幅(fu)或多幅(fu)圖像進行判(pan)斷 ;
b ) 連(lian)續(xu)圖像檢測(ce)方式 , 即采用連(lian)續(xu)圖像序列(lie)進(jin)行判(pan)斷,如(ru)檢測(ce)顯示器邊(bian)緣 、 邊(bian)框(kuang) 、 屏幕(mu)反光 、 像素(su)點 、 條紋分(fen)析等進(jin)行判(pan)斷 ;
c ) 用戶主動配(pei)合(he)檢測方式 , 即通過指令要求用戶完成(cheng)相應動作如(ru)點(dian)頭 、 抬頭 、左右轉頭 、 張嘴 、 眨眼 、 跟讀屏顯提示信息等進(jin)行判斷 ;
d ) 基于(yu)輔助(zhu)硬(ying)件設(she)備的(de)檢測方式(shi) , 即利用(yong)(yong)輔助(zhu)硬(ying)件設(she)備獲取(qu)更多判斷依(yi)據輔助(zhu)進行判斷 , 如利用(yong)(yong)深(shen)度攝像頭采(cai)集人臉(lian)深(shen)度信息或利用(yong)(yong)特定波長光源投射并(bing)檢測在皮膚或非(fei)皮膚材質上產生的(de)發射率(lv)差異等 ;
e ) 用戶(hu)被動配合檢測方式 , 如 : 利用靜(jing)脈(mo)血(xue)(xue)管 、 肌肉 、骨(gu)骼 、 靜(jing)脈(mo)血(xue)(xue)液中脫氧血(xue)(xue)色(se)素對紅外(wai)線(xian)的(de)吸收特(te)性 , 判斷其(qi)是否來(lai)自(zi)活體 ; 通過(guo)(guo)特(te)定指令(ling)引導用戶(hu)眼(yan)球運動 , 并通過(guo)(guo)跟(gen)蹤眼(yan)球運動以(yi)判斷是否為真實活體 。
多(duo)模(mo)態(tai)融合(he)識別技術(shu)。多(duo)模(mo)態(tai)融合(he)識別技術(shu)可以有效(xiao)解(jie)決復雜場(chang)(chang)景(jing)下人臉單(dan)模(mo)態(tai)魯棒(bang)性(xing)不足(zu)問(wen)題(ti) 。 如(ru)大角(jiao)度(du) 、 遮(zhe)擋 、 像素過低引起的(de)效(xiao)果下降(jiang)問(wen)題(ti)或(huo)應用(yong)場(chang)(chang)景(jing)對于安全性(xing)可靠性(xing)要求很高的(de)場(chang)(chang)景(jing) , 多(duo)模(mo)態(tai)可以增強識別的(de)可信度(du) 。
多模態識(shi)別(bie)有兩個發展(zhan)方向 , 一個方向是(shi)在臉部圖像特征識(shi)別(bie)的(de)(de)基礎上(shang) , 增加(jia)頭(tou)肩和形(xing)體的(de)(de)識(shi)別(bie) , 這種(zhong)技術的(de)(de)好處是(shi)可以(yi)不必增加(jia)額外的(de)(de)采集單元 ; 另外一個方向是(shi) , 融合(he)其他生物識(shi)別(bie)模態 , 如靜脈紋理 , 聲紋信(xin)息等 , 這種(zhong)技術除了(le)能夠提高(gao)算法(fa)的(de)(de)魯(lu)棒性之外 , 還可以(yi)提高(gao)活體驗證的(de)(de)可信(xin)度 , 在行業(ye)里受到(dao)了(le)較為廣泛的(de)(de)關注(zhu) 。
三、人臉識別行業
1、行業發展概述
隨著云計算 、 大數據 、 物聯網(wang) 、 人工智(zhi)能(neng)(neng)等(deng)計算機科學技術(shu)的飛速發展以及人臉識別技術(shu)在(zai)實際(ji)應用中的不斷成熟 , 人臉識別技術(shu)在(zai)智(zhi)慧(hui)安防 、 智(zhi)慧(hui)城市(shi) 、 智(zhi)能(neng)(neng)家居 、 移動支付等(deng)領域繼續(xu)大放異彩 , 并且人臉識別的一些新應用場景也(ye)不斷地(di)被挖掘出來 。
全(quan)球人臉(lian)(lian)識(shi)別(bie)行業(ye)規模(mo)依然在(zai)以(yi)非(fei)常高的(de)速度進行增長 。 根據(ju)MarketsandMarkets 發(fa)布的(de)全(quan)球人臉(lian)(lian)識(shi)別(bie)市場(chang)相關(guan)報告 , 預(yu)計全(quan)球人臉(lian)(lian)識(shi)別(bie)市場(chang)規模(mo)將(jiang)從 2019 的(de) 32 億美(mei)元增長到 2024 年(nian)的(de) 79 億美(mei)元 , 在(zai)預(yu)測(ce)期內( 201 9-2024 年(nian) ) 將(jiang)以(yi) 16.6% 的(de)復(fu)合(he)年(nian)增長率(lv)進行增長 。
國內方面(mian) , 中(zhong)國人(ren)臉識(shi)(shi)別技術(shu)投(tou)入在 2017-2018 年達到巔峰(feng) , 根(gen)據 IHSMarkit 的(de)數據 , 2018 年 , 中(zhong)國在全球人(ren)臉識(shi)(shi)別市場的(de)業(ye)務占(zhan)據了(le)將(jiang)(jiang)近一半的(de)份額(e)(e) 。 2019 至(zhi) 2020 年 , 人(ren)臉識(shi)(shi)別技術(shu)發展趨(qu)于平(ping)緩(huan) , 進入理智期(qi) 。 依據 IT 桔子數據統計(ji) , 截(jie)至(zhi)目前(qian) , 中(zhong)國人(ren)臉識(shi)(shi)別技術(shu)總投(tou)資額(e)(e)達到 406 億元(yuan) 。 前(qian)瞻產業(ye)研究院預計(ji) , 未來五年人(ren)臉識(shi)(shi)別市場規(gui)模將(jiang)(jiang)保持 23% 的(de)平(ping)均復合增長(chang)速度 ,到 2024 年市場規(gui)模將(jiang)(jiang)突破 100 億元(yuan) 。
2、 行業發展現狀
人(ren)臉(lian)識(shi)別(bie)(bie)產業鏈以人(ren)臉(lian)識(shi)別(bie)(bie)算(suan)法(fa)作(zuo)為(wei)中間層 , 其上(shang)游為(wei)器件 、 通用硬件 、基礎軟件 , 上(shang)游提供了人(ren)臉(lian)識(shi)別(bie)(bie)算(suan)法(fa)的(de)輸入 、 訓(xun)練(lian) 、 開發和運行(xing)環境(jing) ; 下(xia)游為(wei)設備和產品(pin) , 最終體(ti)現為(wei)解決方案 , 下(xia)游是(shi)人(ren)臉(lian)識(shi)別(bie)(bie)算(suan)法(fa)的(de)產品(pin)形態(tai) 。
從產業鏈上游來看 , 國內(nei)廠商 ( 以華為 、 寒武紀(ji)為代(dai)表 ) 在芯(xin)(xin)片(pian)(pian)(pian)設計方面有較(jiao)強實力 , 在芯(xin)(xin)片(pian)(pian)(pian)制(zhi)造(zao)方面 , 除去手機(ji)等(deng)對芯(xin)(xin)片(pian)(pian)(pian)精密程度要求較(jiao)高的(de)設備(bei) ,國內(nei)廠商具備(bei)制(zhi)造(zao)芯(xin)(xin)片(pian)(pian)(pian)的(de)能力 。 但高端芯(xin)(xin)片(pian)(pian)(pian)的(de)制(zhi)造(zao)工藝以及基(ji)本(ben)元器件都被國外壟斷 , 成為制(zhi)約(yue)上游廠商發(fa)展的(de)瓶(ping)頸 。
從人臉識別算(suan)法層面來看 , 國內廠(chang)商具備優勢(shi) , 但數據(ju)隱私問(wen)題 、 人種 /地域帶來的(de)(de)算(suan)法性(xing)能公(gong)平性(xing)問(wen)題 , 是國內廠(chang)商急需(xu)解決的(de)(de)問(wen)題 。
產業鏈下游 , 人臉識別(bie)應(ying)用(yong)越(yue)來越(yue)廣泛 , 甚至出現過(guo)度(du)濫用(yong)盜取用(yong)戶(hu)隱(yin)私的(de)事件 。 黑客攻(gong)擊(ji)(ji) 、 非(fei)活體(ti)攻(gong)擊(ji)(ji)對人臉識別(bie)系(xi)統安全性也提出了挑戰 , 用(yong)戶(hu)隱(yin)私保(bao)護和安全性成為掣肘 , 急需相關政(zheng)策(ce)法規(gui)來規(gui)范市場 。
基礎器件:
通用處理器。目前 , 通用處(chu)理(li)器(qi)主(zhu)要包括 x86 、 ARM 、 RISC — V 三大系列 。 x86 處(chu)理(li)器(qi)仍是服務(wu)器(qi)端主(zhu)處(chu)理(li)器(qi)的首(shou)選 。 出(chu)于(yu)穩定性(xing)考慮 , Intel 的 xeon 系列占據了市場(chang)的主(zhu)導地位(wei) , AMD 鮮有應(ying)用 , 反而國(guo)內的海光(guang) 、 兆芯(xin)的 x86 處(chu)理(li)器(qi)因國(guo)產(chan)化替代等原因得到了少量(liang)的份額 。 ARM 處(chu)理(li)器(qi)是手機等智能終端的首(shou)選 , 隨著性(xing)能提(ti)升和軟(ruan)件生態(tai)的完(wan)善 , ARM 處(chu)理(li)器(qi)也逐漸向服務(wu)器(qi)擴張 , ARM 公(gong)司也推(tui)出(chu)了一(yi)系列高性(xing)能核心和 Server Reday 認證支持這一(yi)舉措 。
應用(yong)于智能終端的(de)(de)(de)(de) ARM 芯(xin)(xin)片的(de)(de)(de)(de)代(dai)表(biao)(biao)包括(kuo)海思的(de)(de)(de)(de)麒麟(lin)系列 、 高(gao)(gao)通的(de)(de)(de)(de)驍龍系列 、 聯發科的(de)(de)(de)(de) MTK 和瑞芯(xin)(xin)微(wei)的(de)(de)(de)(de) RK 等 ; 應用(yong)于服務端的(de)(de)(de)(de) ARM 芯(xin)(xin)片的(de)(de)(de)(de)代(dai)表(biao)(biao)包括(kuo)海思的(de)(de)(de)(de)鯉鵬芯(xin)(xin)片和飛騰(teng)的(de)(de)(de)(de)騰(teng)云(yun) S 系列等 。 RISC V 是(shi)開源(yuan)的(de)(de)(de)(de)處(chu)理器架(jia)(jia)構(gou) , 隨著(zhu)美國對中國高(gao)(gao)科技(ji)領域的(de)(de)(de)(de)打(da)壓 , 該架(jia)(jia)構(gou)也成為國產化的(de)(de)(de)(de)重要選(xuan)擇(ze) 。
平頭哥推出的鉉鐵 910 芯片就是采用(yong)RISC — V 架(jia)(jia)構 , 中(zhong)天微(wei)和(he)小(xiao)米松果電子也在(zai)(zai)做 RISC-V 的相(xiang)關工(gong)作 。 國(guo)內主(zhu)流的通用(yong)處理器(qi)還包括采用(yong) MISP 架(jia)(jia)構的龍芯和(he)采用(yong) Alpha 架(jia)(jia)構的申威 。 總體來(lai)說,在(zai)(zai)通用(yong)處理器(qi)領(ling)域的選擇相(xiang)對豐富 , 以海思(si)為代(dai)表(biao)的國(guo)內芯片設計公(gong)(gong)司(si)已經走到(dao)與國(guo)外老牌(pai)芯片設計公(gong)(gong)司(si)對等的位(wei)置(zhi) , 主(zhu)要問題在(zai)(zai)于先(xian)進制(zhi)(zhi)程(cheng)的芯片代(dai)工(gong)制(zhi)(zhi)造的風險 。
AI 加速 SOC。與采用(yong)(yong) GPU 的(de)通用(yong)(yong)并行(xing)計(ji)算(suan)(suan)不同 , AI 加速 SOC 是(shi)通過內置專門針對(dui) AI 算(suan)(suan)法設計(ji)的(de)加速單(dan)(dan)元(yuan) , 實現針對(dui) AI 的(de)高(gao)運(yun)算(suan)(suan)效率(lv) , 隨著人工智能(neng)落(luo)地快速崛起的(de)專用(yong)(yong)芯片 。 NVIDIA 最早針對(dui) GPU 通用(yong)(yong)并行(xing)計(ji)算(suan)(suan)建立了(le)(le) CUDA 生態(tai)環境 , 使其成為 AI 落(luo)地最大的(de)算(suan)(suan)力提供商 , 也在(zai) AI 進一(yi)步發展(zhan)階段 , 適時推出了(le)(le)面向張量運(yun)算(suan)(suan)的(de) TensorCore 和面向深度學習的(de) NVDLA 加速單(dan)(dan)元(yuan) , 進一(yi)步鞏固了(le)(le)其在(zai) AI 加速領域的(de)地位 。 Google 依(yi)賴(lai)其軟件(jian)優勢 , 推出了(le)(le)與 Tensorflow 緊密結合的(de) TPU, 但(dan)是(shi)除了(le)(le) Google 大規模(mo)使用(yong)(yong)外 , 并沒有得到(dao)市場的(de)廣泛應用(yong)(yong)。
海思在(zai) AI 加速領域也是頗有建樹(shu) , 先后(hou)推出了 hisi 35xx 系(xi)列(lie)(lie)芯片(pian)和(he)昇騰系(xi)列(lie)(lie)芯片(pian) 。 定(ding)位端側的 hisi 35xx 系(xi)列(lie)(lie) Al 加速芯片(pian)主張圖像 +AI 合一 SOC 設計,能(neng)提供(gong) 0.5TOPS ? 4TOPS 不等的算(suan)力(li)(li) , 在(zai)平安(an)城市 、 交通 、 電力(li)(li) 、 人臉門禁 、車(che)載(zai)等市場廣(guang)受青睞(lai) ; 定(ding)位邊(bian)緣側和(he)云中心(xin)的昇騰系(xi)列(lie)(lie) AI 加速芯片(pian)能(neng)夠提供(gong)16TOPS-512TOPS 不等的算(suan)力(li)(li) , 具有算(suan)力(li)(li)高功(gong)耗低的特點 , 鮑鵬+昇騰的專用服務(wu)器也在(zai)數(shu)據中心(xin)取得應用 。
中科院(yuan)背景(jing)的(de)寒武紀 , 依(yi)托在(zai)(zai)芯(xin)(xin)(xin)片(pian)領域(yu)的(de)深厚積(ji)累 , 成為科創版第一(yi)個上市的(de) AI 芯(xin)(xin)(xin)片(pian)公司 , 其推出(chu)的(de) MLU220 和(he) MLU270 芯(xin)(xin)(xin)片(pian)分(fen)別能(neng)夠提供 8TOPS 和(he)128TOPS 的(de)算力 , 也已經(jing)在(zai)(zai)多(duo)(duo)個行(xing)業(ye)取(qu)得應用 。 除寒武紀以外 , 還有眾多(duo)(duo)創業(ye)公司切入(ru) AI 加速 SOC 的(de)賽道 , 如地平線的(de)征程 、 旭日(ri)芯(xin)(xin)(xin)片(pian) , 依(yi)圖的(de)求索芯(xin)(xin)(xin)片(pian)等 。與通用處(chu)理(li)器類似 , 國內不乏能(neng)夠設(she)計(ji)頂級 AI 加速 SOC 的(de)廠(chang)商 , 主要風險在(zai)(zai)于先進制程芯(xin)(xin)(xin)片(pian)的(de)代工(gong)制造 。
CMOS 傳感器。視(shi)頻圖(tu)像的采集(ji)質量 , 直(zhi)接關系到(dao)人臉(lian)識別系統的準確率 , 而(er)視(shi)頻圖(tu)像的采集(ji) , 則(ze)離不開 CMOS 傳(chuan)感(gan)器(qi) 。 目前主(zhu)流的 CMOS 傳(chuan)感(gan)器(qi)的供應商包括索尼 (SONY) 、 三星 ( SANSUNG ) 、 豪威科(ke)技(ji) (Ominivison) 和安森美 (ON Semiconductor ) 等 。
其中 SONY 以其長期的(de)技術積(ji)累(lei) , 無論(lun)是消(xiao)費電(dian)(dian)子(zi)還是安防等(deng)專業應(ying)用領(ling)(ling)域(yu) , 都占據了較高的(de)市(shi)場(chang)份額 。 三(san)星主要應(ying)用于手機等(deng)消(xiao)費電(dian)(dian)子(zi) , 豪威科技和安森(sen)美則集中在安防 、 汽車電(dian)(dian)子(zi)專業領(ling)(ling)域(yu)發力 。 國產 CMOS的(de)選擇(ze)有(you)中星微 、 格科微等(deng) , 不過目前主要仍然應(ying)用在 USB 攝像頭等(deng)一些消(xiao)費領(ling)(ling)域(yu) , 尚未進入(ru)專業市(shi)場(chang) 。
隨著(zhu)疫情的(de)(de)(de)發(fa)展 , 測溫需求快速爆(bao)發(fa) 。 熱(re)成像(xiang)傳(chuan)(chuan)感(gan)(gan)(gan)器(qi)是一種特殊(shu)的(de)(de)(de)成像(xiang)傳(chuan)(chuan)感(gan)(gan)(gan)器(qi) , 因(yin)其屬于軍民(min)兩用(yong)的(de)(de)(de)特性(xing) , 國內傳(chuan)(chuan)統供(gong)應商包括(kuo)高(gao)德紅(hong)外 、 大(da)(da)立(li)科(ke)技等(deng) 。 海康威視(shi)以創新業(ye)務(wu)的(de)(de)(de)方(fang)式(shi)持(chi)續加大(da)(da)在熱(re)成像(xiang)傳(chuan)(chuan)感(gan)(gan)(gan)方(fang)面的(de)(de)(de)投(tou)入(ru) , 今年(nian) 4 月更(geng)是從(cong)福建(jian)安(an)芯(xin)半導體采購光刻機用(yong)于熱(re)成像(xiang)傳(chuan)(chuan)感(gan)(gan)(gan)芯(xin)片的(de)(de)(de)生產 。 大(da)(da)華股份則(ze)于2018 年(nian)與FLIR建(jian)立(li)合作(zuo) , 切(qie)入(ru)此項業(ye)務(wu) 。
存儲(chu)芯(xin)(xin)(xin)片(pian)(pian)。存儲(chu)芯(xin)(xin)(xin)片(pian)(pian)在(zai)智能終端中占據了(le)較(jiao)大一(yi)部分成(cheng)本 , 具體包括 RAM 芯(xin)(xin)(xin)片(pian)(pian)和 FLASH 芯(xin)(xin)(xin)片(pian)(pian) , 其中 FLASH 芯(xin)(xin)(xin)片(pian)(pian)又可(ke)以進(jin)一(yi)步分為 NOR FLASH 和 NAND FLASH 。
面(mian)向通用服務(wu)器(qi)的(de) RAM 芯(xin)片的(de)供應商(shang)主(zhu)要包括三星 ( SANSUNG ) 、 海力(li)士 ( Hynix ) 等(deng)(deng) , 因規模效(xiao)應 , 韓系供應商(shang)的(de)地(di)位難以撼動 。 面(mian)向嵌(qian)入式設備(bei)的(de)選擇更加豐富 , 合肥(fei)長鑫和紫光半導(dao)體等(deng)(deng)國(guo)內廠家也在積極(ji)投入 , 已經(jing)進入到投產階段 。
與(yu) NAND FLASH 廣泛應(ying)(ying)用(yong)(yong)于 SSD 相比 , NOR FLASH 則相對小眾 , 主(zhu)(zhu)要(yao)應(ying)(ying)用(yong)(yong)于嵌入式設(she)備 。 我國的兆易創新是(shi)(shi)該領域的主(zhu)(zhu)流供應(ying)(ying)商之一(yi) , 占據全(quan)球(qiu)第四的市場排名 。 NAND FLASH 與(yu) RAM 類似(si) , 具有通用(yong)(yong)性 , 是(shi)(shi)半導體行業的必爭之地 , 除三星和海力(li)士之外 , 東芝 、 鎂光(guang) 、 西部數據等也都是(shi)(shi)這一(yi)領域的角逐者(zhe) 。 國內的長江(jiang)存儲推(tui)出了與(yu)主(zhu)(zhu)流產(chan)品(pin)性能相當的 64 層(ceng) 3D NAND, 并在華為mate 系列高端手(shou)機中取得了應(ying)(ying)用(yong)(yong)。
其他器件。其他的應(ying)用(yong)于人臉識別行(xing)業的器件(jian)則與通用(yong)的電(dian)子(zi)行(xing)業類似 , 主要(yao)包括電(dian)源芯片(pian) 、 電(dian)阻 、 電(dian)容 、 電(dian)感 、 PCB 敷(fu)銅(tong)板等 。 總體來說(shuo) , 國內的供應(ying)基本可控,但在高精度要(yao)求方(fang)面 , 仍需要(yao)借助國外供應(ying)商 。 在全球(qiu)化產業鏈高度發展(zhan)的今(jin)天 , 各個領域都有深度耕耘(yun)者 , 全球(qiu)化采購最(zui)優器件(jian) , 仍然度的最(zui)佳選擇(ze) 。
通用硬件:
通用服務器。通用(yong)服務(wu)器(qi)在人臉識別系統中的(de)主要(yao)作(zuo)用(yong)是業(ye)務(wu)系統和管理(li)節點(dian) , 從(cong)軟件(jian)生態的(de)完備性角度 , 通用(yong)服務(wu)器(qi)以 X86 架構為主 , 但 ARM 、 RISC-V 等(deng)其他架構的(de)服務(wu)器(qi)已經嶄露(lu)頭角 。 x86 服務(wu)器(qi)的(de)供應商主要(yao)包括 Dell 、 聯(lian)想(xiang) 、 曙光 、浪(lang)潮等(deng) , 華為的(de)泰山服務(wu)器(qi)則是 ARM 架構的(de)典型代表 。
計算服務器。AI 服(fu)務(wu)器是(shi)采(cai)用(yong)(yong)異構(gou)形(xing)式的(de)(de)服(fu)務(wu)器 , 出于(yu)生態友好和(he)(he)總算(suan)(suan)力(li)高兩方(fang)面因(yin)素(su),目前(qian)的(de)(de)主流方(fang)案(an)仍是(shi) Intel x86CPU+Nvidia GPU, 最新(xin)的(de)(de) 8 卡(ka) T4 GPU 服(fu)務(wu)器 ,能夠提供 1040T ( 單卡(ka) 130T ) 的(de)(de)算(suan)(suan)力(li) 。 隨著(zhu)專門為 AI 計(ji)算(suan)(suan)設計(ji)的(de)(de) SOC 的(de)(de)成熟,采(cai)用(yong)(yong) SOC 作(zuo)為加速卡(ka)也(ye)成為性價比(bi)和(he)(he)功(gong)耗比(bi)更(geng)優的(de)(de)選(xuan)擇 。 在 Al SOC 的(de)(de)選(xuan)擇面上 , 國(guo)內(nei)已(yi)(yi)然(ran)走在行業前(qian)列 , 如(ru)華為的(de)(de)昇(sheng)騰(teng) 310 芯(xin)片(pian) , 單顆(ke)算(suan)(suan)力(li) 16T, 四顆(ke)組成半高的(de)(de)計(ji)算(suan)(suan)卡(ka)總算(suan)(suan)力(li) 64T, 但相同算(suan)(suan)力(li)下(xia)功(gong)耗只有(you) GPU 的(de)(de) l/7o 其他的(de)(de)如(ru)寒武紀的(de)(de) MLU220 和(he)(he) MLU270 、 比(bi)特大(da)陸(lu)的(de)(de)算(suan)(suan)豐芯(xin)片(pian)等 , 也(ye)都已(yi)(yi)經取(qu)得了應(ying)用(yong)(yong) 。
存儲服務器。存(cun)儲(chu)(chu)服務器是(shi)人臉識別系統中(zhong)的(de)重要構成 , 是(shi)專門針對存(cun)儲(chu)(chu)任務進行優(you)化的(de)專用(yong)設備 。 在(zai)硬(ying)件形態上 , 其主要特(te)點是(shi)硬(ying)盤(pan)多 , 通常包含 8 至(zhi) 48 塊硬(ying)盤(pan) 。為了保證效率 , 硬(ying)盤(pan)通常以(yi) SAS 硬(ying)盤(pan)或者 SSD 為主 。 SAS 硬(ying)盤(pan)的(de)主要供應商(shang)以(yi)希捷(jie)和西部數據為主 , SSD 的(de)供應商(shang)則更(geng)為豐富 , Intek 三星以(yi)及國內的(de)存(cun)儲(chu)(chu)廠商(shang)也積極參與 SSD 的(de)競爭(zheng) 。 存(cun)儲(chu)(chu)服務器針對軟件的(de)優(you)化主要是(shi)采用(yong) RAIDs多機分布(bu)式等增(zeng)加存(cun)儲(chu)(chu)數據的(de)安全性 , 相關技(ji)術相對成熟 。
智能終端。包括智(zhi)能手機 、 智(zhi)慧(hui)屏在內的(de)(de)通用(yong)智(zhi)能終端 , 是(shi)人臉(lian)識(shi)別應用(yong)的(de)(de)重要(yao)領域 。從操作(zuo)系統(tong)層(ceng)面將智(zhi)能終端分(fen)為兩(liang)大類 , 一類是(shi)采(cai)用(yong)自有(you) iOS 系統(tong)的(de)(de) iPhone,牢牢占(zhan)據(ju)了(le)市場占(zhan)有(you)率的(de)(de)榜(bang)首 , 另一類則是(shi)應用(yong)更加(jia)廣泛的(de)(de) Android 系統(tong)的(de)(de)設(she)備,又以華為占(zhan)據(ju) Android 榜(bang)單的(de)(de)榜(bang)首 , 我國的(de)(de)小米 、 OPPO 、 vivo 也是(shi)建樹頗豐 。值得注意(yi)的(de)(de)是(shi) , 華為和蘋(pin)果是(shi)僅有(you)的(de)(de)兩(liang)家(jia)能夠從芯片到操作(zuo)系統(tong)再(zai)到軟件生態全流程優化(hua)的(de)(de)供應商(shang) , 在一定(ding)程度上解釋(shi)了(le)這(zhe)兩(liang)家(jia)企業的(de)(de)競爭(zheng)優勢(shi) 。
基礎軟件:
訓練框架。目前人臉(lian)識(shi)(shi)別(bie)算法大多基(ji)于(yu)(yu)深(shen)度(du)學(xue)習技術 , Tensorflowx Pytorch 、Mxnet 、 Caffe 是最常用的(de)訓(xun)練(lian)框架 。 由于(yu)(yu)人臉(lian)識(shi)(shi)別(bie)存在類別(bie)大 、 loss 多樣等特(te)點 , 在上述(shu)深(shen)度(du)學(xue)習框架基(ji)礎上需要結合人臉(lian)識(shi)(shi)別(bie)本身(shen)的(de)特(te)點進(jin)一步的(de)優(you)化擴展 , 其中代表性的(de)開源(yuan)框架為(wei) lnsightface。在工業界 , 各(ge)企業內部往(wang)往(wang)也(ye)(ye)有各(ge)自的(de)訓(xun)練(lian)平(ping)臺 , 以實現數據(ju) 、 訓(xun)練(lian) 、 部署等環(huan)節的(de)協(xie)同 , 一些(xie)優(you)秀的(de)內部框架也(ye)(ye)在逐步開源(yuan) 。 但由于(yu)(yu)訓(xun)練(lian)框架切換(huan)學(xue)習成(cheng)本高(gao) , 整體(ti)的(de)生態建(jian)設(she)仍待加強 。
推理引擎。推理(li)(li)引擎(qing)與訓練(lian)框架相對(dui)(dui)應(ying) , 主要(yao)用于(yu)模型在設備端的高效(xiao)(xiao) ( 前向 ) 運(yun)行 。一(yi)(yi)(yi)些(xie)(xie)訓練(lian)框架會配套(tao)對(dui)(dui)應(ying)的推理(li)(li)引擎(qing) , 也(ye)有一(yi)(yi)(yi)些(xie)(xie)獨立于(yu)訓練(lian)框架的推理(li)(li)引擎(qing)軟件 。 此外 , 深(shen)度學習芯(xin)片(pian)也(ye)會提供各自的推理(li)(li)引擎(qing)軟件實現加(jia)速 。 由于(yu)推理(li)(li)引擎(qing)往往針對(dui)(dui)特定結(jie)構或者硬件深(shen)度優(you)化(hua) , 對(dui)(dui)于(yu)一(yi)(yi)(yi)些(xie)(xie)新型的網絡結(jie)構擴展性較差(cha)或者優(you)化(hua)效(xiao)(xiao)率不高 , 容易導致一(yi)(yi)(yi)些(xie)(xie)新算(suan)法無法快速落(luo)地(di) 。
其他環節。人臉識別完整(zheng)流(liu)程(cheng)(cheng)除深度學習神經網(wang)絡外還包括圖像(xiang)預(yu)處(chu)理(li) 、 特征后處(chu)理(li)等流(liu)程(cheng)(cheng) 。 目前缺(que)乏效果且通用的實現方式(shi) , 尤其是在芯片端 ,征比對之類(lei)圖像(xiang)處(chu)理(li)和數學運算類(lei)的功能缺(que)失(shi) , 增加(jia)開發(fa)成(cheng)本性能損失(shi) 。
算法技術:近(jin)年(nian)來隨著深度學習的發(fa)展 , 人臉識別(bie)技(ji)術取得了突破性進步(bu) , 全球范圍(wei)內(nei)相(xiang)關研(yan)究團隊(dui)眾多 , 以中(zhong)(zhong)美俄日歐等國家和地區較為(wei)領先(xian) 。 根據 NISTFR 町(ding)2020 年(nian) 10 月的測(ce)試(shi)結果 , 全球排名(ming)前 10 的算(suan)法半數以上來自(zi)中(zhong)(zhong)國 。
雖(sui)然各國(guo)的(de)(de)人臉識別算法有性能上的(de)(de)差(cha)異 , 但差(cha)距(ju)并不(bu)大 。 以(yi)(yi) FR 町 VISA測試集為例 , 百萬分(fen)之一誤報對應(ying)正確率前 30 廠家性能都已(yi)超過或者接近99% 。 人臉識別的(de)(de)技術(shu)發展已(yi)由注(zhu)重(zhong)算法精度提升向以(yi)(yi)改善實際(ji)應(ying)用效果的(de)(de)方向轉變 , 并出(chu)現了以(yi)(yi)下(xia)應(ying)用趨勢 。
由簡單(dan)場景(jing)向復(fu)雜(za)場景(jing)轉變。簡單(dan)場景(jing)人臉(lian)(lian)(lian)識(shi)別精(jing)度(du)趨于飽和(he)已經成為業(ye)界的共識(shi) , 業(ye)界將注意(yi)力轉移到(dao)復(fu)雜(za)場景(jing)人臉(lian)(lian)(lian)識(shi)別問題(ti)并表現在具體應用場景(jing)上(shang) 。 從高分辨率 、 小姿(zi)態 、 光照適(shi)中的優質人臉(lian)(lian)(lian)卡口場景(jing)轉變到(dao)低(di)分辨率 、 大姿(zi)態 、 低(di)照度(du) 、 模(mo)糊等低(di)畫質開放(fang)式(shi)場景(jing) , 這對(dui)人臉(lian)(lian)(lian)識(shi)別算法適(shi)應能力提(ti)出了(le)新的挑戰 , 也是業(ye)界努力提(ti)升(sheng)的方向 。
3D 人臉成為(wei)配(pei)合(he)式(shi)(shi)應用的(de)重要(yao)方向,隨著 2017 年 iPhone X 首次(ci)將 Face ID 引入手機(ji)端 , 3D 人臉識別技術逐漸成為(wei)手機(ji)廠商旗艦機(ji)型的(de)標準配(pei)置 。 相比于(yu) 2D 人臉 , 3D 人臉包含更為(wei)豐富的(de)人臉信(xin)息 , 對旋轉 、 遮(zhe)擋 、 光照 、 照片攻擊(ji)等具有更好的(de)抗干擾能力(li) 。 在以門禁考勤(qin) 、 金(jin)融支付(fu)為(wei)代表近距離配(pei)合(he)式(shi)(shi)應用中(zhong) 3D 人臉逐漸成為(wei)常用的(de)技術解決手段 。
多生物(wu)(wu)特征融合(he)(he)成(cheng)為新的趨(qu)勢。多生物(wu)(wu)特征融合(he)(he)能彌補單生物(wu)(wu)特在(zai)(zai)的不(bu)(bu)足 , 實現(xian)優勢互補 , 提升系統(tong)精度,改善(shan)應(ying)用體驗 。 在(zai)(zai)近(jin)距離配合(he)(he)式應(ying)用中 , 采用人(ren)臉識別(bie)與虹膜識別(bie)技術融合(he)(he)可解決(jue)雙胞胎(tai)等人(ren)臉識別(bie)難以(yi)解決(jue)的問題(ti) , 增強雙胞胎(tai)金融支付應(ying)用的安全 ; 在(zai)(zai)安防場景 , 相機角度 、 分(fen)辨率(lv)等問題(ti)存在(zai)(zai)人(ren)臉質量較差(cha)以(yi)及(ji)獲取不(bu)(bu)到(dao)人(ren)臉等情況 , 步(bu)(bu)態識別(bie) 、 行(xing)人(ren)重識別(bie)等技術的融入能進(jin)一步(bu)(bu)擴大(da)整個身份識別(bie)系統(tong)的算(suan)法邊界 。
人(ren)臉識(shi)別(bie)(bie)公平(ping)性(xing)問(wen)題(ti)亟待解決。由于(yu)安全隱(yin)私顧慮 、 經濟科(ke)技水平(ping)落(luo)后和貿易壁壘等(deng)因素(su) , 人(ren)臉識(shi)別(bie)(bie)技術在全球的整體(ti)普及程(cheng)度仍然偏(pian)低且存在發展不平(ping)衡現象(xiang) 。 根據(ju) NIST 的分析(xi)報告(gao) , 歐美 、 亞洲為人(ren)臉識(shi)別(bie)(bie)技術主要供應商 , 各國(guo)算法優化(hua)主要依(yi)賴本國(guo)環(huan)境,跨人(ren)種 、 跨地(di)域 、 跨場(chang)景等(deng)仍會給人(ren)臉識(shi)別(bie)(bie)算法帶來一定影響 。 除了(le)準確(que)率(lv)的持續優化(hua) , 全球范(fan)圍內安全隱(yin)私 、 公平(ping)性(xing)等(deng)問(wen)題(ti)亟待解決。
設備及產品:
人臉抓拍機:人(ren)臉(lian)(lian)抓(zhua)拍(pai)機(ji)內置 AI 芯片(pian)和深度學(xue)習算法 , 適應于人(ren)流密集(ji)的(de)通道(dao) 、 出入口等多種場(chang)(chang)(chang)景(jing)需求(qiu) , 實(shi)現對人(ren)群中(zhong)人(ren)臉(lian)(lian)的(de)精準(zhun)捕捉 。 人(ren)臉(lian)(lian)抓(zhua)拍(pai)機(ji)目前已普遍部(bu)署在(zai)汽(qi)車(che)站(zhan)(zhan) 、 火(huo)車(che)站(zhan)(zhan) 、 機(ji)場(chang)(chang)(chang) 、 港口 、 娛樂場(chang)(chang)(chang)所 、 街道(dao) 、 社區(qu)等人(ren)員(yuan)復雜場(chang)(chang)(chang)景(jing)的(de)重(zhong)點監控區(qu)域 , 對場(chang)(chang)(chang)景(jing)的(de)適應性(xing)是其性(xing)能(neng)的(de)重(zhong)要指標 。 在(zai)大姿態 、 遮擋 、 光照異常等復雜情況下的(de)人(ren)臉(lian)(lian)抓(zhua)拍(pai)成(cheng)功率 , 在(zai)自(zi)然(ran)監控環境(jing)中(zhong)誤抓(zhua)率都是設備性(xing)能(neng)體現 , 也(ye)是用戶的(de)選擇依據 。
隨著安防監(jian)控智能(neng)化的(de)(de)(de)發(fa)展 , 捕捉(zhuo)更精細(xi)更全面的(de)(de)(de)結構(gou)化信(xin)息成為趨勢 。目前(qian)(qian)各(ge)大廠(chang)商都推(tui)出(chu)了抓拍(pai)(pai)人(ren)臉 、 人(ren)體(ti) 、 車輛 、 車牌等(deng)多(duo)維信(xin)息的(de)(de)(de)面向視頻結構(gou)化應(ying)用的(de)(de)(de)抓拍(pai)(pai)機 , 多(duo) AI 算(suan)法的(de)(de)(de)集成以及(ji)多(duo)路實時(shi)抓拍(pai)(pai)的(de)(de)(de)需求(qiu)(qiu) , 要求(qiu)(qiu)前(qian)(qian)端設備廠(chang)商進一(yi)步壓縮算(suan)法模型(xing)和提升芯片(pian)處理速度 。 另(ling)外 , 前(qian)(qian)端設備脫離于后端服(fu)務器(qi) , 功能(neng)從單純捕捉(zhuo)信(xin)息到捕捉(zhuo) 、 分析 、 決策方向發(fa)展 , 這也(ye)符合智能(neng)前(qian)(qian)移為邊緣節點賦能(neng) , 讓邊緣感知信(xin)息的(de)(de)(de)發(fa)展趨勢。
門禁設備:門(men)禁設(she)備是(shi)以人臉識(shi)(shi)別(bie)(bie)技術為核心的身份識(shi)(shi)別(bie)(bie)終端(duan)產品 , 它集(ji)成了視頻采集(ji) 、 人臉識(shi)(shi)別(bie)(bie) 、 證件(jian)識(shi)(shi)別(bie)(bie) 、 紅外偵測及網(wang)絡傳輸等多種(zhong)功能 。 目前市(shi)場上的門(men)禁產品發展(zhan)比較成熟 , 同質化嚴重 , 但也展(zhan)露一些(xie)新趨勢 。
隨著門禁(jin)設備(bei)(bei)的(de)(de)普及化(hua)和民用化(hua) , 安全(quan)(quan)問題越來越受到重視 , 防(fang)(fang)偽(wei)功(gong)能成(cheng)為標配 。 由(you)于攻擊方式多樣(yang)性(xing)(xing) , 即使配備(bei)(bei)防(fang)(fang)偽(wei)功(gong)能的(de)(de)設備(bei)(bei)也(ye)存在技(ji)術缺失或適應性(xing)(xing)差(cha)的(de)(de)問題 , 安全(quan)(quan)性(xing)(xing)能有待持續提升并完善(shan) 。 今年由(you)于疫情(qing)管控的(de)(de)需要(yao) , 集(ji)成(cheng)測溫功(gong)能的(de)(de)門禁(jin)設備(bei)(bei)逐漸(jian)普及 。 未(wei)來安全(quan)(quan)性(xing)(xing)和差(cha)異化(hua)滿足個性(xing)(xing)化(hua)需求(qiu)將成(cheng)為門禁(jin)類產品的(de)(de)重要(yao)發展方向 。
網絡硬盤錄像機設備:網(wang)絡(luo)(luo)(luo)硬(ying)盤錄像機 (Network Video Recorder, NVR) 最(zui)主要的(de)功能是通過(guo)網(wang)絡(luo)(luo)(luo)接(jie)收 IPC (網(wang)絡(luo)(luo)(luo)攝像機)設(she)(she)備(bei)(bei)傳輸的(de)數(shu)字視頻(pin)碼(ma)流 , 并進行存儲(chu)與管理 。NVR 設(she)(she)備(bei)(bei)內置人(ren)臉檢(jian)測 、 人(ren)臉識別功能可提升(sheng)存儲(chu)數(shu)據的(de)有效性以及關鍵數(shu)據的(de)檢(jian)索效率 , 目前已成(cheng)為(wei) NVR 設(she)(she)備(bei)(bei)的(de)主要賣點 。
移動終端:隨著刷(shua)臉(lian)(lian)(lian)(lian)(lian)功能的(de)(de)普(pu)及 , 手(shou)機(ji)(ji)逐(zhu)步成為人臉(lian)(lian)(lian)(lian)(lian)識(shi)別(bie)的(de)(de)重要終端之一(yi) , 通過(guo)手(shou)機(ji)(ji)即可完成刷(shua)臉(lian)(lian)(lian)(lian)(lian)登錄和刷(shua)臉(lian)(lian)(lian)(lian)(lian)支(zhi)(zhi)付(fu) 。 相對于傳統的(de)(de)密(mi)碼解鎖和支(zhi)(zhi)付(fu) , 刷(shua)臉(lian)(lian)(lian)(lian)(lian)具有更高的(de)(de)便捷性和安全(quan)性 。 未來人臉(lian)(lian)(lian)(lian)(lian)識(shi)別(bie)在智能手(shou)機(ji)(ji)的(de)(de)普(pu)及率會進一(yi)步提升(sheng) , 也(ye)將有越(yue)(yue)來越(yue)(yue)多的(de)(de)手(shou)機(ji)(ji)應用借助人臉(lian)(lian)(lian)(lian)(lian)識(shi)別(bie)進行(xing)身份驗證 。
人臉分析服務器:基于深度(du)學(xue)習的人(ren)臉識(shi)別(bie)算(suan)法在實際(ji)應(ying)用(yong)(yong)中(zhong)(zhong)需(xu)要消耗(hao)大量的計算(suan)資源 , 長(chang)期以來 GPU 為首(shou)的通(tong)用(yong)(yong)架構芯片是進行深度(du)學(xue)習計算(suan)最常(chang)用(yong)(yong)的計算(suan)資源 。 然而 , GPU 服務器體積大 、 能(neng)耗(hao)高 , 在很(hen)多應(ying)用(yong)(yong)場景中(zhong)(zhong)已成為限制人(ren)工智能(neng)發展的瓶頸 。
基于人(ren)臉識別專(zhuan)用 ASIC 芯(xin)片(pian)的(de)解析一體(ti)機(ji)或服(fu)務器 , 在(zai)性能 、 成本 、功耗(hao) 、 可靠(kao)性及(ji)適用范圍(wei)等方面都具有明顯的(de)優勢 。 在(zai)很多實際(ji)應(ying)用場景中 ,專(zhuan)用解析一體(ti)機(ji)或服(fu)務器在(zai)提供同等算力的(de)情況下 , 消耗(hao)更(geng)少的(de)能量(liang) , 占用更(geng)小(xiao)的(de)體(ti)積(ji) , 發熱量(liang)也更(geng)小(xiao) 。 例如搭(da)載 “ 求索 ” 芯(xin)片(pian)的(de) 1 臺(tai) 1U 依圖(tu)原子服(fu)務器無需英特爾(er) CPU, 與 8 卡英偉達 P4 服(fu)務器對比 , 解析路(lu)數相同情況下單路(lu)功耗(hao)不到(dao)后者(zhe)的(de) 1 0%。
人臉比對服務器:隨著(zhu)智慧城(cheng)市 、 一人(ren)一檔等人(ren)臉大(da)數據(ju)應(ying)用(yong) , 對(dui)(dui)人(ren)臉特征比(bi)(bi)對(dui)(dui)支(zhi)持的(de)庫(ku)容規模 、 并發量(liang) 、 響應(ying)速度提(ti)出(chu)新的(de)要求 , 隨之產生專用(yong)的(de)比(bi)(bi)對(dui)(dui)服(fu)務(wu)(wu)器(qi)(qi) 。 GPU由于生態友好且算力高 , GPU 卡的(de)比(bi)(bi)對(dui)(dui)服(fu)務(wu)(wu)器(qi)(qi)在(zai)(zai)各行業(ye)應(ying)用(yong)中有較大(da)占比(bi)(bi) 。與分(fen)析(xi)服(fu)務(wu)(wu)器(qi)(qi)類似 , GPU 比(bi)(bi)對(dui)(dui)服(fu)務(wu)(wu)器(qi)(qi)存在(zai)(zai)體積(ji)大(da) 、 功(gong)耗(hao)高的(de)缺點 。
FPGA 芯片(pian)更合適人(ren)臉特(te)征比對(dui)運(yun)算 , 具有大(da)庫(ku)容高并(bing)發(fa)的特(te)點 , 基(ji)(ji)(ji)于(yu) FPGA 的人(ren)臉比對(dui)服(fu)務(wu)器(qi)(qi)(qi)在性能 、 層(ceng)本 、 功耗等方面皆具備明(ming)顯優勢 , 該(gai)類產(chan)品(pin)已(yi)嶄露(lu)頭角 。 此外(wai),隨著(zhu) CPU 芯片(pian)計算能力和(he)指(zhi)令集(ji)的不斷優化 , 芯片(pian)廠家和(he)服(fu)務(wu)器(qi)(qi)(qi)廠家也在聯合嘗試基(ji)(ji)(ji)于(yu) CPU 的人(ren)臉比對(dui)服(fu)務(wu)器(qi)(qi)(qi)產(chan)品(pin) , 基(ji)(ji)(ji)于(yu) CPU 的產(chan)品(pin)方案也值得關注(zhu) 。
解決方案:
人臉(lian)識別(bie)系統業務功能主要包括人臉(lian)核驗 、 人臉(lian)布(bu)控 、 人臉(lian)檢索 、人臉(lian)聚類等 , 可(ke)以通過上(shang)述不同的設備構(gou)建不同的解決(jue)(jue)方案 。 按照(zhao)應(ying)用場(chang)景和數(shu)據規模 , 解決(jue)(jue)方案可(ke)以歸納為人臉(lian)考勤(qin)方案 、 人臉(lian)布(bu)控方案和人臉(lian)大(da)數(shu)據應(ying)用方案 。
人臉考勤解決方案:人(ren)(ren)(ren)臉(lian)考勤解決方(fang)案可以(yi)由單個門禁設備構成 , 亦可由人(ren)(ren)(ren)臉(lian)抓拍機 +NVR 或人(ren)(ren)(ren)臉(lian)服務器的方(fang)式構成 , 包(bao)含人(ren)(ren)(ren)臉(lian)注冊(ce) 、 人(ren)(ren)(ren)臉(lian)抓拍 、 人(ren)(ren)(ren)臉(lian)建模和人(ren)(ren)(ren)臉(lian)比對功能,并配備管理系統 , 具備考勤權限(xian) 、 數(shu)據(ju)存刪(shan) 、 參數(shu)設置和隱私保護等功能 。
人臉布控解決方案:人臉(lian)(lian)布控解決方案(an) , 通(tong)常由人臉(lian)(lian)抓(zhua)拍機+人臉(lian)(lian)分(fen)析(xi)服(fu)務(wu)器(qi)構成(cheng) 。 當(dang)單臺人臉(lian)(lian)分(fen)析(xi)服(fu)務(wu)器(qi)不足以提(ti)供(gong)所需(xu)性能時(shi) , 可(ke)以采用多集(ji)群方式 ; 當(dang)系統(tong)需(xu)要(yao)接入傳統(tong) IPC 視頻碼流時(shi) , 亦(yi)可(ke)在分(fen)析(xi)服(fu)務(wu)器(qi)實現人臉(lian)(lian)抓(zhua)拍 。
人臉大數據應用解決方案:省級 、 全國級靜態庫檢索 , 市 / 縣(xian)級人(ren)臉聚(ju)類是常見的人(ren)臉大數據應用 ,其(qi)解(jie)決方案通常由人(ren)臉抓(zhua)拍機+人(ren)臉分(fen)(fen)析(xi)(xi)服務器+人(ren)臉比對服務器構成 , 其(qi)系(xi)統通常為(wei)分(fen)(fen)布式系(xi)統 , 圖(tu)像(xiang)處理單元(yuan)(yuan)和特征比對單元(yuan)(yuan)按(an)照應用所需的處理并發數進(jin)(jin)行部署 。 該類系(xi)統通常與其(qi)他智能分(fen)(fen)析(xi)(xi)系(xi)統(如人(ren)體分(fen)(fen)析(xi)(xi) 、 步態分(fen)(fen)析(xi)(xi))進(jin)(jin)行打(da)通 , 并利用大數據分(fen)(fen)析(xi)(xi)技術進(jin)(jin)一步提升系(xi)統的可用性和整體性能。
不同(tong)廠家(jia)人臉(lian)(lian)產(chan)(chan)(chan)品(pin)形態有(you)所差(cha)異 , 但其(qi)人臉(lian)(lian)產(chan)(chan)(chan)品(pin)的(de)(de)核心功能(neng)大同(tong)小異 , 因此(ci)由人臉(lian)(lian)產(chan)(chan)(chan)品(pin)組成的(de)(de)人臉(lian)(lian)識別系統功能(neng)和(he)流程相(xiang)對固定 , 上述解決(jue)方案具有(you)極高的(de)(de)通用性(xing) 。 產(chan)(chan)(chan)業鏈中基礎層 、 算(suan)法和(he)設備的(de)(de)發展主(zhu)要在于(yu)提升人臉(lian)(lian)識別的(de)(de)效果和(he)效率 , 不會影響整體功能(neng)和(he)流程 , 解決(jue)方案是相(xiang)對穩定的(de)(de)環節 。
3、典型應用領域
科技金融。人臉識(shi)別在金(jin)融領域的應(ying)用(yong)已經(jing)相(xiang)當(dang)普遍 , 如遠(yuan)程銀行開戶 、 身份核(he)驗 、保險理賠(pei)和(he)刷臉支付等 。 人臉識(shi)別技術(shu)的接入 , 能有(you)效提高(gao)資金(jin)交(jiao)易安全的保障 , 也提高(gao)了金(jin)融業(ye)務(wu)中的便(bian)捷性。
2013 年芬蘭(lan)公司 Uniqul 成為(wei)首(shou)批吃螃蟹的公司 , 面(mian)(mian)向全球首(shou)次推出人(ren)(ren)臉識(shi)別支(zhi)付這一(yi)創新支(zhi)付技術(shu) 。 2015 年在德國漢諾威 CeBIT 展會上馬云第一(yi)次向德國總理默克(ke)爾(er)展示了支(zhi)付寶的人(ren)(ren)臉識(shi)別支(zhi)付技術(shu) 。 同年 , 招(zhao)商銀(yin)(yin)行(xing)在一(yi)些支(zhi)行(xing)柜(ju)面(mian)(mian)和ATM業(ye)務也(ye)開始(shi)應用人(ren)(ren)臉識(shi)別 , 隨后包(bao)括建設銀(yin)(yin)行(xing) 、 農業(ye)銀(yin)(yin)行(xing)等四(si)大行(xing)在內(nei)的數十家(jia)銀(yin)(yin)行(xing)都紛紛將人(ren)(ren)臉識(shi)別產品(pin)引入(ru)ATM 、 STM 、 柜(ju)面(mian)(mian) 、 網點(dian) 、手機銀(yin)(yin)行(xing)等各(ge)個業(ye)務環節(jie) , 并逐漸全客(ke)戶覆蓋 。
時至今(jin)日 , 人臉識(shi)別技(ji)術在(zai)(zai)國(guo)內金融(rong)領域(yu)已經得(de)到了(le)非常廣泛的(de)部(bu)署和(he)應(ying)(ying)用(yong) , 消費(fei)者在(zai)(zai)各個渠(qu)道(dao)中都(dou)可以利用(yong)人臉識(shi)別技(ji)術使用(yong)金融(rong)服務 ,中國(guo)在(zai)(zai)人臉識(shi)別技(ji)術的(de)應(ying)(ying)用(yong)上(shang)已經大幅(fu)度(du)領先國(guo)外市場。
智慧安防。安防是(shi)人(ren)(ren)臉(lian)識別(bie)市場最早滲透 、 應(ying)用(yong)最廣泛(fan)的領域 。 根(gen)據億(yi)歐(ou)研究 , 2018年 , 安防行業在(zai)中國人(ren)(ren)臉(lian)識別(bie)市場占比 61.2% 。 當前(qian)人(ren)(ren)臉(lian)識別(bie)技(ji)術主要為視(shi)頻結構化 、 人(ren)(ren)臉(lian)檢索(suo) 、 人(ren)(ren)臉(lian)布控 、 人(ren)(ren)群統計等軟硬件一體(ti)形態產品提供基(ji)礎(chu)支撐,重點應(ying)用(yong)于犯罪(zui)人(ren)(ren)員的識別(bie)追蹤 、 失蹤兒童尋(xun)找 、 反恐行動助力等場景 。
視頻監控系(xi)統(tong)通過龐大的(de)監控網絡進(jin)行圖像采集 、 自動(dong)分(fen)析 、 人(ren)(ren)臉比(bi)對 , 基(ji)于視頻幀的(de) 1 : 1 及 1 : N 人(ren)(ren)臉比(bi)對 , 可分(fen)析人(ren)(ren)員軌跡 、 出(chu)行規律等 , 實現重點人(ren)(ren)員的(de)識別(bie)及跟(gen)蹤 , 在公(gong)(gong)安(an)應用(yong)場(chang)景(jing)中達到事前預警 、 事中跟(gen)蹤 、 事后快(kuai)速處置的(de)目的(de) 。 在雪亮工程 、 天網工程 、 智慧(hui)社區 、 反恐及重大活動(dong)安(an)保等公(gong)(gong)安(an)項目發揮了重要的(de)作用(yong) 。
此(ci)外 , 在企業樓宇 、 社區(qu)住宅的(de)人(ren)(ren)員管理和(he)安全防范需求場景下 , 人(ren)(ren)臉(lian)識(shi)別技術應用非(fei)常廣泛 , 通過人(ren)(ren)臉(lian)的(de)黑白(bai)名(ming)單(dan)錄入 , 可(ke)有效管控(kong)區(qu)域(yu)人(ren)(ren)員出入 ,機器識(shi)別的(de)高效率也大幅節省了人(ren)(ren)力(li)資源。
智慧交通。國外(wai)的(de)(de)公共交通領域(yu)對人臉(lian)識別技術的(de)(de)應用主(zhu)要集中在機場安(an)檢以及(ji)(ji)入境(jing)管理等特別強調安(an)全的(de)(de)場景 。 加(jia)拿(na)大渥太(tai)華國際(ji)機場 、 澳(ao)大利亞當地移民(min)及(ji)(ji)邊境(jing)保護局(ju)與(yu)美國海關與(yu)邊境(jing)保護局(ju)皆已(yi)嘗(chang)試部(bu)署人臉(lian)識別出(chu)入境(jing)系統。
國內交(jiao)(jiao)通(tong)(tong)領域的(de)(de)人(ren)(ren)臉(lian)(lian)(lian)識(shi)別應(ying)用(yong)主要包括 1 : 1 人(ren)(ren)臉(lian)(lian)(lian)驗(yan)證和 1 : N 人(ren)(ren)臉(lian)(lian)(lian)辨識(shi) 。目前(qian)(qian)利用(yong)人(ren)(ren)臉(lian)(lian)(lian)核驗(yan)證技(ji)術(shu)的(de)(de)刷臉(lian)(lian)(lian)安檢已進入普遍應(ying)用(yong)階(jie)段 , 在(zai)高(gao)鐵(tie)站(zhan) 、 普通(tong)(tong)火(huo)車(che)站(zhan)和機場皆(jie)已大面積推廣 。 而應(ying)用(yong) 1 : N 人(ren)(ren)臉(lian)(lian)(lian)比對(dui)技(ji)術(shu)的(de)(de)刷臉(lian)(lian)(lian)支付主要落地在(zai)地鐵(tie)公(gong)交(jiao)(jiao)等市內交(jiao)(jiao)通(tong)(tong) , 這種(zhong)技(ji)術(shu)能(neng)夠極大提(ti)高(gao)通(tong)(tong)勤(qin)人(ren)(ren)員的(de)(de)出(chu)(chu)行效率(lv) , 釋放大量(liang)的(de)(de)人(ren)(ren)力資源(yuan) , 提(ti)升出(chu)(chu)行體驗(yan) 。 同時(shi) , 人(ren)(ren)臉(lian)(lian)(lian)識(shi)別可以對(dui)交(jiao)(jiao)通(tong)(tong)站(zhan)點(dian)進行人(ren)(ren)流監測 ,根據(ju)人(ren)(ren)員出(chu)(chu)行規律(lv)預(yu)(yu)測交(jiao)(jiao)通(tong)(tong)人(ren)(ren)流高(gao)峰(feng) , 提(ti)前(qian)(qian)做好疏導(dao)預(yu)(yu)案 。
除此之外 , 在交(jiao)通違規管控方面 , 人(ren)臉識(shi)(shi)別技(ji)(ji)術(shu)可以幫助執法人(ren)員更快(kuai)速高(gao)效(xiao)地(di)找到(dao)違規人(ren)員身(shen)份信(xin)息 , 并結合車輛識(shi)(shi)別等(deng)技(ji)(ji)術(shu)進(jin)行(xing)跟蹤攔截。
民生政務。政(zheng)務(wu)(wu)(wu)(wu)(wu)(wu)互聯網平臺(tai)(tai)、 公(gong)(gong)積(ji)金 、 社保 、 稅(shui)務(wu)(wu)(wu)(wu)(wu)(wu) 、 網證(zheng) 、 交(jiao)(jiao)通管理 、 行人(ren)(ren)闖(chuang)紅燈(deng) 、繳交(jiao)(jiao)交(jiao)(jiao)通罰(fa)款 、 住建等民(min)生(sheng)(sheng)政(zheng)務(wu)(wu)(wu)(wu)(wu)(wu)系統(tong) , 已經使用或(huo)正在(zai)使用人(ren)(ren)臉識別系統(tong) 。 政(zheng)務(wu)(wu)(wu)(wu)(wu)(wu)服務(wu)(wu)(wu)(wu)(wu)(wu)領域(yu)的(de)業務(wu)(wu)(wu)(wu)(wu)(wu)點主要有(you)私有(you)云(yun)平臺(tai)(tai)搭建 、 政(zheng)務(wu)(wu)(wu)(wu)(wu)(wu)服務(wu)(wu)(wu)(wu)(wu)(wu)自(zi)助終端(duan) 、 便民(min)服務(wu)(wu)(wu)(wu)(wu)(wu)平臺(tai)(tai) 。 人(ren)(ren)臉識別在(zai)政(zheng)務(wu)(wu)(wu)(wu)(wu)(wu)系統(tong)的(de)落地 , 提升(sheng)了民(min)眾的(de)辦(ban)(ban)(ban)事效(xiao)率 , 公(gong)(gong)民(min)可以(yi)不用窗口排隊(dui) , 實現(xian)自(zi)助辦(ban)(ban)(ban)事 , 節省(sheng)了因人(ren)(ren)工(gong)效(xiao)率低下(xia)產生(sheng)(sheng)的(de)耗時(shi) 。 部分(fen)(fen)政(zheng)務(wu)(wu)(wu)(wu)(wu)(wu)還可以(yi)通過在(zai)線人(ren)(ren)臉識別認證(zheng) , 在(zai)移動端(duan)線上辦(ban)(ban)(ban)理 , 減輕(qing)了 “ 辦(ban)(ban)(ban)事來回跑 、 辦(ban)(ban)(ban)事地點遠(yuan) 、辦(ban)(ban)(ban)事點分(fen)(fen)散 ” 的(de)困擾 。
教育考試。智慧教育在高速(su)發展的同時 , 不斷深(shen)入采(cai)用物(wu)聯網(wang) 、 云計算 、 大數據等先進(jin)信息技(ji)術手段 , 實現各(ge)種(zhong)教育管理與(yu)教學(xue)過程(cheng)數據的全面采(cai)集 、 存儲與(yu)分析,并通過可視化技(ji)術進(jin)行直觀的呈現 。
在這個過程中 , 相關科技企業基(ji)于(yu)自身在人工智(zhi)(zhi)能(neng) 、 視(shi)頻可視(shi)化技術(shu) 、 出入口(kou)門禁管(guan)理 、 大數據 、 云(yun)計(ji)算等領域積累的技術(shu)產品經(jing)驗 , 致力于(yu)推(tui)動智(zhi)(zhi)慧(hui)(hui)教育(yu)的行業發展 , 打造升級智(zhi)(zhi)慧(hui)(hui)校園 、 智(zhi)(zhi)慧(hui)(hui)教室 、 智(zhi)(zhi)慧(hui)(hui)宿舍 、 智(zhi)(zhi)慧(hui)(hui)圖書館 、 智(zhi)(zhi)慧(hui)(hui)食堂 、 智(zhi)(zhi)慧(hui)(hui)超市(shi)等教育(yu)相關的安(an)全管(guan)控(kong) 、 課堂考勤 、 刷臉消(xiao)費和(he)智(zhi)(zhi)能(neng)化體驗 。同時 , 人臉識別技術(shu)也(ye)應用在考生身份(fen)確認 。
智能家居。人(ren)(ren)(ren)臉(lian)識(shi)(shi)別(bie)在(zai)(zai)智能(neng)家(jia)居(ju)中主要應用在(zai)(zai)安全(quan)解(jie)鎖和(he)個(ge)性化(hua)家(jia)居(ju)服務兩個(ge)場景(jing) 。在(zai)(zai)安全(quan)防范方面 , 人(ren)(ren)(ren)臉(lian)識(shi)(shi)別(bie)可以提供相對(dui)安全(quan)和(he)便捷(jie)的入(ru)戶(hu)解(jie)鎖技(ji)術 , 將可能(neng)逐步(bu)替(ti)代傳統密碼或指(zhi)紋門鎖 。 智能(neng)門鈴可以通(tong)過(guo)人(ren)(ren)(ren)臉(lian)識(shi)(shi)別(bie)對(dui)訪客身份進行(xing)識(shi)(shi)別(bie) 。 另外(wai)家(jia)中的監控(kong)攝像頭可以實時監測(ce) , 如(ru)發現陌生人(ren)(ren)(ren)臉(lian)立(li)即提醒住(zhu)戶(hu)并報警 。
在(zai)個(ge)性化家居(ju)服務方面(mian) , 智(zhi)能電(dian)視(shi)可(ke)以采用(yong)人(ren)臉(lian)信(xin)息錄入的(de)方式創建(jian)賬號 ,機器(qi)通(tong)過人(ren)臉(lian)識別認證 , 有針對性的(de)進行(xing)內容(rong)推(tui)送 , 實現個(ge)性化定制 ; 智(zhi)能冰箱可(ke)通(tong)過人(ren)臉(lian)識別技(ji)(ji)術(shu) , 針對不同的(de)用(yong)戶愛好 、 人(ren)臉(lian)狀態 , 推(tui)送菜(cai)譜及營(ying)養建(jian)議 。 人(ren)臉(lian)識別技(ji)(ji)術(shu)在(zai)智(zhi)能家居(ju)行(xing)業的(de)應用(yong) , 為市民帶來(lai)了更便捷 、 舒適的(de)生活方式 。
4、 行業發展趨勢
應用場景向各行業滲透 , 市場規模增長趨勢出現分化。隨著技術發展和安全性要求的提高 , 人臉識別技術在行業應用中發生巨大變化 , 從安全性可靠性要求較低的行業上升到金融社保 、 證券 、 銀行 、 互聯網金融等安全可靠性要求較高的行業 。 我國人臉識別技術目前主要運用在公共安防 、 門禁考勤 、 金融支付三大領域 。
區分不同的(de)應用(yong)(yong)領(ling)域來看 , 其趨(qu)勢(shi)逐(zhu)漸出現(xian)分化(hua) 。 從(cong) 2019 年看 , 安防作(zuo)為人(ren)(ren)臉識(shi)別(bie)最早應用(yong)(yong)的(de)領(ling)域之一 , 其市(shi)場(chang)份(fen)額(e)占(zhan)(zhan)比在 30% 左(zuo)右(you) 。 隨(sui)著雪亮(liang)工程(cheng) 、 智(zhi)慧(hui)城市(shi)建設的(de)逐(zhu)步完成 , 人(ren)(ren)臉識(shi)別(bie)在安防領(ling)域逐(zhu)漸從(cong)增量市(shi)場(chang)轉(zhuan)變(bian)為存量市(shi)場(chang) 。 人(ren)(ren)臉識(shi)別(bie)在門禁考(kao)勤(qin)領(ling)域的(de)應用(yong)(yong)最為成熟 , 約(yue)占(zhan)(zhan)行業市(shi)場(chang)的(de) 42% 左(zuo)右(you) , 隨(sui)著智(zhi)慧(hui)樓宇 、 智(zhi)慧(hui)社區 、 智(zhi)慧(hui)家居的(de)進一步發展 , 人(ren)(ren)臉識(shi)別(bie)門禁考(kao)勤(qin)市(shi)場(chang)也將隨(sui)之增長(chang) 。 金融作(zuo)為人(ren)(ren)臉識(shi)別(bie)未(wei)來重要的(de)應用(yong)(yong)領(ling)域之一 , 目前(qian)約(yue)占(zhan)(zhan)行業的(de) 20%, 并且(qie)市(shi)場(chang)規模在逐(zhu)步擴(kuo)大 。
全(quan)(quan)球(qiu)公(gong)共衛生(sheng)(sheng)環境變化(hua) , 人(ren)臉(lian)(lian)識(shi)(shi)別(bie)迎來應用新(xin)(xin)需求。新(xin)(xin)冠肺炎(yan)疫(yi)情(qing)的爆發并(bing)在全(quan)(quan)世界流(liu)行(xing) , 威(wei)脅(xie)人(ren)類(lei)生(sheng)(sheng)命安全(quan)(quan)與健康(kang) , 引發了一場(chang)全(quan)(quan)球(qiu)公(gong)共衛生(sheng)(sheng)危機 。 相(xiang)對于指紋 、 刷卡等接觸(chu)式(shi)(shi)身份(fen)識(shi)(shi)別(bie)模式(shi)(shi) , 人(ren)臉(lian)(lian)識(shi)(shi)別(bie)等非接觸(chu)式(shi)(shi)識(shi)(shi)別(bie)模式(shi)(shi)更(geng)適用于當(dang)前(qian)受新(xin)(xin)冠病(bing)毒影響的全(quan)(quan)球(qiu)公(gong)共衛生(sheng)(sheng)環境 , 減少病(bing)毒通(tong)過接觸(chu)感染人(ren)群 。
一方面(mian) , 人臉識別(bie)技(ji)術(shu)結合紅外體溫(wen)監測技(ji)術(shu) , 獲(huo)取人員(yuan)身體健康狀況(kuang)信息(xi) , 能及時反(fan)饋(kui)并控(kong)制疫情源頭(tou) ; 另一方面(mian) , 監控(kong)系統(tong)的全面(mian)布控(kong) , 可檢測獲(huo)取重點人員(yuan)流動信息(xi) , 幫助政府防控(kong)管(guan)制措施做到(dao)有的放矢。
目前全球公共衛(wei)生環境形式依(yi)舊(jiu)嚴峻(jun) , 根據智源發布的(de)(de) 《 人(ren)臉識(shi)別(bie)與公共衛(wei)生調研報告 》 顯示 , 受訪(fang)者普遍贊(zan)同(tong)加強人(ren)臉識(shi)別(bie)技術的(de)(de)能力 , 81.9% 的(de)(de)人(ren)同(tong)意增(zeng)強對戴有口罩的(de)(de)人(ren)的(de)(de)面部識(shi)別(bie) 。 為完善疫情防控體系(xi) , 進一(yi)步阻斷傳播源 , 戴口罩人(ren)臉識(shi)別(bie)技術的(de)(de)新需求浮出水面 。
計(ji)算芯(xin)片(pian)技術發展 , 支(zhi)撐人臉識別大規模應用。人臉識別算法(fa)(fa)(fa)的工業應用和算法(fa)(fa)(fa)性(xing)能除了(le)自身模型性(xing)能外 , 依賴(lai)于算法(fa)(fa)(fa)運行的硬件(jian)芯(xin)片(pian)環境 。 以英(ying)偉達(da)的 GPU 和英(ying)特爾的 CPU 為代(dai)表的通(tong)用架(jia)構芯(xin)片(pian)作為人臉識別算法(fa)(fa)(fa)訓練和推(tui)理最常(chang)用的計(ji)算資源 。
同時 , 為(wei)了滿足(zu)人(ren)臉(lian)識別(bie)應用(yong)(yong)場(chang)景的(de)(de)(de)不斷拓展和(he)(he)(he)數據量的(de)(de)(de)急劇(ju)增長對(dui)算(suan)(suan)(suan)力的(de)(de)(de)強烈需求 , 基于領域專(zhuan)用(yong)(yong)架構 ( Domain Specific Architectures, DSA) 理念(nian)的(de)(de)(de)行(xing)業專(zhuan)用(yong)(yong)定(ding)制芯片憑借著對(dui)特定(ding)領域的(de)(de)(de)算(suan)(suan)(suan)法(fa)優(you)化 , 可(ke)以充分發揮計(ji)算(suan)(suan)(suan)資源和(he)(he)(he)算(suan)(suan)(suan)法(fa)模型的(de)(de)(de)效(xiao)能 , 已(yi)經被部分廠商應用(yong)(yong)于人(ren)臉(lian)識別(bie)算(suan)(suan)(suan)法(fa)的(de)(de)(de)訓練和(he)(he)(he)推(tui)理應用(yong)(yong) , 如海思 、 依(yi)圖 、 寒武紀(ji)等企(qi)業推(tui)出的(de)(de)(de)云端計(ji)算(suan)(suan)(suan)芯片 , 可(ke)以逐漸替(ti)代 GPU 成(cheng)為(wei)其人(ren)臉(lian)識別(bie)技術應用(yong)(yong)的(de)(de)(de)主流(liu)計(ji)算(suan)(suan)(suan)資源。
近年來(lai)(lai) , 信息量的(de)(de)爆炸式增(zeng)長給數(shu)據(ju)傳(chuan)(chuan)輸存儲及(ji)(ji)(ji)中(zhong)心計算(suan)帶(dai)來(lai)(lai)了巨大的(de)(de)壓(ya)力(li) , 邊(bian)(bian)緣計算(suan)應(ying)運(yun)而生(sheng) 。 隨(sui)著 AI 芯(xin)(xin)片(pian)技術的(de)(de)飛速發展(zhan) , 邊(bian)(bian)緣計算(suan)設備(bei)的(de)(de)算(suan)力(li)不斷提(ti)高 , 越(yue)來(lai)(lai)越(yue)多的(de)(de)計算(suan)由邊(bian)(bian)緣側(ce)承擔 。 一方(fang)面(mian) , 邊(bian)(bian)緣計算(suan)能有效(xiao)緩解帶(dai)寬承載(zai) , 提(ti)高計算(suan)傳(chuan)(chuan)輸效(xiao)率 , 滿足實時響應(ying)需求 , 增(zeng)強數(shu)據(ju)安全性 ; 另一方(fang)面(mian) ,模型(xing)壓(ya)縮(suo)及(ji)(ji)(ji)加速技術以及(ji)(ji)(ji)適合人(ren)臉識別算(suan)法運(yun)算(suan)的(de)(de)專用 AI 芯(xin)(xin)片(pian)不斷完善(shan) , 邊(bian)(bian)緣設備(bei)的(de)(de)人(ren)臉識別算(suan)法精度持續提(ti)升 , 目前(qian)基(ji)于 AI 芯(xin)(xin)片(pian)的(de)(de)邊(bian)(bian)緣設備(bei)應(ying)用基(ji)本覆蓋社區 、 學校 、 醫院 、 園區 、 交(jiao)通(tong)等場景 , 支撐(cheng)人(ren)臉識別的(de)(de)大規模應(ying)用 。
云邊(bian)端(duan)協同(tong)部(bu)署(shu) , 人臉(lian)識(shi)別應用迎(ying)來(lai)新場景新模(mo)式。云邊(bian)端(duan)的(de)協同(tong)部(bu)署(shu)模(mo)式將人臉(lian)識(shi)別應用模(mo)塊分(fen)攤到各部(bu)分(fen) , 通(tong)過前端(duan)邊(bian)緣計算實現布控報警(jing) , 邊(bian)端(duan)對(dui)(dui)人臉(lian)特征做聚類分(fen)析 , 云端(duan)匯聚有效信息 , 進行大(da)數據對(dui)(dui)比分(fen)析 , 開展調(diao)度工作 。
云(yun)邊(bian)(bian)(bian)端(duan)協同(tong)部(bu)署方式緩(huan)解了(le)云(yun)端(duan)壓力 , 支持(chi)業務分級(ji)響應 , 云(yun)邊(bian)(bian)(bian)結(jie)合人臉識別系(xi)統通過對(dui)云(yun)端(duan)和邊(bian)(bian)(bian)緣(yuan)端(duan)資源的統一(yi)配置 、 管理 、 調度(du) , 融合了(le)邊(bian)(bian)(bian)緣(yuan)計算敏捷(jie)性和云(yun)端(duan)大數據全(quan)局性的優勢 , 使(shi)人臉識別系(xi)統在(zai)帶寬 、 并發數 、 響應速度(du)等(deng)維度(du)性能全(quan)面提升(sheng)。
在未來 , 邊(bian)緣端設備的(de)視頻編碼能力和(he)視頻特征(zheng)抽取(qu)能力將進(jin)一步加強 ,AI 應用也會(hui)將越來越多的(de)計算承載分攤(tan)到前端 。 云端則由人(ren)像(xiang)系(xi)統(tong) 、 視頻結(jie)構化系(xi)統(tong) 、 人(ren)臉(lian)人(ren)體聚類(lei)分析等(deng)服務(wu)組成 , 通過(guo)分析 、 聚類(lei) 、 歸(gui)檔(dang)形成各(ge)(ge)種(zhong)(zhong)主題庫 , 跟(gen)各(ge)(ge)種(zhong)(zhong)業(ye)務(wu)應用打通 , 滿足(zu)更(geng)多復雜場景下(xia)的(de)智能化應用需要。
算(suan)法技術國(guo)際(ji)(ji)領先 , 國(guo)內(nei)市(shi)場(chang)競(jing)爭(zheng)激烈。從全球競(jing)爭(zheng)格局上(shang)看(kan) , 中(zhong)國(guo)公司在人(ren)臉(lian)識別(bie)(bie)算(suan)法上(shang)具備相(xiang)當大(da)國(guo)際(ji)(ji)競(jing)爭(zheng)力 。從最(zui)新 NIST 主辦的(de)(de)(de)人(ren)臉(lian)識別(bie)(bie)算(suan)法測(ce)試 FR 町來看(kan) , 參加(jia)評測(ce)的(de)(de)(de)供(gong)應(ying)商(shang)有(you) 207 家,其中(zhong)中(zhong)國(guo)大(da)陸供(gong)應(ying)商(shang)有(you) 31 家 。 在其公布的(de)(de)(de)幾個主要測(ce)試集上(shang) , 共有(you) 7 家中(zhong)國(guo)人(ren)臉(lian)識別(bie)(bie)算(suan)法供(gong)應(ying)商(shang)取(qu)(qu)得過前三 , 5 家取(qu)(qu)得過第一(yi) , 且在近一(yi)年(nian)內(nei)保持這一(yi)優勢 。 總體來說 , 中(zhong)國(guo)的(de)(de)(de)人(ren)臉(lian)識別(bie)(bie)算(suan)法在國(guo)際(ji)(ji)上(shang)已處于領先地位 。
國內市場(chang)競爭(zheng)激烈一方面體現在競爭(zheng)廠商(shang)多(duo) , 包括傳(chuan)統(tong)安(an)(an)防企業(ye) 、 AI 初(chu)創企業(ye)和平臺生態企業(ye) 。 傳(chuan)統(tong)安(an)(an)防企業(ye)從安(an)(an)防市場(chang)出發 , 對安(an)(an)防視頻行業(ye)的痛(tong)點和客戶(hu)需求理(li)解較(jiao)深 , 擁(yong)有(you)產品+集成的優勢 , 已構建起很強的規模效應壁壘(lei) 。
AI 初(chu)創企(qi)業(ye)(ye)主要是一些(xie)新(xin)興的專注于做算法的計(ji)算機視(shi)覺 ( CV ) 初(chu)創企(qi)業(ye)(ye) ,以(yi) AI 算法為核(he)心(xin)優(you)勢 , 同時(shi)兼顧 “ 硬(ying)件落地 ” 及(ji) “ 產品化(hua)(hua) ”。 平(ping)臺(tai)生態(tai)企(qi)業(ye)(ye) ,依(yi)托其強大的云(yun)平(ping)臺(tai)以(yi)及(ji)云(yun)計(ji)算能力 , 以(yi)云(yun)平(ping)臺(tai)為核(he)心(xin)橫向(xiang)切入 , 整合合作伙(huo)伴(ban)的應用(yong)方(fang)案 , 構建統一的生態(tai)體系 , 并形成差異化(hua)(hua)競爭。
國內市場(chang)競(jing)(jing)爭激(ji)烈(lie)另一方(fang)面體(ti)現在全產業(ye)(ye)鏈競(jing)(jing)爭 , 從(cong)(cong)算(suan)法競(jing)(jing)爭延伸到(dao)芯(xin)(xin)片(pian)和(he)平臺競(jing)(jing)爭 。 主要市場(chang)參與者都(dou)已(yi)經加入 AI 芯(xin)(xin)片(pian)競(jing)(jing)爭中(zhong) , 安防企業(ye)(ye)注(zhu)重邊緣側和(he)端側的(de)(de)(de)推(tui)(tui)理芯(xin)(xin)片(pian) , 初(chu)創公司更(geng)注(zhu)重邊緣側推(tui)(tui)理芯(xin)(xin)片(pian) , 而(er)平臺生(sheng)態企業(ye)(ye)則注(zhu)重端 / 云(yun)一體(ti) , 構(gou)建從(cong)(cong)訓(xun)練到(dao)推(tui)(tui)理的(de)(de)(de)全棧(zhan) AI 生(sheng)態 。 下游的(de)(de)(de)競(jing)(jing)爭主要是(shi)應(ying)用層(ceng)的(de)(de)(de)競(jing)(jing)爭 , 是(shi)生(sheng)態的(de)(de)(de)競(jing)(jing)爭 , 是(shi)深耕行業(ye)(ye)的(de)(de)(de)競(jing)(jing)爭 。
四、人臉識別標準化
1、 標準化組織情況
國際(ji)標(biao)(biao)(biao)準(zhun)化方(fang)面 , 人(ren)臉識(shi)(shi)別(bie)標(biao)(biao)(biao)準(zhun)化工作主(zhu)要(yao)屬于生物特征識(shi)(shi)別(bie)標(biao)(biao)(biao)準(zhun)化分(fen)技術委員(yuan)會 (ISO/IEC JTC1/SC37 ) 工作范疇 , 其重點關(guan)注人(ren)臉識(shi)(shi)別(bie)基礎標(biao)(biao)(biao)準(zhun) , 如(ru)圖示圖標(biao)(biao)(biao)符號 、 樣本(ben)質量等 , 以(yi)及數據交換格式及符合性測試方(fang)法等。
其(qi)它關注人臉識(shi)(shi)別的(de)國(guo)(guo)外先進組(zu)織包括電(dian)氣與(yu)電(dian)子工程師協(xie)會(hui) ( Institute of Electrical and Electronics Engineers, IEEE) 、 美國(guo)(guo)消費技術協(xie)會(hui) (Consumer Technology Association, CTA) 等,其(qi)關注的(de)方向(xiang)在于生(sheng)(sheng)物特征(zheng)識(shi)(shi)別呈現(xian)攻擊檢測 、 人臉生(sheng)(sheng)物特征(zheng)識(shi)(shi)別信息的(de)性能評估等 。 ITU 與(yu)生(sheng)(sheng)物特征(zheng)識(shi)(shi)別標準(zhun)相關的(de)主(zhu)要(yao)是 ITU-T SG1 7 安全標準(zhun)工作(zuo)組(zu)下設的(de) Q9 和 Q10 。 Q9 主(zhu)要(yao)關注在通信應用(yong)(yong)環境中應用(yong)(yong)生(sheng)(sheng)物特征(zheng)識(shi)(shi)別及其(qi)標準(zhun)化工作(zuo) 。
隨著生物(wu)特(te)征(zheng)識(shi)別技(ji)術在電子(zi)商務(wu) 、 電子(zi)健康和(he)移動支付(fu)領(ling)域中的(de)廣泛應用 , 該工(gong)作組(zu)同(tong)樣關(guan)注(zhu)生物(wu)特(te)征(zheng)數據的(de)隱私保護 、 可靠(kao)性(xing)和(he)安全(quan)性(xing)等方面的(de)各種(zhong)挑戰(zhan) 。 Q10 關(guan)注(zhu)身份管理架構和(he)機制 , 部分標(biao)準(zhun)項目與基于生物(wu)特(te)征(zheng)識(shi)別身份認證相關(guan) 。 進(jin)幾年 , ITU-TSG16 媒(mei)體(ti)工(gong)作組(zu)基于視(shi)頻監控(kong) 、 機器視(shi)覺等應用場景 、 功能需求(qiu) 、 業務(wu)需求(qiu) 、 性(xing)能需求(qiu)以及安全(quan)需求(qiu) , 在 Q12 、 Q21 等課題組(zu)先后開(kai)展人臉識(shi)別標(biao)準(zhun)的(de)研究和(he)制定工(gong)作 。
國(guo)內組(zu)織方面(mian) , 主(zhu)要是(shi)全(quan)國(guo)信(xin)息技(ji)(ji)術標(biao)準化(hua)技(ji)(ji)術委員(yuan)(yuan)會生物(wu)(wu)特(te)(te)征識(shi)別(bie)(bie)(bie)分技(ji)(ji)術委員(yuan)(yuan)會 ( SACOC28/SC37 ) 和全(quan)國(guo)安(an)全(quan)防范報警系統標(biao)準化(hua)技(ji)(ji)術委員(yuan)(yuan)會人(ren)(ren)體(ti)生物(wu)(wu)特(te)(te)征識(shi)別(bie)(bie)(bie)應用(yong)分技(ji)(ji)術委員(yuan)(yuan)會(簡稱 SAC/TC100/SC2 ) 負(fu)責生物(wu)(wu)特(te)(te)征識(shi)別(bie)(bie)(bie)標(biao)準的制定(ding) 。 其中 SACATC28/SC37 成(cheng)立了(le)人(ren)(ren)臉識(shi)別(bie)(bie)(bie) 、移動設(she)(she)備生物(wu)(wu)特(te)(te)征識(shi)別(bie)(bie)(bie)等多個工(gong)作(zuo)組(zu) , 發布了(le)人(ren)(ren)臉樣本質(zhi)量(liang) 、 人(ren)(ren)臉圖像數(shu)據交換格式 、 移動設(she)(she)備人(ren)(ren)臉識(shi)別(bie)(bie)(bie)等標(biao)準 。 SA5C100/SC2 發布了(le)視頻監控 、 出入(ru)口(kou)控制等公(gong)共安(an)全(quan)領域的多項人(ren)(ren)臉識(shi)別(bie)(bie)(bie)標(biao)準 。
此外 , 國內(nei)組織方面 , 全(quan)國防偽標準(zhun)化(hua)技術委員會(hui) ( SAC/TC218 ) 發(fa)布了國家標準(zhun) 《 生(sheng)物特征(zheng)識(shi)(shi)別(bie)(bie)(bie)防偽技術要求(qiu)第 1 部分(fen) : 人(ren)臉(lian)識(shi)(shi)別(bie)(bie)(bie) 》 。 全(quan)國金融(rong)標準(zhun)化(hua)技術委員會(hui) ( SAC/TC 180 ) 發(fa)布了國家標準(zhun) 《 金融(rong)服務生(sheng)物特征(zheng)識(shi)(shi)別(bie)(bie)(bie)安全(quan)框架 》 , 并(bing)且正在(zai)制定 《 人(ren)臉(lian)識(shi)(shi)別(bie)(bie)(bie)技術線下支付安全(quan)應用(yong)規范(fan) 》 等生(sheng)物特征(zheng)識(shi)(shi)別(bie)(bie)(bie)行業標準(zhun) 。
公(gong)(gong)安(an)(an)部社(she)會公(gong)(gong)共(gong)安(an)(an)全(quan)應(ying)用基礎標準(zhun)化技(ji)(ji)術(shu)委(wei)(wei)員會發(fa)布了行(xing)業標準(zhun) 《 視頻圖(tu)像分(fen)析儀(yi)第 4 部分(fen) : 人臉分(fen)析技(ji)(ji)術(shu)要求 》 。 全(quan)國信息安(an)(an)全(quan)標準(zhun)化技(ji)(ji)術(shu)委(wei)(wei)員會 ( SAC/TC260 )發(fa)布了國家標準(zhun) 《 信息安(an)(an)全(quan)技(ji)(ji)術(shu)遠程人臉識(shi)別系統技(ji)(ji)術(shu)要求 》 等(deng)。
2、標準制修訂情況
國際(ji)標準化組(zu)織和其他(ta)國外先進標準組(zu)織人臉識別相關的(de)標準統計情(qing)況見下(xia)表。
▲ISO 國際標準統計表
我國人臉識(shi)別相關的標準情況見下表。
▲我(wo)國人臉識別相(xiang)關的標準情況見表
智東西認為,當(dang)前 , 我(wo)國的(de)人(ren)(ren)臉識別技(ji)術與應(ying)用在國際上處于領(ling)先(xian)地位 ,在科技(ji)金融 、 智(zhi)慧(hui)安防(fang) 、 智(zhi)慧(hui)交通 、 民生政務 、 教(jiao)育考試 、 智(zhi)能家居等(deng)多(duo)個(ge)領(ling)域(yu)得(de)到(dao)了廣泛(fan)應(ying)用。但是,近一年人(ren)(ren)臉識別技(ji)術也出(chu)現了很多(duo)不(bu)良(liang)影響,“售樓處暗藏人(ren)(ren)臉識別”、人(ren)(ren)臉信息泄露等(deng)問題(ti)屢(lv)見不(bu)鮮。隨著技(ji)術門檻的(de)逐(zhu)步降低(di),加強安全(quan)技(ji)術的(de)研(yan)發(fa)和應(ying)用,完善(shan)相關的(de)法律法規變得(de)尤為重要。