在過(guo)去一年中,人工(gong)智能的(de)新算法(fa)不斷(duan)涌現(xian),深度(du)學習(xi)仍是這一時期(qi)發(fa)展主線,嘗試解(jie)決更(geng)為復雜的(de)應用任務。 人工(gong)智能的(de)產(chan)業(ye)格局與生(sheng)態(tai)體(ti)系更(geng)為明晰,開源(yuan)開發(fa)框架格局逐步確立,以科技巨頭引(yin)領(ling)的(de)生(sheng)態(tai)系統垂直整合速度(du)不斷(duan)加快;同時,產(chan)業(ye)發(fa)展重(zhong)心開始轉變,企業(ye)比拼重(zhong)點(dian)從單項技術的(de)理論準確率轉向(xiang)應用場景白(bai)熱化的“跑馬圈地(di)”。

人工智能(neng)的(de)技術應用開始(shi)全面覆蓋日常生(sheng)活、 科學研究(jiu)、社(she)會(hui)治理、商業創新(xin)和國(guo)家安全等經濟(ji)社(she)會(hui)的(de)關鍵(jian)領域, 以空前的(de)廣度(du)和深度(du)推動社(she)會(hui)發展。然而,由于人工智能(neng)技術成熟周期相(xiang)對較長,產業發展速(su)度(du)不(bu)及資(zi)本市場預期, 資(zi)本熱度(du)開始(shi)減退(tui)。 人工智能產業(ye)似(si)乎顯現出“陷入困(kun)境”與“高速發展”的矛盾現象。

本期的智能內參,我們推薦中國信通院的報告《人工智能核心技術產業白皮書》, 探討以深度學習技術(shu)為(wei)主要驅動力(li)的人工智能(neng)發展(zhan)狀況、 技術(shu)創新重點(dian)與產業發展(zhan)趨勢(shi),總結(jie)十(shi)三(san)五(wu)期(qi)間(jian)我國發展(zhan)情況, 提出十(shi)四五(wu)期(qi)間(jian)的發展(zhan)方向與機遇(yu)

本(ben)期內(nei)參來源:中國信通院

原標題:

《人工智能核心技術產業白皮書》

作者:李論 lilun@caict.ac.cn

一、 人工智能核心技術產業(ye)發(fa)展總體態(tai)勢

1、 深度學習(xi)技術進入升(sheng)級優化階段

人工智能技(ji)術體系(xi)與產業(ye)(ye)體系(xi)錯位發(fa)展(zhan),深度(du)學習理論突(tu)破速度(du)逐步(bu)放緩,產業(ye)(ye)開始步(bu)入(ru)高速發(fa)展(zhan)階段。 目前,本輪深度學(xue)習(xi)理(li)論突破(po)速度開(kai)始(shi)放緩,技術(shu)紅利的(de)持續釋放驅動圖像分類(lei)、機器翻譯等(deng)(deng)多類(lei)感知任務準確(que)率大幅增長,步入升級(ji)優化(hua)期。 人工智能(neng)本輪爆發初(chu)期主要在(zai)探(tan)討算法理(li)論的(de)可能(neng)性,聚焦探(tan)索(suo)強化(hua)學(xue)習(xi)、遷移(yi)學(xue)習(xi)等(deng)(deng)新(xin)的(de)學(xue)習(xi)方式以(yi)及 AlexNetVGGGoogLeNet 等結構多(duo)樣的算法模型;算法(fa)理論的(de)不確(que)定性和(he)(he)技術的(de)不成熟耗費產業界大(da)量(liang)精(jing)力和(he)(he)時間(jian),阻礙人工智能大(da)規模應用進(jin)程(cheng)。

目前, 產(chan)業開始步入高速(su)發(fa)展(zhan)時期, 2020年技術標(biao)志性生(sheng)產工具 TensorFlow 框架下載(zai)量爆發式增長(chang), 僅一個月(yue)11000 萬次,占發(fa)布四年半下載總量( 1 個億+) 的十分之一;同時,技術成(cheng)本快(kuai)速下降(jiang)(jiang)(jiang),同等(deng)算法水平(ping)(ping)所(suo)需計算量每八(ba)個月降(jiang)(jiang)(jiang)低一倍(bei),成(cheng)本降(jiang)(jiang)(jiang)低百倍(bei), 業內涌(yong)現出(chu)研發平(ping)(ping)臺(tai)(tai)、技術服(fu)務平(ping)(ping)臺(tai)(tai)等(deng)多樣化的平(ping)(ping)臺(tai)(tai)形態, 工(gong)程技術正(zheng)在引領產業快速發展

2、 寒冬并非低(di)谷,產業生態已現加速構建態勢

資本寒冬已經出現。 其中,預期過高是主要原(yuan)因。 人(ren)工智能企業增速(su)明(ming)顯放緩(huan), 20192020 年全球每年新增人(ren)工智能(neng)企業(ye)數(shu)量已不足 100 且投(tou)融資的輪(lun)次(ci)后移趨勢不斷(duan)擴大(da)。 2020 年(nian) B 輪及以上融資筆(bi)數(shu)(shu)占(zhan)總筆(bi)數(shu)(shu)的 62.3%,較上一年(nian)增長 40%以(yi)上。同時,曾獲大筆融資(zi)的知名創(chuang)新企(qi)業(ye)由于預期過高、虛假宣(xuan)傳(chuan)等原因退出產業(ye)舞(wu)臺。曾對(dui)標英特(te)爾的芯片(pian)企(qi)業(ye) Wave Computing,是人工智能計算領域最(zui)受(shou)關(guan)注(zhu)的獨角獸(shou)之一, 2020 4 月由于(yu)數據流處理(li)器性能不達預期(qi)而(er)宣告破產;智能會(hui)計工具 ScaleFactor 宣稱(cheng)利用(yong)人(ren)工智能技術自(zi)動化生成財務報表, 但實(shi)際卻(que)部分采用(yong)人(ren)工外(wai)包方式處理, 在融資1 億(yi)美(mei)元(yuan)后于(yu) 2020 3 月宣告倒閉。

此外, 資本早期對(dui)人工(gong)智能產業回(hui)報(bao)周期過于樂觀(guan)是資本寒冬的(de)另(ling)一原因。 移(yi)動(dong)互聯(lian)網在偏向工程屬性的(de)前(qian)提下,資(zi)本(ben)預(yu)期(qi)取得成效的(de)時(shi)間為二到(dao)四(si)年;與(yu)之相較(jiao),人工智能與(yu)傳統行(xing)業(ye)(ye)核心(xin)業(ye)(ye)務深度融合,需(xu)更高的(de)技術準確(que)率和(he)更深刻的(de)行(xing)業(ye)(ye)理(li)解力。因此,人工智能產業(ye)(ye)孕育時(shi)間更長,資(zi)本(ben)市場的(de)期(qi)望和(he)現實出現較(jiao)大(da)偏差。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

全球融資輪(lun)次數量分(fen)布(bu)

從技(ji)術(shu)基礎理論突破到工程(cheng)化落地應用,既有(you)技(ji)術(shu)紅利已為產業發展(zhan)奠定堅實(shi)基礎。 當前,雖然(ran)資本市場(chang)的(de)泡沫(mo)逐步(bu)破(po)裂,但優質企(qi)業的(de)估值仍在持續增長,獨角獸企(qi)業不斷出現, 產業呈(cheng)現良性發(fa)展(zhan)態勢。深度(du)學習技(ji)術(shu)局限性似乎(hu)導(dao)致人工(gong)智能產業發(fa)展(zhan)將遇天花板,然(ran)而事實并非如此。雖然(ran),可解釋(shi)性、理(li)解推(tui)理(li)等局限性確已顯現,但這是下一時(shi)期理(li)論技(ji)術(shu)突(tu)破(po)重點, 不能因此否定圖像(xiang)識別(bie)、語音合成(cheng)、機器(qi)翻(fan)譯等(deng)感知類(lei)任務上的應用技(ji)術成(cheng)就(jiu)和產業應用前景。 目前,基 于深(shen)度(du)學習理論的優化技術層(ceng)出(chu)不窮, RegNetGPT-3 等(deng)模型不(bu)斷提升(sheng)視覺處理、閱讀理解等(deng)基礎智(zhi)能任務水平(ping),虛擬助(zhu)手、多語種翻譯等(deng)智(zhi)能應(ying)用已(yi)開始進入規模化應(ying)用階段(duan),大量的行業(ye)應用場景加速深度融合,技術(shu)能力(li)和優化速度可見 5 8 年的紅(hong)利。

業各環節(jie)逐步(bu)明晰,規模化應(ying)用突(tu)破已現曙(shu)光。 人工(gong)智能技術(shu)在(zai)消費(fei)(fei)互聯網領域發展速度較(jiao)快,智能推薦、視(shi)覺識別、語(yu)音助手等智能技術(shu)能力(li)已深(shen)度應用(yong)至電商、社交、資訊等消費(fei)(fei)互聯網平臺(tai)以及(ji)手機、無(wu)人機等消費(fei)(fei)終端中(zhong),并加(jia)速與核心業務進行整合(he)。當前,智能(neng)技術正在向更(geng)多(duo)的行業領(ling)域滲(shen)透(tou),融(rong)合滲(shen)透(tou)仍(reng)需(xu)時日孕育。 相較于消費互聯(lian)網領域,傳統行(xing)業的(de)知識獲取和積累需(xu)要(yao)較長時(shi)間,應用(yong)場景碎片化的(de)特點導(dao)致低成本(ben)、易用(yong)、泛化能力(li)較強(qiang)的(de)能力(li)平臺構建需(xu)較長周期。

總體(ti)來(lai)看(kan),人工智能產(chan)業正處于 S 曲線中快速發(fa)展(zhan)的臨(lin)界位(wei)置(zhi)(如(ru)下圖),現階段(duan)智(zhi)能技術(shu)落地成(cheng)本較(jiao)為昂(ang)貴(gui),導致智(zhi)能產品絕(jue)對(dui)量增加時,其單位(wei)成(cheng)本并未明顯下降。目前(qian),人工智(zhi)能頭(tou)部企業加速布局, 不(bu)斷完善技術生產(chan)工具(開源開發框(kuang)架(jia)、數據(ju)處理、驗證分析、部(bu)署監(jian)測等(deng)完備研(yan)發工具鏈), 加速建立全棧智能計算技(ji)術(shu)體(ti)系(形成(cheng)基礎計算理論、 芯片、 軟硬協同、 系(xi)統協同全(quan)棧技(ji)術支撐能(neng)力), 探索孕育(yu)基礎和垂直(zhi)行業技(ji)術平臺; 產(chan)業(ye)規(gui)模化發展的(de)進程正(zheng)在不斷(duan)加速,規(gui)模經(jing)濟有望形成(cheng)。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

人工智能規(gui)模(mo)經濟 S 曲線

3、 人工智能以(yi)空前廣(guang)度與深度推動社(she)會發展,加速產業結構升級進程

工(gong)智(zhi)能(neng)已全(quan)面覆蓋社(she)會(hui)運(yun)(yun)(yun)行(xing)(xing)的(de)基(ji)本要素,內生(sheng)化提升(sheng)全(quan)局運(yun)(yun)(yun)轉效率。從(cong)社(she)會(hui)運(yun)(yun)(yun)行(xing)(xing)角度,人工(gong)智(zhi)能(neng)加速影(ying)響(xiang)日常生(sheng)活、科學研究、商業創新和國家安全(quan)等(deng)社(she)會(hui)運(yun)(yun)(yun)行(xing)(xing)的(de)基(ji)本要素。一是人工(gong)智(zhi)能(neng)與科學(xue)研(yan)究的結合(he)已開始改變(bian)基于傳統(tong)學(xue)術經(jing)驗的科學(xue)研(yan)究方式,實現從大量已知(zhi)論文、實驗(yan)數據中挖掘(jue)未知(zhi)理論,加(jia)速提(ti)升化學、材料、物理、藥物研發等領域(yu)文獻(xian)獲取速度與實驗(yan)發現效率, 成為下一時期科技競爭的重要動力。

二是(shi)人工智能成(cheng)為商業創新與競爭(zheng)的下一個主(zhu)戰場, 傳統(tong)行業(ye)巨頭加速布局智能供應(ying)(ying)鏈、質量(liang)檢測、商業(ye)決策等(deng)細分應(ying)(ying)用,有望(wang)顯(xian)著提升生產(chan)流程、質量(liang)控制、商業(ye)營運(yun)等(deng)環(huan)節效率,改善工作條件;

三是娛樂、消費(fei)電子、醫(yi)療等生活領域的(de)智能應用不(bu)斷貼近、細化場景需求, 室內(nei)安防無人(ren)機、人(ren)性化虛擬助手等智能消費產品不斷(duan)涌現,問診(zhen)機器人(ren)及智能影像逐步推(tui)廣使用,醫療資(zi)源緊缺(que)、分布不均等一(yi)些行業痛(tong)點(dian)開始緩解; 四(si)是疫情加速教育培訓(xun)向在線智能化發展(zhan),試(shi)題 OCR 識別、輔助批改等應用已從試點向規模化發展,推動教學(xue)管(guan)理(li)向精準管(guan)理(li)轉變(bian),助力個性(xing)化學(xue)習體系的建立; 五是全球領先國家已充分意識到人工智能技術與國防安全融合的重要程度, 投入針對性資金推動預測維護、自動駕駛、情報分析、智能飛控等國防智
能應用的發展。

人工智能滲透率的提升有(you)望顯著加(jia)快全(quan)產(chan)業(ye)鏈結構的優化速度,牽引產(chan)業(ye)向高附(fu)加(jia)值的產(chan)品與服務(wu)轉變。一(yi)方面, 人工智能作為(wei)眾多技術產品創新核(he)心(xin),是下一時(shi)期(qi)最為(wei)關(guan)鍵(jian)的高附加值產業。據(ju)預測,到 2030 年(nian)約 70%的行(xing)業企業將(jiang)使(shi)用人(ren)工(gong)智能技術,預計(ji)為全球增加13 萬億美元的附(fu)加值另一方面, 人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)加速提(ti)升(sheng)傳統行(xing)業高附加值產(chan)(chan)品的比(bi)重, 進一步優(you)化(hua)產(chan)(chan)業結(jie)構。人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)技術與核心業務(wu)、專家(jia)經驗深度融合,行(xing)業主營(ying)產(chan)(chan)品和運(yun)行(xing)方(fang)式的智(zhi)(zhi)能(neng)化(hua)程度正在不(bu)斷提(ti)升(sheng),衍生新(xin)產(chan)(chan)品與新(xin)服務(wu)。《麻(ma)省理(li)工(gong)科技評論》全球 50 家聰明(ming)企業( TR50)榜單中已(yi)顯現傳(chuan)統行(xing)業企業的身影(ying),如布(bu)局醫藥研(yan)(yan)發賦能平臺的傳(chuan)統藥物研(yan)(yan)發廠商藥明(ming)康德,利用智能技術(shu)提升物流(liu)收(shou)派效率的順豐科技等(deng)。

二、 人工智能技(ji)術創新重點

1、 深度學習試圖從多角度融合創新,開啟認知(zhi)時(shi)代(dai)仍在探索

深度學習仍然是(shi)人工智(zhi)能技(ji)術發展的(de)主導路線。 當前,基于大(da)量(liang)標(biao)注數(shu)據進行訓練是深度學習技術實際應用的主(zhu)要(yao)路線,從 1400 余萬幅圖片的ImageNet數據集至2020年臉書和卡內基(ji)梅隆大(da)學構建的超過 130 萬(wan)種化合物分子間作用數據集 Open Catalyst,模型訓練所需標注數據普遍達十萬以上。然而,這種路線在取得良好成效的同時,面臨著嚴重依賴標注數據的問題,帶來在更多細分場景中應用落地的局限性。

業(ye)內不斷拓展深度學習解決問題的(de)邊界, 推動人工智(zhi)能進(jin)入感知增強時代。 人工智能(neng)純粹(cui)使用有監督學習方式訓練深度學習模(mo)型的時代基本結束,受限于對(dui)大量標注數據依賴(lai)與理解(jie)能(neng)力(li)缺乏,這種路徑難以解(jie)決更(geng)多應用問題。當前(qian), 感(gan)知增強時代拉開(kai)序幕(mu),這一(yi)時期(qi)的新算法聚焦提升數(shu)據(ju)的質(zhi)量(liang)和規模, 通(tong)過遷移其(qi)他領域訓(xun)練成果、自(zi)主生(sheng)成或增強數(shu)據(ju)、依(yi)托知識(shi)圖譜常(chang)識(shi)關(guan)系、利用多(duo)源數(shu)據(ju)等(deng)方式側面彌(mi)補深度學習的局限性。 深度強(qiang)化學(xue)習(xi)(xi)(xi)、多模態學(xue)習(xi)(xi)(xi)等(deng)多元化的(de)學(xue)習(xi)(xi)(xi)方式(shi)受(shou)到產業熱(re)捧,深度學(xue)習(xi)(xi)(xi)技(ji)術與知識工程、傳統(tong)機器(qi)學(xue)習(xi)(xi)(xi)等(deng)分(fen)支(zhi)的(de)結合成(cheng)為學(xue)界探索的(de)熱(re)點新方向。

深度學(xue)(xue)習(xi)(xi)(xi)加速探索(suo)與多元學(xue)(xue)習(xi)(xi)(xi)方式、多種技術(shu)分支的(de)(de)結(jie)合(he), 少量數(shu)據(ju)訓練、弱化人(ren)為干預以及多模態(tai)學(xue)(xue)習(xi)(xi)(xi)成為下(xia)一時期的(de)(de)發(fa)展關鍵(jian)。

一是減少數據量依賴的少樣本學習。 少(shao)(shao)樣(yang)本學(xue)習(xi)(xi)通(tong)過(guo)復用其他領域知(zhi)識結構,使(shi)用少(shao)(shao)量(liang)數據對新(xin)領域進行訓練, 已(yi)進入初步應用階段,如英偉達提出基于少(shao)(shao)樣(yang)本學(xue)習(xi)(xi)的(de)視頻轉化(hua)( Few-shot vid2vid)框架(jia),僅借助少量目標(biao)示例圖像即可合成(cheng)未出現過的目標(biao)或場景(jing)視頻(pin)。

二是(shi)弱化人為干預的自監督(du)學習、強化學習。 業內主(zhu)流(liu)的(de)有監督學習方式(shi)數據標注成本(ben)高昂,以(yi)機器(qi)翻(fan)譯任務為例,市場人工翻(fan)譯每單詞(ci)平均價格約 7.5 美分, 假(jia)設單個句子平均長度為 30 個單詞, 1000 萬個句子人工翻譯標注的成本約為 2200 萬美元;若需支(zhi)持(chi)上(shang)百種語言的(de)(de)互譯,人工標注訓練(lian)集(ji)的(de)(de)成(cheng)本將達上(shang)千億美元。這種高昂(ang)的(de)(de)數據成(cheng)本促使學產兩界加速對深(shen)度(du)強化(hua)學習(xi)、自監督學習(xi)等(deng)范式的(de)(de)探(tan)索。 圖(tu)靈獎(jiang)獲得者楊立昆( Yann LeCun)加速自監督(du)學習的(de)(de)研(yan)究進程,通(tong)過從(cong)未標記的(de)(de)數據集中學習監督(du)信息, 提升數據無(wu)標注(zhu)下的(de)(de)學習能力;DeepMindOpenAI 等機構不斷演進深度強化學習算法,試圖顯著提升(sheng)智(zhi)能體的自主決(jue)策和多智(zhi)協同(tong)能力。

三是提高應用場景復雜度的多模態學習。 應用場景(jing)正從單(dan)一視(shi)(shi)覺、語音(yin)的感知向(xiang)多模(mo)態理解(jie)側重,復雜度(du)不斷(duan)提升, 從多模(mo)態信息源中學習(xi)模(mo)態間(jian)關系成為焦點(dian),如菜肴(yao)制作視(shi)(shi)頻與菜譜(pu)文本步(bu)驟對(dui)齊、唇動視(shi)(shi)覺描述與語音(yin)信號融合預測(ce)單(dan)詞(ci)等。深度(du)學習(xi)技術正在(zai)不斷(duan)挑戰(zhan)更為復雜的任務,擴展能夠解(jie)決問題的邊界。

直面推理理解(jie)問題的算法路徑尚無定(ding)論,距離認(ren)知時代到來仍需數年。從理論體系角度(du)來看,深度學習的領(ling)軍(jun)專家開(kai)始探索深度學習理(li)論體系的新形態,反(fan)向(xiang)傳播、經典神經網絡模型等已有基礎(chu)理(li)論受到質疑(yi)。目前,杰弗里(li)·辛頓( Geoffrey Hinton)提出替代深度(du)神經網絡(luo)( DNN)架構的膠囊網(wang)絡,試(shi)圖解(jie)決小(xiao)樣(yang)本問題。 然而(er),膠囊網絡雖連(lian)續(xu)三年推陳出新,但研究進(jin)(jin)程并非疊加式(shi)的演進(jin)(jin),而(er)是完全不(bu)同(tong)路(lu)徑的替(ti)代。

從學(xue)習方式角(jiao)度來(lai)看, 近一年來,強化(hua)學(xue)習(xi)實現通(tong)用智能(neng)的(de)技(ji)術路徑不(bu)再是(shi)業內共識(shi),不(bu)依賴大量人工(gong)標注數據的(de)自監督學(xue)習(xi)成(cheng)為學(xue)習(xi)方式的(de)新焦點(dian),并在 2020 年(nian) ICMLICLR 等全球人工智能學(xue)術會議(yi)上高頻出現,已成為眾多(duo)專家(jia)所(suo)關注的關鍵路徑。然而,無論(lun)是深度學(xue)習體系(xi)的顛覆式(shi)創(chuang)新,還是多(duo)種(zhong)學(xue)習方式(shi)的不斷嘗試,具備理(li)解能力的算法(fa)模(mo)型(xing)目前未有顯現跡象, 真正的認知時代到(dao)來(lai)仍未(wei)可(ke)知。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

人(ren)工智(zhi)能(neng)技術發展階段(duan)

2、 任務(wu)場景愈加復雜,倒逼(bi)學習方式多(duo)元化發展

有(you)監(jian)督學習(xi)建立在嚴苛條件之上,已不(bu)能完全滿足模型學習(xi)需求,面對更為復雜的(de)(de)任務場景,業(ye)內加速探索強(qiang)化學習(xi)、自監(jian)督學習(xi)等多元學習(xi)方式,試圖(tu)縮小與(yu)通用(yong)智能的(de)(de)距離。

深度強化學習不斷演進,加(jia)速(su)提升自主(zhu)決策能力。 深度強化學習加(jia)速(su)拓展任務邊界, 突破性解(jie)決多人棋牌(pai)、即時戰(zhan)略游戲等多智(zhi)能體(ti)非完全信息博弈任務。目前, OpenAI、谷歌、微軟等企業相繼攻(gong)克(ke)即(ji)時戰(zhan)略(lve)、 德州撲克(ke)、麻將等復雜游戲(xi), 并加速向(xiang)無人機群體飛(fei)行等更為實際的應(ying)用場(chang)景(jing)拓展。另(ling)一(yi)方面, 深度強化學習(xi)不斷(duan)提升處理(li)復雜任務(wu)的能(neng)力, 逐步拓(tuo)展(zhan)芯片設計、音樂編曲等(deng)對知識技能(neng)要求更高(gao)的專業領域,如 2020 年谷歌研究人員利用深度強化(hua)學習優化(hua)設計(ji)芯片布局,達到(dao) PPA(功率、性能(neng)(neng)、面積)的最佳(jia)平衡,顯著(zhu)縮短設計時(shi)間;清華大(da)學(xue)提出(chu)用于在線(xian)伴奏生(sheng)成的深度強(qiang)化學(xue)習算(suan)法,能(neng)(neng)夠根據輸(shu)入音樂實時(shi)生(sheng)成伴奏。

自監督學(xue)(xue)習成為(wei)最為(wei)活(huo)躍的(de)學(xue)(xue)習方式。 谷歌、臉書等多家企業先后發布使用自監督學習的算法模型,通過挖掘無標注數據的監督信息(xi),顯著(zhu)減少人為干預,在自然語言理(li)解( NLP)領域取得(de)顯著成(cheng)效,如(ru)谷歌(ge) BERT、 臉書 RoBERTaOpenAI GPT-3 等。目前(qian),學產兩界正在加速自監督學習在計算(suan)機視覺( CV)領域的突破創新,已在精細圖(tu)像處理方(fang)面初步(bu)取得進(jin)展(zhan),如(ru)華盛頓大(da)學利用自監(jian)督(du)學習方(fang)式實(shi)現圖(tu)像背景(jing)的前后景(jing)分離(li),精度達像素(su)級別,可實(shi)現頭發絲的精確(que)分離(li)。然而,盡管在自然語言理解、視覺處理等方(fang)面取得初步(bu)進(jin)展(zhan),現階(jie)段自監(jian)督(du)學習本質上仍依賴(lai)規范化、標簽化的數據,主要借助預訓練模型構造并學習數據特征(zheng),而非(fei)基(ji)于(yu)對數(shu)據內(nei)容和任務(wu)對象(xiang)的深層次認知;真正理解數(shu)據內(nei)容的自(zi)監(jian)督學習尚未出現。

3、 深度神經網(wang)絡理論體系嘗試顛覆性創新,多(duo)分支融合趨勢(shi)漸(jian)顯

深(shen)度學習局限(xian)性日益凸顯(xian),理論(lun)體系探索革新。 當前(qian),以(yi)杰弗里·辛頓( Geoffrey Hinton)為(wei)代表(biao)的(de)(de)(de)業內巨頭持續推動理論體(ti)系的(de)(de)(de)創新(xin)(xin),其中,膠囊網絡作為(wei)革新(xin)(xin)熱點,試圖解(jie)決(jue)數據依(yi)賴與不可解(jie)釋問題;然而,歷史上膠囊網絡的(de)(de)(de)三個版本(ben)更新(xin)(xin)大相(xiang)徑庭, 尚未形(xing)成穩定(ding)的(de)(de)(de)新(xin)(xin)形(xing)態(tai)架(jia)構, 仍處于探索(suo)階段。 此外,以膠囊網絡為(wei)核心的(de)(de)(de)應用也在不斷(duan)探索(suo), 2020 Hinton 團隊提出(chu)一種用于機器(qi)學習安(an)全領域(yu)的(de)網(wang)絡檢測機制,顯著提升(sheng)攻擊檢出(chu)率;中佛羅(luo)里達大學學者提出(chu)膠囊路由方(fang)法,可通過輸入句子查詢視頻中符合條件的(de)人物及特(te)定動(dong)作(zuo),但上(shang)述(shu)成果仍(reng)停留(liu)在研究階段。

深度神經網絡與其他(ta)技術分支(zhi)加速融合(he)發展。 人工(gong)智能(neng)頭部企業、高校(xiao)等開始摸索深度神經網(wang)絡與知識圖譜、傳統(tong)機器學習等分支的(de)融合(he)創新。

一(yi)方面, 知識圖譜試圖在不顛覆深度學習理論的基礎之下,彌補小樣本訓練與理解推理能力不足的技術天花板。目前,面向垂直領域的專業知識圖譜加速發展,已在金融、醫療、司法多個行業初步應用, 顯著提升垂直行(xing)業應用中知識自(zi)動(dong)關聯、 自(zi)動(dong)獲(huo)取的智能化水(shui)平。如金融消(xiao)費領(ling)(ling)域,螞蟻(yi)(yi)金融知(zhi)識圖譜平臺已經(jing)廣(guang)泛(fan)應用(yong)在(zai)螞蟻(yi)(yi)內部以及合作伙伴(ban)的微貸、保險智能(neng)理賠和智能(neng)理財等(deng)業務領(ling)(ling)域中;藥物研發(fa)領(ling)(ling)域,亞馬遜開(kai)發(fa)藥物重(zhong)定位知(zhi)識圖譜( DRKG)預(yu)測藥(yao)物(wu)與疾病靶(ba)點(dian)結合的(de)可能性,縮短藥(yao)物(wu)研發周(zhou)期(qi)并降低(di)成本,已用于新冠病毒藥(yao)物(wu)研發。

另一方面, 深度學習與傳(chuan)統(tong)機器(qi)學習融合已(yi)顯現(xian)新(xin)的算法形態; 貝葉(xie)斯深度學習成為熱(re)點(dian)方(fang)向之一,有效利用先驗知識解(jie)決(jue)過擬合、小樣本數據等問題,模型性能超越傳(chuan)統(tong)深度學習方(fang)法,如(ru) DeepMind 提出貝葉斯 RNN 模型,圖(tu)注釋生成(cheng)任務(wu)表(biao)現顯著優于傳統 RNN 模型(xing);紐約大學和三星(xing)研(yan)究人員提出基(ji)于貝葉斯思(si)想的深度學習不確(que)定性表示方法 SWAG, 大幅提高模(mo)型泛化能力, 在異(yi)常點檢(jian)測、校準等計(ji)算機視覺任(ren)務(wu)上表現良好。

4、 預訓(xun)練(lian)模型加速(su)演(yan)進,試圖實現語言處理領域的通用智能(neng)

預訓練模型參數已至(zhi)萬億級,訓練成本之高(gao)幾乎成為(wei)業內頭部玩家的專屬技術路徑。 2020 年, OpenAI 發布 GPT-3 模型,模型參數(shu)多達(da) 1750 億(yi)個,高達 1200 萬美元的(de)訓練(lian)費用為(wei)預訓練(lian)模型(xing)的(de)構建構筑壁壘,中小型(xing)人工智能企業難以望(wang)其項背。 2021 年(nian),谷歌發布 SwitchTransformer 模型,再次將模型參數推至 1.6 萬(wan)億新高。此外(wai),微軟宣布與 OpenAI 達成合作協議,獲得 GPT-3 語言模(mo)型源碼的(de)獨家授權,升級巨型模(mo)型的(de)寡頭格局形勢,預(yu)示(shi)著(zhu)未來超(chao)大規模(mo)預(yu)訓練(lian)模(mo)型或將掌(zhang)握(wo)在少數(shu)頭部企業手中。

預訓練模型(xing)已進入可(ke)直(zhi)接用于(yu)多(duo)種自然語言處理任務的“通用”智能階段。 預訓練模型再次升級,頭部人工智能企業先后發布通用預訓練模型,可直接面向多種自然語言處理任務使用,不再需要針對不同任務進行微調。目前,谷歌 T5OpenAI GPT-3 等通用(yong)預(yu)(yu)訓練模(mo)(mo)型進一(yi)步(bu)提升(sheng)文(wen)本理解能力,在包含閱讀(du)理解、問答等任務(wu)的基準測試(shi)中接近(jin)人(ren)類水平。另一(yi)方面,通用(yong)預(yu)(yu)訓練模(mo)(mo)型加速(su)步(bu)入產業應用(yong)階(jie)段,OpenAI 公司(si)發布 GPT-3 商用應用程序接口( API,提供問(wen)答、翻譯、文本生成等服務(wu), 搜索服務(wu)提供商 Algolia、社交媒體平(ping)臺 Reddit等多家企業已開始使用。

5、 模型(xing)小(xiao)型(xing)化(hua)成為提(ti)升(sheng)模型(xing)運行效率的關鍵

深度(du)學習模型效率提(ti)升成為應(ying)用落地的關(guan)鍵突破點(dian)。 目(mu)前,深度(du)(du)(du)學習模型(xing)的復雜度(du)(du)(du)會(hui)隨著模型(xing)精度(du)(du)(du)的提升而提升,步(bu)入通過大(da)幅增加(jia)計算(suan)量而獲取高精度(du)(du)(du)的時(shi)期(qi)。計算(suan)量的增長(chang)雖帶來(lai)性(xing)能(neng)的提升,但高度(du)(du)(du)復雜模型(xing)在硬件能力(li)受(shou)限的設備上部署運(yun)行(xing)難度越(yue)來(lai)越(yue)大(da),以AlphaGo 為例, 每(mei)場(chang)比賽僅電費耗(hao)費就高達 3000 美元, 模(mo)型運(yun)行(xing)性能與硬件能力的矛(mao)盾(dun)成為模(mo)型效率的關注重(zhong)點(dian)。

模(mo)型小型化成為提升模(mo)型運行效率的主要方向。 目(mu)前,知識蒸餾、剪枝、量化(hua)等(deng)模型(xing)小型(xing)化的(de)技術手段逐步成(cheng)熟,主流(liu)模型(xing)可達(da)幾十(shi)倍壓縮(suo)率。如亞馬遜利用知識蒸餾進行(xing)預(yu)訓練,從(cong) BERT 模(mo)(mo)型中提(ti)取(qu)壓(ya)縮模(mo)(mo)型 Bort,壓(ya)縮后模型大(da)小僅為 BERT-large 6%,推(tui)理(li)速(su)度提(ti)(ti)升七倍 ; 麻省理(li)工學院與上海交(jiao)大的研究人員提(ti)(ti)出LiteTransformer,結合量(liang)化和剪枝技術將(jiang) Transformer 模型(xing)壓縮 95%,加速在邊(bian)緣設備(bei)上部署自然語言處理(li)模(mo)型的應用進(jin)程。 與此(ci)同時, 開發框架中的模(mo)型壓縮功能(neng)(neng)創新活躍(yue), 模(mo)型壓縮已成為開發框架必不可少的關(guan)鍵能(neng)(neng)力,臉書、騰訊、谷歌等頭部人工智能企業以及英偉達、英特爾等芯片大廠加速構建完善模型壓縮能力,依托自身算法技術與硬件芯(xin)片優(you)勢(shi),在其主導的 TensorFlowPyTorchTensorRT 等開發框架中提供(gong)剪(jian)枝、量化等算法壓縮工具, 并針對 GPUCPU 等硬件芯片進行特定(ding)壓(ya)縮優化(hua)。

6、 深度學習應用加速推動智(zhi)能計算革命

深度學習(xi)應用(yong)加速(su)推動云端計(ji)算(suan)范(fan)式進入高性能計(ji)算(suan)時代。 深度(du)(du)學習訓(xun)(xun)練(lian)效果高(gao)度(du)(du)依(yi)賴計算資源和(he)數(shu)據質(zhi)量(liang),追求大規(gui)模高(gao)速處理能力。當(dang)前, 全球(qiu)最大規(gui)模的訓(xun)(xun)練(lian)模型所需算力每(mei)年增長(chang)幅度(du)(du)高(gao)達 10倍。谷歌曾預測,如所有用戶(hu)每天使用 3 分鐘語(yu)音搜(sou)索功能(neng),基于傳統 CPU 的數據中心算力(li)就必須提升一倍,對算力(li)需求快(kuai)速增長的預期也促使谷歌加速研發針對人工(gong)智能(neng)應用更(geng)有優勢的張量(liang)處理器。 隨著(zhu)深度學(xue)習模型(xing)結構日(ri)益復雜(za)以及訓練樣本規模持續擴(kuo)大,算力(li)需求與日(ri)俱增,對云側計算性(xing)能(neng)提出更(geng)高要(yao)求。

計算模式走向(xiang)云邊協同(tong),端側場景(jing)化算力(li)成爆(bao)發新方(fang)向(xiang)。 在去中心化的計(ji)算(suan)形態下,自動駕駛、工業智能、智慧城市等(deng)邊緣(yuan)(yuan)場(chang)景產生(sheng)出大量的算(suan)力(li)需(xu)求(qiu),邊緣(yuan)(yuan)智能設備(bei)需(xu)要通過芯片架(jia)構、編程(cheng)模型、專用加(jia)速庫以及軟件框架(jia)等(deng)多個環節與特定(ding)應用深度融合(he),實現(xian)邊緣(yuan)(yuan)計(ji)算(suan)平臺全棧能力(li)升級,以滿(man)足低功耗、 實時性(xing)、可靠(kao)性(xing)和安全性(xing)等(deng)復(fu)雜邊緣(yuan)(yuan)場(chang)景需(xu)求(qiu)。 預計(ji)未來(lai)三年, 面向工業電(dian)子、汽車電(dian)子和傳統消費(fei)電(dian)子應用等場景化智能計(ji)算(suan)芯(xin)片增長迅速,市(shi)場容量(liang)年(nian)復增長率高達 100%以上,成為(wei)推動(dong)智能芯(xin)片產業主(zhu)要驅動(dong)力(li)量。

三、 人工智(zhi)能(neng)產業(ye)發展趨(qu)勢

1、 從(cong)謀求單點技術的“極(ji)致”,向(xiang)場景化綜合(he)生態發展

單(dan)項技(ji)術的(de)“理論”準確率不再是(shi)智(zhi)能(neng)企(qi)業的(de)比拼重點,產業進(jin)入應(ying)用場(chang)景”跑馬(ma)圈地(di)”新階段。 人工智能(neng)企(qi)業(ye)(ye)單點(dian)技(ji)術(shu)標簽(qian)化(hua)的(de)特(te)點(dian)逐步弱化(hua),企(qi)業(ye)(ye)加速進入(ru)實(shi)質應用轉化(hua)階(jie)段,人工智能(neng)技(ji)術(shu)服務企(qi)業(ye)(ye)的(de)變化(hua)尤為凸(tu)顯。如曠視、商(shang)湯(tang)、科大訊飛等企(qi)業(ye)(ye)已(yi)將重心從視覺、語音(yin)等技(ji)術(shu)轉移至社會治理(li)、供應鏈物(wu)流(liu)、生活消費等領域的(de)軟硬(ying)件解決方案,從而催生出曠視天元、商(shang)湯(tang) SenseParrots 等開發框架和基礎技(ji)術(shu)服務平臺。

目前(qian),以物流、零售(shou)、公共安全等為代表的(de)先導應(ying)用領域“跑馬圈地”持續白熱化。曠視升級(ji)發布(bu)機(ji)器(qi)人倉(cang)儲(chu)物流軟件平臺“河圖 2.0”,并計劃投入(ru) 20 億元與合作伙伴(ban)搭(da)建完整(zheng)的(de)機器人行業(ye)解(jie)決方(fang)案;商湯(tang)持續推進城市級開放平臺方(fang)舟( SenseFoundry)在城市域(yu)落地,已覆蓋全國 31 個省市、近(jin) 100 座(zuo)城(cheng)市,總計接入(ru)攝像頭十(shi)萬路;云從推(tui)出(chu)云(yun)從(cong)起云(yun)智慧 Mall運營平臺(tai),聚焦新零售(shou)領域幫助(zhu)商業(ye)地產擁有者進(jin)行(xing)決策(ce),實(shi)現精細(xi)化運營。

場景化綜合(he)生(sheng)態模式開(kai)始清晰(xi),與“類”安(an)卓開(kai)發者(zhe)生(sheng)態共(gong)同(tong)驅(qu)動產業發展。

一方面, “類”安卓開(kai)發(fa)者(zhe)生態模式(shi)逐步(bu)成熟,頭部智(zhi)能企業延續移動(dong)互聯網(wang)典型發(fa)展模式(shi),以微服(fu)務形式(shi)提供視覺、語音等(deng)技術服(fu)務,憑借(jie)第(di)三方(fang)開(kai)發(fa)者(zhe)來(lai)構(gou)建(jian)多樣化的智(zhi)能應用, 大幅提升開發(fa)的易用(yong)性

另一方面(mian), 純粹基礎技術輸(shu)出(chu)難以完(wan)全(quan)滿足智能(neng)技術與各行(xing)業深(shen)度融合和(he)(he)應用落地,主要有三方面(mian)挑戰(zhan):一是需要與行(xing)業專有知識(shi)深(shen)度結合;二是場(chang)(chang)景碎片(pian)化(hua)特征突(tu)出(chu);三是使(shi)用標準數據(ju)集(ji)訓(xun)練的(de)圖(tu)像識(shi)別、對話系統在實際行(xing)業場(chang)(chang)景中泛化(hua)能(neng)力不足,需基于實際場(chang)(chang)景數據(ju)進(jin)行(xing)二次(ci)訓(xun)練和(he)(he)優化(hua)處理(li),這些均導致開發(fa)(fa)周期較(jiao)長和(he)(he)開發(fa)(fa)成本居高不下。

因此, 頭部智能企業(ye)認識到智能技(ji)術與傳統行業(ye)的深度融合應用(yong)需要構建新的發展模式。 一是加速打造提供模型選擇、訓練(lian)、部(bu)署監測等一體化的(de)研發(fa)平臺, 奠定智能技術滲透至各行業規(gui)模化應(ying)用(yong)的基礎(chu);二是面向(xiang)工業、農業、金融、公共安全等行業領域構建多樣化行業技術服務及解決(jue)方案平臺(tai), 將(jiang)行業(ye)(ye)特(te)有數據、專業(ye)(ye)知識、業(ye)(ye)務流(liu)程與智(zhi)能(neng)(neng)(neng)技(ji)術進行深度融(rong)合;發展速度較快的(de)公共安全、醫療、智(zhi)能(neng)(neng)(neng)駕駛等(deng)領(ling)域已初(chu)步形成垂直行業(ye)(ye)平臺,提供相對(dui)通用的(de)行業(ye)(ye)應用服務。在(zai)此基礎(chu)之上,智(zhi)能(neng)(neng)(neng)音箱、智(zhi)能(neng)(neng)(neng)錄(lu)音筆、安防無人機等(deng)垂直行業(ye)(ye)智(zhi)能(neng)(neng)(neng)產(chan)品不(bu)斷涌現, 場景化綜合生態正在(zai)形成。

2、 以科(ke)技巨(ju)頭引領的產業垂直整合速度不斷(duan)加快

在過去的一年(nian)中, 由于人(ren)工智能發(fa)展所需(xu)算力(li)、算法、數據等(deng)(deng)要素的(de)高位起點以及硬件(jian)、軟(ruan)件(jian)框架、平臺等(deng)(deng)核心環節間的(de)緊耦合(he)銜接特點,使(shi)得谷歌、微軟(ruan)等(deng)(deng)科技(ji)巨頭(tou)生(sheng)態系(xi)統的(de)垂(chui)直整(zheng)合(he)引(yin)領產業整(zheng)體發(fa)展;產業垂(chui)直一體化的(de)趨勢不斷加(jia)強,計算支撐、軟(ruan)件(jian)框架、研發(fa)平臺等(deng)(deng)核心環節基本被老牌科技(ji)巨頭(tou)所把(ba)持。

算力、軟件框架(jia)、研發平臺、技術服務的縱向一體化(hua)幾(ji)乎(hu)成為全球頭(tou)部科技企業的共識(shi)。 人工(gong)智能(neng)硬件、算(suan)(suan)法(fa)、 軟(ruan)件平臺與行(xing)業應用(yong)場景(jing)的(de)(de)(de)結合(he)緊密度(du)空(kong)前(qian),驅(qu)使不同環節具備點(dian)狀競爭力的(de)(de)(de)科(ke)技巨頭爭相探索行(xing)業實際應用(yong)需求。目(mu)前(qian),產業仍為早期發展階段,任何(he)一個環節的(de)(de)(de)水平化都(dou)尚(shang)未完全確立,過去以(yi)通用(yong)基(ji)礎能(neng)力自居的(de)(de)(de)芯片企業、云計算(suan)(suan)企業,抑或是(shi)具有技術獨到優勢(shi)的(de)(de)(de)互聯(lian)網企業都(dou)難以(yi)將自身的(de)(de)(de)優勢(shi)能(neng)力直接滲透至復雜(za)多變的(de)(de)(de)行(xing)業應用(yong)場景(jing)中來。

因此,科技(ji)巨(ju)頭加速從自身優勢能力出(chu)發,延(yan)伸至行業(ye)應用(yong)的多個中間環節(jie),試圖以這種方式準確(que)把握智能時(shi)代的需求(qiu)方向;在持續(xu)保持自身已有優(you)勢(shi)的(de)同時(shi)(shi),布(bu)局支撐行業(ye)應用(yong)的(de)多個核心(xin)環節,鞏固其生(sheng)態系統(tong)在人工(gong)智能(neng)時(shi)(shi)期(qi)的(de)領導地位(wei)。

亞馬遜、微軟等云服務企業不斷強化其智能服務能力, 緊抓面向基礎技術服務、研發訓練與推理等智能計算需求,通過布局研發平臺、開源開發框架等技術生產工具,以及更為底層的專用硬件及芯片,提升其(qi)智能計算(suan)服務的(de)競爭力;谷歌、百度(du)等 AI技術優(you)勢(shi)顯著(zhu)的互聯(lian)網(wang)頭(tou)部企業(ye)基(ji)于先進(jin)算法和技術優(you)勢(shi)布局開源(yuan)框架(jia),并以(yi)此為核心(xin)上下延伸,構建智能服務生態體系。以(yi)英偉(wei)達為代(dai)表的 AI 芯(xin)片巨頭加速提升面向智能(neng)任(ren)務的芯(xin)片性能(neng),積極豐富性能(neng)庫、編譯器、編程框架等(deng)軟件配套,通過多樣化方式壯大開(kai)發者社區(qu)及產業合作伙伴(ban)規模,力圖構建軟硬(ying)協同的產業生態體系。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

垂直一體化布局

3、 開發(fa)框架格(ge)局(ju)逐(zhu)步(bu)清晰,已從百(bai)花(hua)齊放向幾家分爭轉變(bian)

以(yi)谷歌(ge) TensorFlow、臉書 PyTorch 等為(wei)代表的(de)開源框(kuang)架格(ge)局初顯(xian)清晰,框(kuang)架格(ge)局已從百花齊放轉向幾(ji)家分爭。 目前,業界開(kai)源(yuan)開(kai)發框架(jia)主導權基本(ben)被 TensorFlow(谷歌)PyTorch(臉書)等掌(zhang)握;微軟CNTK、日本初創企業首選網(wang)絡(luo)( preferred networksChainer、 加(jia)拿大蒙特利爾大學主導的(de) Theano 等早期熱點框架已通過與(yu)主流框架合并或直接停止更新(xin)的方式退出歷史舞臺。

TensorFlow 依托工業界的部(bu)署優勢持續位于第一,市場關注度(du)達 15 超過第(di)二名3 倍以上,臉書的 PyTorch(合并 Caffe2)憑借其易用性迅速突起,在各大頂級學術會議論文(wen)中占比超過 50%,有(you)趕(gan)超勢頭。 同時,我國正在快速進行開源開發(fa)框架的系統化布(bu)局,百度飛槳、曠視 MegEngine、華為MindSpore、清華大學 Jittor 等國產框架加速升(sheng)級,其中,百度飛槳(jiang)作(zuo)為(wei)最早推出的開放框架之一,已(yi)初步應用(yong)于工業(ye)、農業(ye)、服務(wu)(wu)業(ye)等業(ye)務(wu)(wu)場景,服務(wu)(wu) 230 余萬開發(fa)者,整(zheng)體應用廣度和(he)深(shen)度正在不斷成熟和(he)完善。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

開源框架發展歷程

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

主要開源框(kuang)架活躍情(qing)況

端(duan)側推理框(kuang)架(jia)遇碎(sui)片化挑戰。 隨著(zhu)各行業終端(duan)智能化需(xu)求(qiu)加速增加,算法(fa)模型(xing)的終端(duan)推理(li)性能引起業內重視。目前,推理(li)框(kuang)架面臨碎(sui)片(pian)(pian)化挑戰,一方(fang)面,計算終端(duan)所使用的芯片(pian)(pian)類(lei)型(xing)多樣, CPUGPU 雖為主流架(jia)構,但(dan) NPUDSPFPGA 等多(duo)樣的人工智(zhi)能(neng)芯片也在不斷涌(yong)現(xian),終端推理(li)框架(jia)對底層硬(ying)件的適配難以統一;另(ling)一方面, 算法架(jia)構尚不穩(wen)定, 算子(卷(juan)積、激活函(han)數-ReLU 等) 及組(zu)合方式的(de)(de)多樣化(hua)和持續演(yan)化(hua)使得單一(yi)的(de)(de)推理框架短時(shi)間內(nei)難以覆蓋所有的(de)(de)可能性(xing), 推(tui)理框架(jia)顯現出各為其主(zhu)的發展(zhan)格局。

端側推(tui)理框(kuang)架處于(yu)多(duo)元(yuan)化發(fa)展(zhan)階段。 谷歌、臉書(shu)主導(dao)的頭(tou)部開(kai)源開(kai)發框(kuang)架加大訓練、推理(li)一(yi)體化(hua)的布局力度,但推理(li)部分在終端側(ce)市場占比不(bu)高。目前,業內涌現了一(yi)批(pi)各(ge)具(ju)特色的終端推理(li)框(kuang)架,如阿里提(ti)出(chu) MNN 框架(jia),集成(cheng)在手(shou)淘、優酷、飛(fei)豬(zhu)等 20 余終端應用中,實現互(hu)動營銷、實人(ren)認證(zheng)、試妝(zhuang)等功能;小米(mi)構建 Mace 框架,在小米(mi)手(shou)機(ji)(ji)中的(de)相(xiang)機(ji)(ji)場景識別、人像模式、人臉解鎖(suo)等諸多(duo)場景中進行(xing)應用。但由(you)于硬件(jian)芯片、軟件(jian)算法仍在快速發展, 推(tui)理框架預(yu)計將在很長一(yi)段時間(jian)難(nan)以統一(yi),或始(shi)終處于多(duo)元發展的(de)格局。

開源(yuan)開發框架競爭焦點從模型庫轉移至易用(yong)性和(he)硬件適配(pei)優(you)化。高級語(yu)言接口與硬件適(shi)配優化(hua)成(cheng)為開源框架構筑(zhu)壁壘的關鍵, 一方(fang)面,高級語(yu)言(yan)接口封裝后(hou)端框(kuang)架中關鍵(jian)的模型構建、訓練等功能(neng),降低研發門(men)檻。 目(mu)前(qian), 三大主流框架加(jia)速綁定或構(gou)建高(gao)級語言接口,已出現合作圈地現象(xiang)。TensorFlow keras 形成排他性合作,提升框架易用(yong)競爭力,與近期(qi)以(yi)易用(yong)性為優勢快速(su)提(ti)升地(di)位(wei)的(de) PyTorch 抗衡; MXNet Gluon 聯合,由亞馬遜與微(wei)軟共同維護(hu); PyTorch(臉書(shu))Torch Caffe2 作為后端框架(jia), 內部(bu)先天構筑(zhu)高級語言接(jie)口。

另一(yi)方面, 硬件(jian)適配(pei)(pei)優化試(shi)圖解決多樣硬件(jian)編譯工具導致的適配(pei)(pei)復雜和(he)性(xing)能參(can)差不齊問題(ti),統(tong)(tong)一編譯工(gong)具與編譯語言成(cheng)為(wei)主流開源(yuan)開發框架的布(bu)局重點。目前, 谷歌、臉書加速構建(jian)統(tong)(tong)一的編譯語言( IR), 試(shi)圖(tu)引導硬件廠商主(zhu)動適配,獲取框架適配的話語權。

4、 以(yi)研發和技術服務為(wei)核心,產業開始打造(zao)平臺化發展模式

平臺化(hua)發(fa)展速(su)度(du)不斷加(jia)快。 當前,人(ren)工智(zhi)能平臺發展步伐加快,2020 年上半(ban)年我國人工智(zhi)能研發平臺市場規模達 1.4 億美元,復合(he)增(zeng)長率超 30%12; 頭(tou)部智能技術(shu)服務平臺的(de)單日調用次(ci)數已過萬億次(ci),如阿里云 AI 服務的(de)日調用規模超(chao) 1 萬億(yi)次,日處(chu)理圖像 10 億張,百度大腦已對外開放了 270 多項(xiang) AI 能力,日調用量突(tu)破 1 萬億次。與此同時,人工智(zhi)能的(de)平臺生態規(gui)模(mo)不斷(duan)擴大,如訊飛開放(fang)平臺聚集超(chao)過175.6 萬開發者團隊,累計支(zhi)持(chi)超過 28.9 億終端;騰訊 AI 開放平臺已(yi)服務全球用(yong)戶(hu)數超 12 億,客(ke)戶數超 200 萬。

云服務廠商積(ji)極主導人工智(zhi)能研發平臺發展。 云(yun)服務廠商(shang)主導人工(gong)智能研發(fa)(fa)平(ping)(ping)臺(tai)的發(fa)(fa)展,亞馬遜、微軟、谷歌(ge)等擁(yong)有云(yun)計算業務的企業加速布局人工(gong)智能研發(fa)(fa)平(ping)(ping)臺(tai),其中(zhong),亞馬遜 SageMaker 平臺最為成熟,份額高于后兩者近兩倍,占據全球 TensorFlow 負載八成以上(shang);H2O.aiDataRobot 等(deng)研(yan)發(fa)平(ping)臺創新企業不斷出(chu)現,成為資本(ben)市場的追(zhui)捧(peng)對象,人工智能研(yan)發(fa)平(ping)臺的發(fa)展(zhan)空前繁榮。

技術工具鏈成為研發平臺的競(jing)爭核(he)心。 目前,研發平(ping)臺整體呈現(xian)三類(lei)發展(zhan)特(te)點(dian): 一是工(gong)具體系化, 打(da)造全(quan)面的技術工(gong)具鏈成為了這一(yi)時期研發平臺的競爭核心,技術工(gong)具鏈提(ti)供(gong)數據處理、模型構建(jian)、部署、監測分析等全(quan)生命周期的工(gong)具服務,如 SageMaker Autopilot、谷(gu)歌(ge) AutoML、微軟 MLOps 等; 二是開放框架(jia)開放化, 研發(fa)平(ping)臺(tai)基本均同時支持TensorFlowPyTorchMXNet 等多個(ge)主(zhu)流框架; 三是分布式計算不斷優化, 研發(fa)平(ping)臺圍繞人工智(zhi)能(neng)技術的(de)特點和開發(fa)框架對自身(shen)的(de)云計(ji)算(suan)架構進行深度優化,如(ru) SageMaker 256 GPU 下的TensorFlow 擴展效率可達(da) 90%,并(bing)同時支持多種類(lei)型人工智能芯片(pian)。

基(ji)礎(chu)(chu)技術服(fu)務平臺(tai)走(zou)向成(cheng)熟(shu),已形(xing)成(cheng)涵蓋多種基(ji)礎(chu)(chu)技術的綜合性平臺(tai)。 包含視覺(jue)、語(yu)音、自然語(yu)言處理等(deng)智能技(ji)術(shu)服務能力的基礎技(ji)術(shu)平(ping)臺是人工智能產業形(xing)成最(zui)早的平臺(tai)形(xing)態,產(chan)業(ye)主(zhu)體主(zhu)要(yao)包括谷歌、微軟、亞馬遜(xun)等(deng)擁有云計算(suan)業務(wu)的(de)廠商(shang)和(he)科(ke)大訊(xun)飛、曠視科(ke)技等(deng)人工智(zhi)能技術服務(wu)廠商,前者構建(jian)的(de)基礎技(ji)術(shu)服務平(ping)臺在布局初期即(ji)向(xiang)涵(han)蓋多(duo)種技(ji)術(shu)能力的(de)綜合性(xing)平(ping)臺發展(zhan)(zhan),后者早期主(zhu)要依(yi)托(tuo)自身某一類技(ji)術(shu)優勢(shi)開展(zhan)(zhan)平(ping)臺建(jian)設,如科大訊飛側重語音(yin)文本,曠視(shi)則側重視(shi)覺處(chu)理。

目(mu)前,業內的(de)基礎技術服務平臺(tai)形態基本成熟(shu),領先平臺(tai)基本同時(shi)包含多類技術能力(li)。究(jiu)其原因,一(yi)方面是由于基礎技術能力(li)的(de)構建不再(zai)神(shen)秘,一(yi)家技術廠商同時(shi)擁有視覺(jue)、文本等能力(li)的(de)難(nan)度大幅降低;另一(yi)方面則(ze)是行業應用場景常常需(xu)視覺(jue)、語音等多種技術共同支撐(cheng),單一(yi)類型的(de)技術服務平臺(tai)不再(zai)適合目(mu)前的(de)應用需(xu)求。

垂直(zhi)行業技術(shu)服(fu)務平臺發展處于早期(qi)階段, 尚未形成規(gui)模發展。除研發(fa)平臺(tai)顯(xian)著(zhu)降低技術(shu)(shu)與垂(chui)(chui)直(zhi)(zhi)行業融合成(cheng)本(ben)外,垂(chui)(chui)直(zhi)(zhi)行業技術(shu)(shu)服(fu)務平臺(tai)成(cheng)為(wei)另一(yi)種(zhong)重要平臺(tai)形態(tai);平臺(tai)把垂(chui)(chui)直(zhi)(zhi)行業中的(de)關(guan)鍵場景、相(xiang)對(dui)通用的(de)應用技術(shu)(shu)總結(jie)提煉,進而復制推廣。 目前,業內主流的(de)垂直行(xing)業技術(shu)平臺存在技術(shu)服務直接輸出和提供關鍵應用場景解決方案兩種服務形態,但均未(wei)形成(cheng)規模。

一方面, 技術服務直接(jie)(jie)輸出的形態(應(ying)用程(cheng)序接(jie)(jie)口)一般面向具(ju)有(you)成熟應(ying)用軟(ruan)(ruan)件(jian)環(huan)節的垂直行業,由平臺技術服務直接(jie)(jie)支撐下游軟(ruan)(ruan)件(jian)集(ji)成商(shang);此類垂直行業的應(ying)用軟(ruan)(ruan)件(jian)環(huan)節通常進入門檻(jian)較高,或(huo)者市場空間有(you)限,因(yin)此,人工智能技術企業缺乏(fa)與(yu)原有(you)產業鏈軟(ruan)(ruan)件(jian)集(ji)成商(shang)搶奪市場的動力(li)。

另一方面, 人(ren)工(gong)智(zhi)(zhi)能(neng)技(ji)(ji)術(shu)(shu)與垂直(zhi)行(xing)業(ye)應用的(de)融合對(dui)軟(ruan)件、智(zhi)(zhi)能(neng)技(ji)(ji)術(shu)(shu)、底層(ceng)硬件等(deng)多個環(huan)節均提(ti)出差(cha)異(yi)化需(xu)求,驅使面向關鍵行(xing)業(ye)的(de)多樣(yang)化全(quan)棧解決(jue)方案不(bu)斷涌現。垂直(zhi)行(xing)業(ye)技(ji)(ji)術(shu)(shu)服務平臺通過提(ti)供整(zheng)體方案的(de)選型和設計(ji),同(tong)時直(zhi)接提(ti)供智(zhi)(zhi)能(neng)技(ji)(ji)術(shu)(shu)、軟(ruan)件等(deng)方案中(zhong)的(de)某幾種能(neng)力,推動(dong)(dong)智(zhi)(zhi)能(neng)技(ji)(ji)術(shu)(shu)與垂直(zhi)行(xing)業(ye)場景的(de)快速融合,如自動(dong)(dong)駕駛領域的(de) Apollo 平臺(tai)提(ti)供雷達(da)、攝(she)像頭(tou)等硬件選型,高精(jing)度地圖、路線(xian)規劃等智能軟件為一體的解決方案。

5、 智能計算產業形態(tai)初顯,呈現蓬勃發(fa)展態(tai)勢

智能計算(suan)已初步(bu)形(xing)成智能芯(xin)片、軟硬協同(tong)、多樣化算(suan)力(li)供(gong)給模式的產(chan)業(ye)形(xing)態(tai)。 目前,人工智能(neng)芯片架構百花齊放(fang),云(yun)側雖仍以 GPU 為主(zhu),但端側涌(yong)現出面向(xiang)不同場(chang)景(jing)的(de)芯(xin)片架(jia)構,英偉達(da)、英特爾等芯(xin)片廠商面向(xiang)人工智能應(ying)用的(de)軟硬件工具生態日益完善,面向(xiang)深度學習(xi)的(de)大規模分布式計(ji)算平臺不斷成(cheng)熟,云智能服務(wu)、公共智能超算中心、自建數(shu)據(ju)中心等多種計(ji)算供給模式逐步形成(cheng)。

云(yun)側(ce)智能芯(xin)片市場仍以英偉達為主導,云(yun)服務提供商及初(chu)創企業正(zheng)在持續加大(da)布局力度。 傳統(tong)芯片廠商(shang)英偉達加(jia)速提升(sheng)其并(bing)行(xing)計(ji)算能力(li)的優(you)勢(shi)和多線程并(bing)行(xing)軟件開發生(sheng)態的壁壘(lei),2020 年推出 A100 芯片,晶體管數(shu)量達540億(yi), 自然語言處理模(mo)型BERT訓練性能較(jiao)上(shang)一代V100提升(sheng) 6 倍(bei)。谷歌、百度(du)等云服(fu)務提供商(shang)加(jia)速升(sheng)級基于(yu)各自(zi)工作(zuo)負載(zai)需(xu)求的智(zhi)能芯片,2020 年,谷(gu)歌(ge)發(fa)布(bu)第四代 TPU,平均性能是(shi)上一代的(de)2.7 倍;百度昆侖(lun) 1 量產,百度搜(sou)索引擎及云(yun)計算方面部署 2 萬片。

另外(wai), CerebrasGraphcore 等初創(chuang)公司布局新架構(gou)智(zhi)能(neng)芯片,部分應用的運行性能(neng)優于英偉達 GPU,但(dan)這類芯片(pian)僅能(neng)提供有限的軟件(jian)堆(dui)棧,面臨一定的市(shi)場推(tui)廣阻礙(ai)。

端側(ce)多元(yuan)化應用催生大量創新探索,傳統芯片企業(ye)和終端企業(ye)相(xiang)對(dui)領(ling)先。 汽(qi)車電子和嵌入式消費電子是這一時期端側智能芯(xin)片創新熱(re)點。 其(qi)中, 2020 年英(ying)偉(wei)達和(he)英(ying)特爾在汽車智能芯(xin)片方面(mian)持續位(wei)(wei)于領(ling)先位(wei)(wei)置,英(ying)偉(wei)達圍繞自動駕駛 SoC Orin 芯(xin)片,與理想汽車(che)、奔(ben)馳等多(duo)家車(che)廠展開合作;吉利概念車(che)則將搭載英特爾(er) EyeQ5 芯(xin)片(pian);恩智(zhi)浦、瑞薩(sa)和東芝等(deng)(deng)(deng)成(cheng)熟(shu)汽車電子供應商,黑芝麻(ma)、地平線機器人等(deng)(deng)(deng)初創企業(ye),以及(ji)特(te)斯拉等(deng)(deng)(deng)汽車制(zhi)造商積極研發自動(dong)駕駛汽車芯(xin)片(pian),試圖與英偉達和英特(te)爾雙巨頭(tou)爭奪市場份額(e)。相比之下,端側嵌入式(shi)消費電子類市場軟硬(ying)件成(cheng)本以及(ji)供應鏈準入門檻(jian)較低,大量初創企業(ye)以不同(tong)的細分賽道加入市場競爭,其中智能手機神經網絡加速芯片市場(chang)仍以高通等(deng)傳(chuan)統移動(dong)芯片企業(ye)和終(zhong)端品牌企業(ye)為(wei)主,眾多初創企(qi)業主(zhu)要(yao)集中在視(shi)覺和語音處理(li)領域,包括 NovuMindSyntiant 等(deng)。

圍繞智能計(ji)算芯片(pian)的軟(ruan)件工具開始從基礎計(ji)算向場景計(ji)算轉變。早期, 以(yi)英偉達為代表的(de)芯片企業不(bu)斷構建以(yi) CUDA 編程模(mo)型為核心的(de)高性能算子庫、通信算法、推理加速引擎(qing)等多(duo)層次基礎軟件工具生態。 當前,隨(sui)著智能技(ji)術在傳統行業中滲透的(de)不(bu)斷深(shen)入, 頭(tou)部(bu)智能芯片企業(ye)開(kai)始構建面(mian)向差異化場景(jing)的(de)軟硬一體(ti)平臺, 實現底層芯片、編(bian)程框(kuang)架、行業算法庫、細分場(chang)(chang)景(jing)研發平臺等全(quan)棧高效整(zheng)合,試圖(tu)培(pei)育多(duo)樣化行業場(chang)(chang)景(jing)的(de)計算生(sheng)態、搶(qiang)占細分市場(chang)(chang)。例如, 2020 年,英偉(wei)達圍繞機器人和自動駕駛場(chang)(chang)景(jing),打(da)造 Jarvis 對話系統、 ISAAC 機器人等(deng)軟(ruan)硬一體計算平(ping)臺,寶馬(ma)公司使(shi)用英偉(wei)達 ISSAC 機器(qi)人(ren)平臺、Jetson AGX Xavier 芯(xin)片(pian)平臺以及 EGX 邊緣計算機,開發包括導航、 操控等五款機器人,依托深度神經(jing)網絡實現感知環境、檢測物(wu)體(ti)、自動(dong)導航等功(gong)能以改進物(wu)流工作(zuo)流程。

多樣化算力供給模式開(kai)始(shi)顯(xian)現。 目(mu)前(qian),云(yun)(yun)、邊、端成為(wei)算(suan)力供給的主要(yao)形態(tai)。其中(zhong),云(yun)(yun)側算(suan)力主要(yao)以云(yun)(yun)智(zhi)能服務、公共智(zhi)能超算(suan)中(zhong)心和自建數據(ju)中(zhong)心三類供給模式為(wei)主,亞馬遜、阿里云(yun)(yun)等(deng)云(yun)(yun)計算(suan)企(qi)業(ye)以云(yun)(yun)智(zhi)能服務模式向中(zhong)小型企(qi)業(ye)及個(ge)人售賣 AI 算(suan)(suan)力(li)資源(yuan)和技(ji)術(shu)服務,是目前最為(wei)主流的(de)(de)供給(gei)模式(shi);公共智(zhi)能(neng)(neng)(neng)超算(suan)(suan)中(zhong)心逐步(bu)興起,上海、深圳、重慶等(deng)(deng)多(duo)地(di)開始(shi)投(tou)建(jian)公共智(zhi)能(neng)(neng)(neng)超算(suan)(suan)中(zhong)心,這類中(zhong)心目前主要以政府主導建(jian)設為(wei)主,支撐(cheng)本地(di)企(qi)(qi)業(ye)(ye)(ye)、科研(yan)機(ji)構和高校(xiao)的(de)(de)人(ren)(ren)工智(zhi)能(neng)(neng)(neng)技(ji)術(shu)與應用(yong)創新(xin),緩解地(di)方企(qi)(qi)業(ye)(ye)(ye)及機(ji)構算(suan)(suan)力(li)資源(yuan)不足、成(cheng)本較高等(deng)(deng)問題,推動區域人(ren)(ren)工智(zhi)能(neng)(neng)(neng)產業(ye)(ye)(ye)的(de)(de)發展;此外(wai),谷歌、臉書等(deng)(deng)頭(tou)部企(qi)(qi)業(ye)(ye)(ye)通過自建(jian)專(zhuan)(zhuan)(zhuan)有智(zhi)能(neng)(neng)(neng)計(ji)算(suan)(suan)集群的(de)(de)形式(shi)提升自身業(ye)(ye)(ye)務運行性(xing)能(neng)(neng)(neng),部分企(qi)(qi)業(ye)(ye)(ye)根據業(ye)(ye)(ye)務特點研(yan)發人(ren)(ren)工智(zhi)能(neng)(neng)(neng)專(zhuan)(zhuan)(zhuan)用(yong)芯(xin)(xin)片,試圖(tu)大幅(fu)度(du)降(jiang)低(di)算(suan)(suan)力(li)成(cheng)本。與此同時,邊(bian)緣(yuan)(yuan)與端(duan)側計(ji)算(suan)(suan)模式(shi)成(cheng)為(wei)熱點,英特爾、英偉(wei)達(da)等(deng)(deng)硬件(jian)芯(xin)(xin)片企(qi)(qi)業(ye)(ye)(ye)加大邊(bian)緣(yuan)(yuan)智(zhi)能(neng)(neng)(neng)專(zhuan)(zhuan)(zhuan)用(yong)加速產品的(de)(de)布(bu)局力(li)度(du),面向工業(ye)(ye)(ye)、交(jiao)通等(deng)(deng)云(yun)邊(bian)協同場景提供解決方案;寒武(wu)紀、地(di)平線、云(yun)知聲(sheng)等(deng)(deng)企(qi)(qi)業(ye)(ye)(ye)聚焦面向視覺、語音等(deng)(deng)智(zhi)能(neng)(neng)(neng)任務的(de)(de)端(duan)側芯(xin)(xin)片研(yan)發,在無人(ren)(ren)機(ji)、可穿戴(dai)設備、智(zhi)能(neng)(neng)(neng)攝像(xiang)頭(tou)等(deng)(deng)智(zhi)能(neng)(neng)(neng)終端(duan)中(zhong)已顯(xian)現規模化應用(yong)態勢。

6、 全球(qiu)數據鴻溝仍在加大,開放共享機制與數據服務能(neng)力加速構建

數(shu)據(ju)鴻溝問題愈加凸顯,開(kai)放共享仍在探索階段。 全球(qiu)數(shu)字化加(jia)速數(shu)據(ju)生成和(he)積累, 數據資產對全球經濟利(li)益(yi)的分配已開始產生(sheng)影響。“大規模數據→更準確模型→更好產品→更多用戶→更多數據”的循環邏輯將導致數據定向收攏聚集,人工智能數據資產已開始出現寡頭壟斷的態勢;互聯網產生的數據資產半數集中在僅 100 家左右的少數(shu)(shu)頭(tou)部企業中,影響全(quan)(quan)球(qiu)人工智能(neng)經濟利益的分配。據統計,人工智能(neng)產生(sheng)的經濟價值中約有(you) 70%會累(lei)積到中美兩個國家, 而若(ruo)推動數(shu)(shu)據資產的全(quan)(quan)球(qiu)化,大(da)多(duo)數(shu)(shu)國家有(you)望將 GDP 提(ti)升(sheng) 1%至 2.5%。

當前,各國政府(fu)、頭部企業持續推動數(shu)據(ju)的開放共(gong)享(xiang),數(shu)據(ju)原則、數(shu)據(ju)合作、數(shu)據(ju)規范與數(shu)據(ju)共(gong)享(xiang)平臺成為重點。 政府積極推(tui)動(dong)數據開放共享原則, 注重在保(bao)護隱私和公開(kai)(kai)透明原則下進行(xing)數據開(kai)(kai)放(fang)歐(ou)盟率先出(chu)臺《通用(yong)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)保(bao)護條例》對(dui)涉(she)及隱私(si)的敏感數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)做出(chu)嚴格要求;英(ying)國(guo)、法國(guo)、瑞典等(deng)國(guo)紛紛跟進修訂或新增;美國(guo)以原則倡議為主,政府(fu)先行數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)開(kai)放(fang),通用(yong)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)法案(an)仍在制定中。頭(tou)部科(ke)技企業(ye)(ye)出(chu)于商業(ye)(ye)利(li)益考(kao)量,對(dui)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)開(kai)放(fang)持謹慎態度(du);目前,微(wei)軟試圖打破這一局面,發起開(kai)放(fang)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)運動( Open Data Campaign),提出(chu)開(kai)放(fang)、可用(yong)、授權(quan)、安全、隱私(si)五大原則,鼓(gu)勵(li)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)互聯(lian)互通,承諾圍(wei)繞健康、環境(jing)和(he)各種社會公益項目等(deng)問題共享(xiang)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju),但尚未開(kai)放(fang)其產生利(li)潤專(zhuan)有數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)(ju)集。

跨領(ling)域數據合(he)作也成(cheng)為這一時期的熱點其(qi)中(zhong)垂直(zhi)行業(ye)企業(ye)最為積極(ji),數據合(he)作已從(cong)點狀互惠向有(you)組織的開放共享(xiang)方向發展。 微(wei)軟、Adobe 和 SAP 聯(lian)手構建數(shu)據(ju)(ju)共享聯(lian)盟(meng),通過通用數(shu)據(ju)(ju)模型將數(shu)據(ju)(ju)存(cun)儲在統(tong)一(yi)的數(shu)據(ju)(ju)湖中實現(xian)共享,吸引安永、 飛思創( Finastra)等多行業企(qi)業共同(tong)加入。同(tong)時, 數(shu)據規(gui)范(fan)與開放協(xie)議(yi)尤為(wei)重要國家(jia)標準化組織密切關注(zhu)數(shu)據(ju)隱私(si)問(wen)題,企(qi)(qi)業(ye)(ye)也(ye)在(zai)自發(fa)建立數(shu)據(ju)開放(fang)協議或(huo)規范,如 IEEE P7002 數(shu)據(ju)隱私(si)處(chu)理標準、 ISO 27701 隱私(si)信息管(guan)理體(ti)系、微(wei)軟(ruan) AI 模型數(shu)據(ju)使用協議( DUA-OAI) 等。此外,谷(gu)歌、微(wei)軟(ruan)等科技頭(tou)部企(qi)(qi)業(ye)(ye)推(tui)出 Dataset search、 Research Open Data 等自動(dong)化數(shu)據(ju)搜索平臺,進一步降低數(shu)據(ju)獲取難度,打造更(geng)加開發(fa)便捷(jie)的數(shu)據(ju)生態(tai)。

數(shu)據集建設需求更為專業。 監督學習仍(reng)是產業(ye)界人工(gong)智能算法訓練(lian)的(de)(de)主(zhu)要方式(shi),因(yin)此大規模、高(gao)質量的(de)(de)人(ren)工標(biao)注(zhu)數據(ju)集是產業(ye)發展剛需。目前(qian),數據(ju)標(biao)注(zhu)從簡單、重復的(de)(de)拉框標(biao)注(zhu)向(xiang)精細化方向(xiang)發展,呈(cheng)現三(san)類(lei)發展特(te)點: 一是數據標注流程趨(qu)于智能化, 通過(guo)預標(biao)注(zhu)技(ji)術和半自(zi)動化(hua)校驗的(de)方(fang)式輔(fu)助人工(gong)標(biao)注(zhu)已成(cheng)為當前(qian)發展重點,業內涌(yong)現出一(yi)批標(biao)注(zhu)工(gong)具,可對未標(biao)記圖像(xiang)直接生成(cheng)分割輪(lun)廓,并借助人工(gong)進行微調; 二(er)是標注數(shu)據質(zhi)量(liang)要求不斷提升, 自動駕駛、工業制造等智能任務場景(jing)愈之復雜,高質量、精(jing)細化的標注數據直接影響算法魯棒性和(he)準確性,標注準確率需求從 90%提(ti)升至(zhi) 99%; 三是醫療、工業等差異化垂(chui)直應用驅動(dong)數據(ju)標(biao)注服(fu)務(wu)進一步貼合個性化、多元化的場景需求, 如(ru)數據服(fu)務企業 Scale AI 為自(zi)動駕駛場景提(ti)供標(biao)注服(fu)務,對車道、煙塵、尾氣、雨(yu)水(shui)等更(geng)為個性化的目標(biao)物(wu)體(ti)進行(xing)標(biao)注。

具有(you)智能標注能力的(de)數(shu)據服務企(qi)業受到資(zi)本熱(re)捧。 以數(shu)據(ju)標注為代(dai)表的(de)基礎數(shu)據(ju)服務市(shi)場(chang)規模快(kuai)速增(zeng)長,資本市(shi)場(chang)進一步(bu)推高專業(ye)數(shu)據(ju)標注企業(ye)的(de)估值。 2020 年,專業(ye)數(shu)據(ju)標注企業(ye) Labelbox 完成 2500萬(wan)美(mei)元 B 輪(lun)融資;龍貓數(shu)據(ju)獲得(de) 3300 萬(wan)元 Pre-B 輪(lun)融資。目前, 數據(ju)(ju)的(de)智(zhi)能化標注能力成為(wei)這(zhe)一時期數據(ju)(ju)服(fu)務企業的(de)發展重點; 一方面,傳統數(shu)(shu)(shu)據眾包(bao)平臺企業(ye)向專業(ye)數(shu)(shu)(shu)據標注企業(ye)發展(zhan),快(kuai)速布局智(zhi)(zhi)能(neng)標注工具,數(shu)(shu)(shu)據服(fu)務(wu)企業(ye)澳鵬( APPEN) 花費(fei) 3 億美元收(shou)購數(shu)(shu)(shu)據標注公司 Figure Eight, 大幅提升企業(ye)數(shu)(shu)(shu)據服(fu)務(wu)競爭力;另一方面,智(zhi)(zhi)能(neng)標注工具企業(ye)不斷涌現(xian),如 Scale AI、 Supervisely、馬達智(zhi)(zhi)數(shu)(shu)(shu)等。

7、 以開(kai)源(yuan)開(kai)發(fa)框架為核(he)心(xin)的生態(tai)體系(xi)雛形(xing)漸顯, 多種小(xiao)生態(tai)同步形(xing)成

當(dang)前,全球人工智(zhi)能產業生態雛形(xing)漸顯。 從產業鏈全局角度看,開源開發框架既是最具技術含金量的環節,同時也是芯片、應用開發等多個主體集聚的環節,伴隨時間積累,將具有很強的不可替代性和制約(yue)性。目(mu)前(qian),谷歌、臉書等人工智能頭部企業圍繞開源(yuan)開發(fa)框架構建的核心生態已初步形成。從產(chan)業(ye)主(zhu)體角(jiao)度看, 人工智(zhi)能產(chan)業(ye)既對信息(xi)產(chan)業(ye)自(zi)身的產(chan)品形態、運(yun)行模式(shi)產(chan)生(sheng)很大變革,同時影(ying)響傳(chuan)統行業(ye)生(sheng)產(chan)運(yun)營方式(shi)和運(yun)行效率(lv)。因此,產(chan)業(ye)的參(can)與主(zhu)體幾乎涵蓋(gai)全信息(xi)產(chan)業(ye)以及傳(chuan)統行業(ye)企業(ye),云計算、芯片、 ICT 設備、互聯網(wang)、智能技術服務(wu)、垂直行業 AI 企業和傳統行業企業等多主體正在圍繞自(zi)身優勢不斷摸(mo)索產業生態模式

人工智能頭部企業構(gou)建(jian)開(kai)源開(kai)發(fa)框架生態, 試圖形成應用接口和硬件適配的雙向(xiang)主導權(quan)。

一(yi)方(fang)面, TensorFlowPyTorch 等開發框架(jia)不斷完善其高級(ji)語(yu)言(yan)接(jie)(jie)(jie)口,推動業內(nei)大量的算法(fa)模(mo)型和(he)智能(neng)應用基于(yu)其高級(ji)語(yu)言(yan)接(jie)(jie)(jie)口進行研發,形成(cheng)深(shen)度的綁定。由于(yu)轉(zhuan)換(huan)至其他(ta)框架(jia)會一(yi)定程度上影響模(mo)型性能(neng)、增加二(er)次(ci)研發成(cheng)本,長此以(yi)往,大量應用將(jiang)深(shen)度依賴原有開發框架(jia)進行訓練和(he)推理,形成(cheng)產業默認的事實(shi)接(jie)(jie)(jie)口標準(zhun)。

另一(yi)(yi)方面(mian), 框架(jia)市場份額領先(xian)的(de)人工智能(neng)頭部企業正在(zai)依托框架(jia)與智能(neng)芯片適配構建標準化硬件接口, 有望進一(yi)(yi)步增強其對智能(neng)芯片的(de)話語權。如(ru), 谷歌(ge)通過構建統一(yi)(yi)編譯(yi)中間表示(shi)語言( IR,驅動硬件廠商主動適(shi)配其 TensorFlow 框架,從智(zhi)能(neng)芯片主(zhu)導適配(pei)向統一中間表示語言( IR) 主導適配(pei)轉(zhuan)變。目前,由于智能(neng)芯片的(de)技術路線(xian)百花齊放(fang),仍在摸索階段,因此(ci)框架(jia)適配(pei)生態仍在構建初期,尚未形(xing)成。

產業主體以自(zi)身優勢切入,初步形(xing)成四(si)種小生態模式。

一是人工智能全面融入云服務(wu)體系,云服務(wu)廠商積(ji)極構建 AI 基礎設施(shi)生態。亞馬遜(xun)、微軟、谷(gu)歌為代(dai)表的廠(chang)商布局人工智能(neng)專用(yong)硬件、開源開發工具、研發平臺、技術服務、 行業使能(neng)方案等(deng)全(quan)棧 AI 技術支撐體系,如, 2020 年微軟在研發平臺、技術服務等方面持續深耕基礎上,向下在硬件基(ji)礎(chu)設施方面(mian)聯合 Open AI 建立智能超算中(zhong)心(xin), 向上(shang)在垂直行業布局方(fang)面推出行業云解(jie)決方(fang)案(an) Microsoft Cloud for Healthcare,與智(zhi)慧醫療(liao)(liao)、醫療(liao)(liao)機構(gou)合作,幫助醫生和醫療(liao)(liao)機構(gou)使用AI 技術實現精(jing)準醫療(liao)服務。

二是人工(gong)智(zhi)能技(ji)術(shu)服務(wu)企業(ye)、互聯(lian)網企業(ye)以視覺(jue)、語音(yin)等技(ji)術(shu)優勢切入,加(jia)速打造(zao)垂(chui)直行業(ye)技(ji)術(shu)服務(wu)平臺(tai)和解決(jue)方(fang)案生態。

當前,該(gai)類主體(ti)正在加速推動(dong)智能(neng)技(ji)術在各行業(ye)中的應(ying)用落(luo)地,在不斷完善開發框(kuang)架(jia)、基礎技(ji)術服務平(ping)臺的同(tong)時,聚焦(jiao)構建面(mian)向行業(ye)場景(jing)的平(ping)臺生(sheng)態,涌現出一批如依圖(tu) care.ai(醫療)、百度 Apollo 開(kai)放平臺( 自動駕(jia)駛(shi))等(deng)行業(ye)平臺。

三是傳統企業以行業經驗(yan)切入,強調解決問題的實際應(ying)用能力(li),積(ji)極構建(jian)圍繞基(ji)礎科研、成(cheng)果轉化、 產業培育(yu)多維(wei)度的創新生態。 傳(chuan)統(tong)行業(ye)(ye)頭部企業(ye)(ye)針對顛覆性、前沿性技術展(zhan)開系(xi)統(tong)布局,鞏固行業(ye)(ye)領(ling)先地位(wei)和優(you)勢;如大眾奧(ao)迪聚焦自動駕駛(shi)場景,建立(li)奧(ao)迪 JKU 深度學習(xi)中心(xin),成立硅谷研(yan)發辦公室,加大(da)力度研(yan)發先進駕駛(shi)員輔助系統(tong),同時發布自動駕駛(shi)數據集(ji)推(tui)動商用和學術研(yan)究, 打造多維度產(chan)業生態。

四是硬件(jian)廠(chang)商以芯片設計、整(zheng)機集成(cheng)為切(qie)入(ru)點,加速(su)構建軟硬協同產業生(sheng)態。 英(ying)偉達、英(ying)特(te)爾、華為、浪潮(chao)等芯(xin)片(pian)、設(she)備廠商圍繞其芯(xin)片(pian)和計算(suan)設(she)備積極豐富性能庫(ku)、編譯(yi)器、編程框架、編程工具等配(pei)套軟(ruan)件,通過多樣化方式(shi)壯大開發(fa)者社區(qu)及產業(ye)合作伙伴規(gui)模,力圖構建(jian)軟(ruan)硬協同的產業(ye)生態體系。

四、 我國(guo)人工(gong)智能發展重點與機(ji)遇

1、 十(shi)三(san)五期間我國(guo)總體發展(zhan)情況(kuang)

發展(zhan)(zhan)(zhan)人(ren)工智(zhi)能是(shi)(shi)黨中央、國(guo)(guo)務院準確把握新一(yi)輪(lun)科技(ji)革命(ming)和(he)產(chan)業變革發展(zhan)(zhan)(zhan)大(da)勢,是(shi)(shi)為搶抓(zhua)人(ren)工智(zhi)能發展(zhan)(zhan)(zhan)的重大(da)戰略機遇,構筑(zhu)我(wo)國(guo)(guo)人(ren)工智(zhi)能發展(zhan)(zhan)(zhan)的先發優勢,加快建設(she)創新型國(guo)(guo)家和(he)世界科技(ji)強國(guo)(guo),所做出的重大(da)戰略決(jue)策部署(shu)。十三五以來,我(wo)國(guo)(guo)人(ren)工智(zhi)能產(chan)業發展(zhan)(zhan)(zhan)迅猛,政策環境持續優化,創新能力不斷提(ti)升,產(chan)業規模(mo)進一(yi)步壯大(da),融合應用逐步深入,特別(bie)是(shi)(shi)新冠(guan)疫(yi)情(qing)防(fang)控(kong)期(qi)間, 人(ren)工智(zhi)能技(ji)術產(chan)品形成“智(zhi)能抗疫(yi)軍團”,有力支撐(cheng)了我(wo)國(guo)(guo)疫(yi)情(qing)防(fang)控(kong)和(he)復(fu)工復(fu)產(chan)。

1)、人工智能政策環境持續優化。 我國人工智能發展進入快車道,自 2015 7 月國務院出臺的《關于積極推進“互聯網+”行動的指導意見》首次將人工智能納入重點任務之一,至 2017 7 月國務院印發《新一代人工智能發展規劃》將其上升至國家戰略,人工智能發展政策環境不斷完善。截至 2020年,黨中央、國務院及各部門出臺人工智能相關政策 10 余項,連續4 年將人工智能寫入政府工作報告,如工信部、教育部相繼出臺《促進新一代人工智能產業發展三年行動計劃( 2018-2020 年)》、《高等學校人工智能創新行動計劃》等多項政策文件,為我國人工智能發展營造了良好的發展環境,各地方超過 20 個省市自治區相繼出臺人工智能專項規劃 60 余項。

2)、 人工智能技術創新能力持續提升。 我國企業在應用算法、專用芯片、開源開放平臺、智能傳感等核心關鍵技術上已取得局部突破,其中寒武紀、地平線、思必馳等神經網絡芯片實現量產并在安防、汽車、語音領域實現規模化應用;百度、阿里、華為、騰訊、曠視、科大訊飛、第四范式、京東等一批AI 開放平臺初步具備支撐產業快速發展的能力,其中百度 AI 開放平臺已超 260 萬開發者。部分關鍵應用技術居世界先進水平,特別是視頻圖像識別、語音識別等技術全球相對領先。人工智能論文總量、高倍引用的論文數量和發明專利授權量,處在第一梯隊。

3)、 人工智能產業規模不斷發展壯大。 產業生態基本形成,產業整體實力顯著增強。截至 2020 年,我國人工智能產業規模、核心企業數量,包括獨角獸企業數量均僅次于美國,位居全球第二位,覆蓋技術平臺、產品應用等多環節,基本建立了比較完備的產業鏈。人工智能芯片、智能語音、計算機視覺等創新產品不斷涌現,醫療影像、智能語音、智能翻譯、自動駕駛等產品已達國際先進水平,智能安防、 消費無人機等領域具備全球競爭優勢。人工智能產業初步形成京津冀、長三角、粵港澳、成渝等地區集聚發展、協同推進格局。

4)、 人工智能行業融合應用不斷深入。 我國人工智能產業發展不斷深入,與一、二、三產業融合成效初顯,正在從部分先導領域如醫療、交通、教育等服務領域向制造業、農業等產業領域拓展;智能金融、智能醫療、智能安防、智能交通等領域已經成為企業加速人工智能技術產業化落地的熱點應用場景,智能化新產品、新業態、新模式不斷涌現。新冠疫情防控期間,人工智能技術加速在醫療、應急、教育、制造等領域普及應用,一批人工智能 CT 影像輔助診斷設備、智能測溫+識別系統、智能機器人等抗疫產品,形成“智能抗疫軍團”,支撐疫情防控和復工復產成效顯著。

5)、 積極探索人工智能倫理和治理實踐。 我國政府高度重視人工智能倫理道德問題,積極構建有利于人工智能健康有序發展的體制機制。為進一步加強人工智能相關法律、倫理、標準和社會問題研究,新一代人工智能發展規劃推進辦公室成立新一代人工智能治理專業委員會, 2019 6 月發布《新一代人工智能治理原則——發展負責任的人工智能》,提出人工智能治理框架和行動指南,強調和諧友好、公平公正、包容共享等八條原則。

與此同時, 2019 年全國人大常委會已將一些與人工智能密切相關的立法項目列入立法規劃, 例如數字安全法、個人信息保護法和修改科學技術進步法等。在工業和信息化部等相關部委指導下,中國人工智能產業發展聯盟(簡稱: AIIA)發布了《人工智能行業自律公約》,引導企業加強人工智能倫理自律探索。 各地地方積極探索人工智能治理實踐,在制定人工智能相關政策中,支持人工智能倫理治理、法律法規等相關研究探索,《人工智能北京共識》、 《人工智能創新治理上海宣言》、《世界人工智能法治藍皮書》等成果相繼發布。當前,產業界和學術界協同推進,騰訊、百度、曠視等企業紛紛踐行人工智能倫理原則,設立管理機構;全國多個高校、研究機構等開展人工智能倫理治理、法律法規等方面的研究,如 2020 6 月,清華大學成立了人工智能國際治理研究院。

2、 十四五期間我國(guo)發展(zhan)方向(xiang)與(yu)機遇

1)、 加快 AI 基礎原創技術的創新突破,打造融合創新生態系統。 我國人工智能技術創新處于前所未有的活躍期。 當前,我國專利(li)申(shen)(shen)請的活(huo)躍度與論文產出規模(mo)已位于全球前列,專利(li)申(shen)(shen)請總量達 30.1萬件,占(zhan)全(quan)球總量(liang)的 39%,是美國的(de)兩(liang)倍以上; 近 10 年(nian)論文產出總量超(chao)過 18 萬篇(pian), 2019 年論(lun)文規模是美國(guo)的近 1.5 倍。同時,我國視覺、語(yu)音等(deng)智(zhi)能任(ren)務全球比賽的(de)參(can)與度和入榜率極(ji)高,多次在對(dui)話式問答、閱讀理解、 人臉識(shi)別等(deng)全球比賽中刷新智(zhi)能任(ren)務的(de) SOTA13模(mo)型準確(que)率(lv)。 我(wo)國發起(qi)的全球性比賽規模(mo)不斷擴大(da), iFLYTEK A.I.開(kai)發者大賽 2020 年(nian)參與團隊達 9000 余支,騰(teng)訊廣告(gao)算法大賽(sai)參與人次達(da)萬余名。

2)、 將人(ren)工(gong)智能(neng)技術體系(xi)中的基礎理論、 原(yuan)創及優化技術和共性應(ying)用技術, 依(yi)據創新(xin)程度和突破難度從高至低(di)劃分為顛覆、階躍、創新優化和工程實現等四個發展層級。目前(qian), 我國在創新優化和工程實現技(ji)(ji)術(shu)方面(mian)有一定優勢,但(dan)顛覆(fu)型(xing)、階躍型(xing)技(ji)(ji)術(shu)仍(reng)非常缺乏引領作用。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

技術體(ti)系按創新程度(du)(du)和突破難度(du)(du)分級

我國基(ji)礎(chu)理(li)論(lun)、原創模型(xing)等顛覆型(xing)、階躍(yue)型(xing)技術(shu)仍缺乏引領能(neng)力。反向傳播、人工神經網絡等深度學習基礎理論,以及知識工程、計算神經科學等其他分支的基礎理論基本由他國引領,相關的統計學、認知科學等底層近現代學科早期創始人、重大貢獻者鮮有我國學者身影。在本次浪潮之中,我國雖已涌現一批具有全球影響力的學者,在圖像識別、機器翻譯等領域不斷發聲;但深度學習理論體系、新型學習方式等顛覆技術主導權幾乎被全球幾位巨頭掌握; 卷積神經網絡、循環神經網絡、生成對抗網絡等階躍型算法技術多數在原始創造團隊
各分支中產生
,延(yan)續性(xing)較強; 人工智能顛(dian)覆、階(jie)躍技術的發(fa)展幾乎是寡(gua)頭壟斷的格局。

仔細分(fen)析(xi)全(quan)球(qiu)人工智能前沿技術的(de)發(fa)展, Yoshua BengioGeoffrey Hinton 等巨頭在 AAAIICLR 等全球(qiu)人工智(zhi)能會議上的(de)觀點常引起(qi)全球(qiu)學(xue)者追(zhui)隨,引領(ling)新熱點方向發展。如, 2020年(nian) Yann LeCunGeoffrey Hinton 等學者(zhe)提出自監(jian)督(du)學習是走向通(tong)用智能(neng)的路徑之(zhi)一,引發自監(jian)督(du)學習熱潮, CPVR 2020ICLR 2020 會議收錄的自監督學習論文數量較去年增長近一倍,計算機專業權威論文檢索平臺 dblp 2020 年(nian)收錄(lu)的相關論文(wen)數量接近歷年(nian)總(zong)和。

目前,我國(guo)已開始加強(qiang)對人工智能基礎(chu)(chu)理(li)論(lun),甚至更底層基礎(chu)(chu)學科的建設(she)發(fa)展,且(qie)取(qu)得(de)一定成果,如(ru),北京大學在(zai)隨機梯度(du)下降法中(zhong)的噪聲作用研究(jiu)中(zhong)取(qu)得(de)進展,從理(li)論(lun)上解釋(shi)了噪聲的正則(ze)化原理(li);南京大學提出(chu)不依賴反向傳播的深(shen)度(du)學習(xi)模(mo)型深(shen)度(du)森林( Deep Forest),探(tan)索神經網絡之外(wai)的深度學習發展路徑(jing); 但總體來看,我國距(ju)離引領顛覆型、階躍型技術仍差距(ju)較大。

我國視(shi)覺、語音(yin)等基礎(chu)智(zhi)能(neng)(neng)任務(wu)的(de)工程實(shi)現水平全(quan)球領先,算法模型的(de)二次創新(xin)優化(hua)能(neng)(neng)力也非常突出。 我國人工智能(neng)算(suan)法技術(shu)的(de)發展著重于(yu)對業(ye)內主流算(suan)法模型的(de)吸收改造與產(chan)業(ye)化應(ying)用,一方面, 我(wo)國(guo)擁有一(yi)批追求算法技術(shu)極致優化(hua)的人(ren)工(gong)智能企業,如曠視研發的ShuffleNet 模型具有輕量級 CNN 模(mo)型(xing)結構, 在計算復雜度(du)相(xiang)同情況(kuang)下(xia),相(xiang)比其他模(mo)型(xing)可(ke)編碼更多信息, 人(ren)臉解(jie)鎖時間(jian)小于(yu) 0.1 秒。 百度(du)推出的 ERNIE 模型是基于(yu) Bert 的預訓(xun)練思想,支持(chi)詞匯(hui)、語(yu)法、語(yu)義三個層次的預訓(xun)練任務(wu),可獲得更(geng)多的潛在(zai)語(yu)義信息,在(zai)中文任務(wu)上已超越原 Bert 模型(xing)水平(ping)。

另(ling)一方(fang)面, 我國(guo)在視覺、語音、自然語言處理等多(duo)類基礎任務的全球比賽(sai)中位列前位已成常態。 人(ren)工智能(neng)領域的比賽加速升級,從粗(cu)粒度圖(tu)像識(shi)別(bie)、目(mu)標檢測、段(duan)落語義理解(jie)等較為(wei)簡單的任務(wu)向人(ren)體(ti)關鍵(jian)點識(shi)別(bie)、推理理解(jie)等復雜任務(wu)轉變。

目(mu)前,我國企業在多個(ge)全(quan)球權威比賽中成績顯著,不(bu)斷挑戰更為復雜(za)的任務(wu)。商湯、曠(kuang)視、依圖(tu)、騰訊等企業在細(xi)粒(li)度圖(tu)像識(shi)別(bie)、自動駕駛場景定位(wei)及追(zhui)蹤(zong)、行人重識(shi)別(bie)( ReID)、 人體(ti)視頻解析等(deng)復(fu)雜(za)任(ren)務上位列(lie)各類(lei)比賽榜(bang)單首位,哈工大訊飛聯(lian)合實驗室(shi)在(zai)推(tui)理閱讀理解評測(ce)任(ren)務( HotpotQA)全維(wei)基賽道中獲得(de)第一,百度提出面(mian)向端到端問答的檢(jian)索模(mo)型 RocketQA 刷新微軟 MS MARCO( 微軟機器閱讀理解) 段落排序任務(wu)的榜單。

在上述(shu)背景下,我國人工智能技(ji)術的(de)發展亟需圍繞三(san)個方向(xiang)進行布局:

一是進一步構建(jian)人(ren)工(gong)智能基礎理論(lun)與應用技術相(xiang)結合的學科(ke)體(ti)系。 當前我國(guo)多(duo)個高校已(yi)著手(shou)布(bu)局人工(gong)(gong)智能(neng)學科建設,多(duo)以“人工(gong)(gong)智能(neng)+”為(wei)主線(xian),著重應用學科(ke)的(de)發展。然而(er),相較于應用技術,人工智能的(de)基礎(chu)理論是我(wo)國下一時期提升人工智(zhi)能顛覆性創新話語權(quan)的(de)(de)關鍵,但(dan)其學(xue)(xue)(xue)術周期更長,取得成(cheng)效更緩,難以一蹴而就,需要(yao)完(wan)備的(de)(de)綜合型學(xue)(xue)(xue)科體系作(zuo)為支撐(cheng)。因此(ci),基(ji)礎理論與(yu)應用并重的(de)(de)學(xue)(xue)(xue)科體系建設成(cheng)為“顛(dian)覆型技術”取得突破的(de)(de)關鍵。

二是(shi)重(zhong)點布局(ju)一批企業級人工智能研(yan)究院(yuan)。 全球(qiu)人(ren)工智能(neng)技術(shu)研究在(zai)(zai)產、 學兩界(jie)的(de)(de)分界(jie)線愈加模糊,由高校和(he)(he)企業合作(zuo)完成的(de)(de)創新優化型和(he)(he)階躍型技術(shu)突(tu)破(po)不斷增多,企業級(ji)人(ren)工智能(neng)研究院的(de)(de)重要性正在(zai)(zai)逐步顯現。從(cong)全球(qiu)來看, 高(gao)校教授成為企業和高(gao)校間的(de)特殊(shu)紐帶如, “深度學習之父”Hinton 在(zai)多(duo)倫多(duo)大(da)學擔任(ren)教授(shou),同時受聘為谷(gu)歌大(da)腦人(ren)工智(zhi)能(neng)團隊首席科學家;紐約大(da)學終身教授(shou) Yann LeCun,同時擔任臉書人工智(zhi)能研究(jiu)室(FAIR)主任。

縱觀我國人(ren)(ren)工智能人(ren)(ren)才培(pei)育(yu)的歷史, 企(qi)業級(ji)研究院(yuan)對(dui)于我國(guo)早期人工智能人才的培(pei)育貢獻顯著, 微軟等頭部(bu)科技企(qi)業的(de)企(qi)業級研(yan)究院(yuan)培養一(yi)批諸(zhu)如孫(sun)劍(jian)、楊(yang)帆、曹旭東等領(ling)軍(jun)人才, 在離開(kai)研(yan)究院(yuan)后分別創立或加入我國曠(kuang)視、商湯、Momenta 等人工(gong)智(zhi)能(neng)創(chuang)新(xin)企業,帶(dai)動(dong)我國早期人工(gong)智(zhi)能(neng)技術產業的發展。 這種具有前瞻性的(de)企業級研究(jiu)院對中短期能夠應用(yong)落地的(de)創(chuang)新優(you)化型、階躍型技術(shu)具有重(zhong)要引領作用(yong)

三(san)是(shi)打(da)造區域人工智(zhi)能(neng)技術融合創新生態系統(tong)。 建立(li)以政府主(zhu)導區域技術融合創(chuang)(chuang)新(xin)系統, 將鏈狀創(chuang)(chuang)新(xin)鏈基礎研究-應用研究-試驗開發升級為連通企(qi)業、高(gao)校、研究院所、政府等創新主(zhu)(zhu)體(ti)的共同體(ti)生態(tai);圍繞區(qu)域特(te)色優(you)勢,在生態(tai)之上建立針對不同細分領域的技(ji)術專攻實(shi)驗室,有機整合各類(lei)要素、多(duo)元主(zhu)(zhu)體(ti)、異質(zhi)產(chan)業群等,形成區(qu)域技(ji)術創新生態(tai)系統。

當前(qian),全球已有部分國家率先開(kai)展(zhan)該類載體建(jian)設, 荷蘭人(ren)工智能創新機構( ICAI), 已聯合(he) 43 家合作伙(huo)伴建立16 家基礎研(yan)究(jiu)、行(xing)業應(ying)用等類(lei)型的高(gao)校企業實驗室,聯合(he)多方(fang)進行(xing)技術成果的轉化落地;美國計劃(hua)在未(wei)來五年內投(tou)資(zi) 7.65 億美元,用于數十個由(you)聯(lian)邦政府、 工業界和學術界聯(lian)合建(jian)立的人工智(zhi)能( AI)和(he)量子信息(xi)科學(xue)( QIS)科學中心發展,進(jin)一步完善其人工智能技術創新生態系統。

2)、 協同發(fa)展 AI 基礎核心生態,加快構建一批行業智能軟件平臺。 我國已基本形成智能計算、數據服務、開源開發框架、核心平臺和關鍵應用的全產業鏈布局。目前,我國已(yi)形(xing)成以少數領軍企(qi)(qi)業(ye)為中心,一(yi)批科(ke)技企(qi)(qi)業(ye)加速跟進,大批創業(ye)型企(qi)(qi)業(ye)不斷涌現的(de)產業(ye)發展格局,人工智能企(qi)(qi)業(ye)數量占全球比接近 25%,初步(bu)形成(cheng)國內大循(xun)環(huan)的發展基礎(chu)。

一(yi)方(fang)面,我國在數(shu)(shu)據(ju)和(he)關鍵應(ying)用環節具備一(yi)定國際競爭(zheng)力,已(yi)形(xing)成(cheng)數(shu)(shu)據(ju)采(cai)集、清(qing)洗、標注(zhu)、交(jiao)易(yi)等(deng)較為完整的數(shu)(shu)據(ju)支撐(cheng)體(ti)系, 計算機視覺、自(zi)然語言處理(li)等(deng)智(zhi)(zhi)能(neng)應(ying)用技術水平位居全球前列(lie),并(bing)(bing)在公共安全、零售、交(jiao)通、醫(yi)療等(deng)多個行業進行規(gui)模或試點應(ying)用;另一(yi)方(fang)面,在硬(ying)件芯片(pian)、開源(yuan)開發框架等(deng)基礎核(he)心環節,我國已(yi)涌現出(chu)寒武紀、地(di)平線等(deng)新興智(zhi)(zhi)能(neng)芯片(pian)企業,并(bing)(bing)擁有(you)百度飛槳(jiang)( PaddlePaddle)、華為(wei) Mindspore、曠視(shi)天元等開源(yuan)開發框架,持(chi)續完善硬件(jian)芯片與軟件(jian)框架的基礎生態(tai)體系。

充分利用(yong)我(wo)國大(da)市場與產業鏈完備的發展優勢,補強智能計算、 開(kai)發框架的基礎(chu)生態。

從全球來看,開(kai)源開(kai)發(fa)框(kuang)架的(de)第一次洗牌已(yi)到尾聲,谷(gu)歌、臉書等(deng)頭(tou)(tou)部企業(ye)(ye)的(de)開(kai)發(fa)框(kuang)架體(ti)系基本確立,市(shi)(shi)場(chang)份額和社區生(sheng)(sheng)態(tai)已(yi)遠超其他框(kuang)架,我國框(kuang)架以(yi)一己之身突圍(wei)難度很大。同時,受制于我國集成電路(lu)較全球起步晚的(de)歷史背景,英(ying)偉達、英(ying)特爾等(deng)芯片大廠(chang)已(yi)在(zai)工(gong)藝制程、芯片架構、軟件生(sheng)(sheng)態(tai)等(deng)方(fang)面有數十年積累;智(zhi)能計算(suan)時期,芯片頭(tou)(tou)部企業(ye)(ye)針(zhen)對人工(gong)智(zhi)能任務需求加速優化芯片架構、完(wan)善(shan)軟件工(gong)具、適配多樣的(de)開(kai)發(fa)框(kuang)架,構筑(zhu)龐大的(de)生(sheng)(sheng)態(tai)體(ti)系不斷提高行業(ye)(ye)壁壘,導致其他初創智(zhi)能芯片企業(ye)(ye)一時間難以(yi)切入(ru)市(shi)(shi)場(chang)進(jin)行規模應用。

目前(qian),我國雖涌現出一批智能芯片企業,同時也在研發框(kuang)架方(fang)面有所布(bu)局,但兩類(lei)基礎(chu)生態構建所面對的(de)(de)形勢(shi)仍然非(fei)常嚴峻(jun)。因此(ci), 深(shen)度聚焦本土市場的(de)(de)需求持續、 快速創新,驅動我國智能芯片生態和開發框(kuang)架生態的(de)(de)協同、融(rong)合發展,形成(cheng)合力占領國內市場份(fen)額(e),成(cheng)為補強兩類(lei)基礎(chu)生態的(de)(de)關鍵方(fang)向。

憑借國內智(zhi)能應用(yong)先行(xing)落地的(de)時間優勢(shi),沉淀(dian)一批行(xing)業智(zhi)能核心軟件(jian)平臺,同(tong)時提升(sheng)我(wo)國在傳(chuan)統行(xing)業產業鏈中(zhong)的(de)地位(wei)。 應用(yong)創新(xin)活躍(yue)是我(wo)國自互(hu)聯網(wang)時(shi)代至今(jin)的長期(qi)發展優(you)勢,目前我(wo)國已在多個領域形成(cheng)全球(qiu)智能應用(yong)的引領作用(yong),并持續(xu)推進(jin)人工智能應用(yong)先導區的建設,不斷挖掘新(xin)的應用(yong)場(chang)景,沉淀(dian)行業數據和算法模型;如,百度自動(dong)駕駛(shi)開放(fang)平臺 Apollo 與包括寶馬、戴姆勒、一汽(qi)等在內(nei)的全球(qiu)上百家車企達(da)成合作;依圖科技(ji) care.ai 智能醫療解(jie)決方案已在(zai)全國200 余家(jia)機構(gou)落地,并在歐洲、南美、中東、東南亞(ya)等海外區域推廣應用。

在先行試點、應用創新、行業數據、行業算法模型均有一定優勢的背景下,我國的發展方向應是深度滲透到關鍵行業的產業鏈中,沉淀一批面向行業的基礎核心智能軟件平臺,以行業軟件平臺為核心構筑應用生態,替代或增強原有產業鏈條中的軟件環節,甚至提升在傳統產(chan)業(ye)鏈中的影響作用,轉變過去僅(jin)在應用模式(shi)上創新的痛點,驅動我(wo)國(guo)關鍵(jian)行業(ye)產(chan)業(ye)結構向(xiang)高附加值(zhi)方(fang)向(xiang)轉變。

3)、 產業軸心從前沿技術向行業應用轉變帶來區域化發展機遇。 當前,人工智能已從聚焦智能技術發展向各行業應用落地的階段轉變,這將代表著人工智能產業不再僅是北京、上海、深圳等頂尖人才集聚區域的聚焦重點,也為具有特色(se)傳統產業(ye)優(you)勢(shi)的區域帶來發展機會,我國人工智能產業有望形成各具產業應用特色的區域化發展格局。究其原因, 一是產(chan)業發展階段所驅使的, 人工智能產業雖是技術密集型產業,但由于其強賦能特點,與行業場景的深度結合是產業發展非常關鍵的一步。

當前,人工智能產業重心已從智能技術向行業融合應用轉變,使得具有傳統行業(ye)(ye)應用(yong)場景、行業(ye)(ye)知識的更多區域具備發展人工智能的條件和機會。這些(xie)區域擁有人工智能技(ji)術落地的試(shi)驗田(tian),從(cong)而(er)吸(xi)引智能應用(yong)企業(ye)(ye)集聚(ju)發展二是企業發展周期所驅使, 本輪人工智能產業的泡沫逐步破裂,企業面臨從早期靠愿景融資到靠應用變現融資的發展階段,應用落地成為人工智能企業這一時期的聚焦重點,因此也驅使企業尋找更合適的區域進行落地發展。 可(ke)以預計(ji),未來(lai)我國更多的(de)區域將(jiang)會迎來(lai)人工智能產業發(fa)展的(de)窗口期, 逐步形成各具產業特色(se)的(de)區域化發(fa)展格(ge)局(ju)。

打(da)造分領(ling)域分區域的(de)人工智能產(chan)業(ye)創新中心。 當前(qian),科技部(bu)和工信(xin)部(bu)均部(bu)署了產業創新的試點,截(jie)止至 2021 3 月底,科技部頒布15 個新一(yi)代人工智能(neng)創新發(fa)展試驗區,工信部設立 8 個人工智能應用先導示范區,推動人工智能產業區域化、特色化發展步伐不斷加快。在此背景下,我國應打造一批分領域、分區域的人工智能產業創新中心,構建縱向垂直一體化的、產業鏈與創新鏈合一的產業發展平臺, 助(zhu)力我(wo)國人工(gong)智能關鍵核心產(chan)業從技術路線、適配標準(zhun)、生態構建、應(ying)用(yong)推廣等方面(mian)的協同(tong)創(chuang)新發展,加速形成金融、制造、能源(yuan)、醫療、災害應(ying)急(ji)、農業、生態環保等領(ling)域的應(ying)用(yong)創(chuang)新體系,助(zhu)力區域人工(gong)智能產(chan)業特色(se)化、深入化、規模化發展。

4)、 加快人(ren)工(gong)智能和各產業深度融合,打造人(ren)工(gong)智能產業集群。結合(he)(he)各地(di)區產業(ye)基礎和(he)(he)資源(yuan)稟賦,引導各地(di)先行先試,不斷匯聚力量(liang)、理念、方向,抓住(zhu)幾個亮點,在全國范(fan)圍內形成標桿和(he)(he)規模效應。培育更多人工智(zhi)能(neng)領軍企業(ye),引導相關行業(ye)的龍頭(tou)企業(ye)加速智(zhi)能(neng)化(hua)改造步伐(fa)。推(tui)動(dong)開(kai)展一批(pi)重點領域融合(he)(he)創新工程,培育一批(pi)標志性人工智(zhi)能(neng)技術產品(pin),提(ti)升(sheng)重點領域人工智(zhi)能(neng)產品(pin)智(zhi)能(neng)化(hua)水平。 加快(kuai)推動人工智能與(yu)工業(ye)、交通、醫療、農業(ye)、能源(yuan)、應(ying)急安全(quan)等領域深(shen)度(du)融合,推(tui)動人(ren)工智(zhi)(zhi)(zhi)能(neng)在智(zhi)(zhi)(zhi)能(neng)制造、智(zhi)(zhi)(zhi)能(neng)醫療、智(zhi)(zhi)(zhi)慧城市(shi)、智(zhi)(zhi)(zhi)能(neng)農業等(deng)領域得(de)到(dao)廣泛(fan)應用(yong)。 發展(zhan)一批人(ren)工智(zhi)(zhi)(zhi)能(neng)產業園(yuan),按(an)應用(yong)領域分門別類進行相關產業布局(ju),培育建設(she)人(ren)工智(zhi)(zhi)(zhi)能(neng)產業創新集群(qun)。

5)、 深化國際合作,主動融入全球人工智能治理框架。 加強人工智能倫理治理研究力量, 促進形成(cheng)更多更加開放、有國(guo)內外影響力的(de)交流合作(zuo)平臺組織(zhi),推動國(guo)內倫理治(zhi)理規(gui)則共識、中國(guo)方案的(de)形成(cheng),把(ba)引導和規(gui)范人工智能(neng)發展不(bu)斷推向(xiang)深入(ru)。 強化人工智能標準體系建設, 推(tui)動形成“國(guo)家標(biao)準頂(ding)層架(jia)構引導(dao),行(xing)業和團體標(biao)準指導(dao),國(guo)際標(biao)準協同推(tui)進”的良好局面(mian)。 堅持全球化道路,堅持國際視野和全球思維, 以(yi)開放心態應(ying)對(dui)全球(qiu)(qiu)競爭,搭(da)建全球(qiu)(qiu)化服(fu)務平臺(tai),促進國(guo)(guo)際交流,吸引全球(qiu)(qiu)創新要素資源參與(yu)我國(guo)(guo)人(ren)工(gong)智能技術(shu)及產業發(fa)展,同時(shi)鼓勵中國(guo)(guo)人(ren)工(gong)智能企業加大“走(zou)出去(qu)”力(li)度;充分利用“一(yi)帶一(yi)路”倡議(yi)、 G20 等雙/多邊合作(zuo)機制,主動(dong)融入全球人(ren)工(gong)(gong)智(zhi)能治理體系(xi),積極推動(dong)企業、聯(lian)盟、行業組織(zhi)等機構的更多專家(jia)參與全球人(ren)工(gong)(gong)智(zhi)能規則制定,強(qiang)化在(zai)國際標準組織(zhi)中(zhong)的協(xie)作(zuo),為全球人(ren)工(gong)(gong)智(zhi)能發展(zhan)貢獻中(zhong)國智(zhi)慧。

智東西認為,近(jin)兩年,人工(gong)智能的(de)(de)(de)技術應用開(kai)始全(quan)面覆蓋(gai)日常生活、 科學研究、社(she)會治(zhi)理、商(shang)業(ye)創(chuang)新(xin)和(he)國(guo)家安全(quan)等經濟社(she)會的(de)(de)(de)關鍵領域, 以空(kong)前的(de)(de)(de)廣度和(he)深度推動社(she)會發展(zhan)。但(dan)同時(shi),相關資本的(de)(de)(de)減速也是(shi)最近(jin)的(de)(de)(de)一(yi)個(ge)很(hen)明顯的(de)(de)(de)現象。但(dan)是(shi),這種降(jiang)速不一(yi)定是(shi)一(yi)件壞事,這是(shi)一(yi)個(ge)擠掉(diao)泡(pao)沫(mo),讓行(xing)業(ye)回歸(gui)理性的(de)(de)(de)過(guo)程(cheng),在十四五(wu)期(qi)間,經歷篩選后生存(cun)下(xia)來的(de)(de)(de)企業(ye)必將(jiang)是(shi)有自己的(de)(de)(de)核(he)心(xin)競爭力,能夠走出國(guo)門(men)的(de)(de)(de)優秀AI玩家。