智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣

智東西5月(yue)16日消息(xi),近日,《北(bei)京市促進通用人工(gong)智能創新發展(zhan)的若干措(cuo)施(2023-2025年)(征求(qiu)意(yi)見稿)》(簡稱(cheng):“措(cuo)施”)公布,從算(suan)力(li)、數據、算(suan)法(fa)、應用、監管五(wu)大方(fang)向,對北(bei)京大模型(xing)發展(zhan)提(ti)出了21項措(cuo)施,于5月(yue)12日至5月(yue)19日面向公眾征集意(yi)見。

這是國內首個地(di)(di)方政府緊貼AI大模型(xing)產業化發展(zhan)提出的專項措施,北京(jing)打(da)響了(le)地(di)(di)方大模型(xing)競賽(sai)的第一槍。當下正值ChatGPT引(yin)發的“千(qian)模大戰(zhan)”打(da)響,大模型(xing)可能為各行各業帶來(lai)新(xin)的效(xiao)率革命和體驗升級。隨著(zhu)AI第一城北京(jing)行動(dong)(dong)了(le),上(shang)海、深圳(zhen)、杭州等地(di)(di)區可能也會陸續(xu)采(cai)取行動(dong)(dong)。

從“措施”具體內容來看(kan),本次北(bei)京的提(ti)出(chu)的“21條”信息(xi)量不小:

首先在算力方面,北京加強算力資源的統籌供給能力,推動建立統一的多云算力調度平臺,利用政府統一入口,以(yi)此降低公有云采購成(cheng)本及企業面對不同云廠(chang)商的溝通成(cheng)本。

“措施”強調了頭部公有云廠商的市場主體作用,稱通過“算力伙伴計劃”等措施加強與其合作,近期可能就會確定首批伙伴計劃成員;同時重視新增算力,推動海淀區“北京人工智能公共算力平臺”,朝陽區“北京數字經濟算力中心”規模化供給算力。

在數據方面,“措施”直指當下大模型訓練高質量中文語料不足導致的中文語境應用落地問題,指出要歸集高質量基礎訓練數據集,并通過北京國際大數據交易所開放多模態語料庫。

同時,北京地區提出打造“國家數據基礎制度先行先試示范區”,謀(mou)劃國(guo)家級數(shu)據訓練基(ji)地;搭建數(shu)據集精細化(hua)標(biao)注眾(zhong)包服務(wu)平臺。AI大(da)模型的(de)發(fa)展(zhan)(zhan)有(you)望(wang)為大(da)數(shu)據產業(ye)帶來發(fa)展(zhan)(zhan)契(qi)機。

在通用人工智能發展中,大模型技術體系研發創新是核心環節。為此,北京地區就開展大模型創新算法及關鍵技術研究、加強大模型訓練數據采集及治理工具研發、開放大模型評測基準及工具、推動大模型基礎軟硬件體系研發、探索新路徑等方面提(ti)出了措施建議。

值得一提的是,北京地區還比較明確地劃定了幾大推薦落地場景,包括政務、醫療、科研、金融、自動駕駛、城市治理幾個方面,并點到了一些十分具體的應用場景。

比如圍繞政務領域,如(ru)政務(wu)咨詢、政策服(fu)務(wu)、接訴即辦(ban)、政務(wu)辦(ban)事等(deng)工作,率先實現大模型技術賦(fu)能,包括支撐(cheng)“京策”平臺優化政策規(gui)范管理和(he)精準(zhun)服(fu)務(wu),輔助市(shi)民服(fu)務(wu)熱線更高效回應市(shi)民訴求等(deng),以(yi)提(ti)升辦(ban)事服(fu)務(wu)便利度(du)。

圍繞醫療行業,其(qi)提(ti)出支持北京市(shi)有條件的(de)(de)研究型醫療機(ji)構提(ti)煉智能導診、輔(fu)助診斷(duan)、智能治療等場景(jing)需求(qiu),輔(fu)助醫療機(ji)構提(ti)高疾(ji)病診斷(duan)、治療和(he)預防的(de)(de)決策水平。

在城市治理方面,北京也提出支持人工智能研發企業結合智慧城市建設場景需求,率先在城市大腦建設中引進大模型技術……為城市治理提供更加綜(zong)合(he)全面的輔助決策能力。

最后在監管方面,北京提出的監管方式是“包容審慎監管”,積(ji)極向(xiang)國家網信部門爭取,在中關村核心區建立(li)(li)先行先試,推(tui)動實(shi)行包(bao)容審(shen)慎監管試點。同時,其(qi)也提出建立(li)(li)常態化服(fu)務(wu)和指導機(ji)制、加強(qiang)網絡服(fu)務(wu)安全防護和個人數據保護、持續提升人工智能(neng)產(chan)業倫理(li)治理(li)自(zi)律自(zi)治能(neng)力(li)。

“措施”的全文如下:

為搶抓大(da)模型發展機(ji)遇,重視(shi)通用(yong)人工智能發展,充分發揮政府引導作用(yong)和創新(xin)平臺催化作用(yong),整合(he)創新(xin)資源,加強要素(su)配置,營造(zao)創新(xin)生態,重視(shi)風險防范,推(tui)動我市通用(yong)人工智能領域實現創新(xin)引領,提出以下落實措(cuo)施:

一、加強算力資源統籌供給能力

(一)組織商業算力定向滿足本市緊迫需求

加強與頭部公有云廠商等市場主體合作,實施算力伙伴計劃,并確定首批伙伴計劃成員,明確供(gong)(gong)給技術標準、軟(ruan)硬件服務(wu)要求、算(suan)力供(gong)(gong)給規模(mo)、優(you)惠策(ce)略等,向在京高校院(yuan)所(suo)和中小(xiao)企業公布一批優(you)質算(suan)力供(gong)(gong)應(ying)商。

(二)高效推動新增算力基礎設施建設

新增算力建設項目納入算力伙伴計劃,加快推動海淀區“北京人工智能公共算力平臺”,朝陽區“北京數字經濟算力中心”等項目建設(she),快速形成規(gui)模(mo)(mo)化先(xian)進算力供給能力,支撐千億級參數量的大(da)型(xing)語言模(mo)(mo)型(xing)、多模(mo)(mo)態(tai)大(da)模(mo)(mo)型(xing)、大(da)規(gui)模(mo)(mo)精細神經網(wang)絡(luo)模(mo)(mo)擬(ni)仿真(zhen)模(mo)(mo)型(xing)、腦啟發神經網(wang)絡(luo)等研發。

(三)建設統一的多云算力調度平臺

利用政府統一入口,降低公有云采購成本,普惠中小企業,同時減少企業分別面對不同云廠商的溝通成本。針(zhen)對彈性算(suan)(suan)力(li)需求,建(jian)設統(tong)(tong)一的多云算(suan)(suan)力(li)調度平(ping)臺,實現異(yi)構(gou)算(suan)(suan)力(li)環境統(tong)(tong)一管理、統(tong)(tong)一運(yun)營,方(fang)便企業在不(bu)同云環境上無縫、經濟、高效地(di)運(yun)行各類人工智能計算(suan)(suan)任(ren)務(wu)。建(jian)設北京與(yu)河北、天津、山西、內(nei)蒙(meng)古等省(市)算(suan)(suan)力(li)集群的直連基(ji)礎光傳輸網絡,進一步(bu)提升(sheng)平(ping)臺對四地(di)算(suan)(suan)力(li)資源(yuan)感知(zhi)能力(li),探索開展算(suan)(suan)力(li)交(jiao)易。

二、提升高質量數據要素供給能力

(四)歸集高質量基礎訓練數據集

針對目前大模型訓練高質量中文語料占比過少,不利于中文語境表達及產業應用的問題,整合現有開源中文預訓練數據集和高質量互聯網中文數據并進行合規清洗。同時持續擴展高質量多模態數據來源,建設合規安全的中文、圖文對、音頻、視頻等大模型預訓練語料庫,通過北京國際大數據交易所社會數(shu)據專區進(jin)行(xing)定向有(you)條件開放。

(五)打造“國家數據基礎制度先行先試示范區”,謀劃國家級數據訓練基地

加快推動數據要素高水平開放的“國家數據基礎制度先行先試示范區”建設,爭(zheng)創國家級(ji)數(shu)據訓練基(ji)地,提(ti)(ti)升(sheng)北京(jing)人工智能數(shu)據標注庫(ku)規模(mo)和質(zhi)(zhi)量。倡(chang)議高質(zhi)(zhi)量數(shu)據網站所屬(shu)企業提(ti)(ti)供部分脫敏高質(zhi)(zhi)量數(shu)據,進(jin)行(xing)定向有條件開(kai)放,企業或科(ke)研機構(gou)通(tong)過(guo)在線申請進(jin)行(xing)有償使用(yong),并探索基(ji)于數(shu)據貢獻、模(mo)型應用(yong)的商(shang)業化場景(jing)合作。

(六)搭建數據集精細化標注眾包服務平臺

建設指令數據集及多模態數據集眾包服務平臺,開發(fa)集(ji)成相關工具應用的(de)智能云服務(wu)系統,鼓勵(li)并組織來(lai)自(zi)不同(tong)學科(ke)的(de)專業人員標注(zhu)通(tong)用人工智能模型訓練數(shu)據(ju)及指令數(shu)據(ju),提高訓練數(shu)據(ju)的(de)多樣性,給予貢獻者適當(dang)獎勵(li),推動平臺持續良性發(fa)展。

三、系統布局大模型技術體系,持續探索通用人工智能路徑

(七)開展大模型創新算法及關鍵技術研究

圍(wei)繞大(da)型語(yu)言模(mo)型構建、訓(xun)練(lian)、調(diao)優對(dui)(dui)齊、推(tui)理(li)(li)部(bu)署等全流程,支(zhi)持開(kai)展(zhan)創新算法及(ji)核心技術研究(jiu),形(xing)成完整高(gao)效(xiao)的訓(xun)練(lian)體系并(bing)對(dui)(dui)外開(kai)源。探(tan)索多模(mo)態通用模(mo)型架構,研究(jiu)大(da)模(mo)型高(gao)效(xiao)并(bing)行訓(xun)練(lian)技術,以及(ji)邏(luo)輯和知識推(tui)理(li)(li)、指令(ling)學習、人類(lei)意圖(tu)對(dui)(dui)齊等調(diao)優方法,研發支(zhi)持百(bai)億參數模(mo)型推(tui)理(li)(li)的高(gao)效(xiao)壓縮(suo)技術。

(八)加強大模型訓練數據采集及治理工具研發

從(cong)“采(cai)、存(cun)、管(guan)、研、用(yong)”五個方面(mian),研發包含數(shu)(shu)據(ju)采(cai)集(ji)、清洗、標注(zhu)、脫敏(min)、存(cun)儲等(deng)功能在內(nei)的數(shu)(shu)據(ju)處(chu)理(li)工具。重點研究互聯網數(shu)(shu)據(ju)全量實時更新(xin)技術,多源異構數(shu)(shu)據(ju)整合與分類(lei)(lei)方法(fa)(fa),數(shu)(shu)據(ju)管(guan)理(li)平臺相關系統,數(shu)(shu)據(ju)清洗、標注(zhu)、分類(lei)(lei)、注(zhu)釋等(deng)軟件工具及算法(fa)(fa),數(shu)(shu)據(ju)內(nei)容安全審查算法(fa)(fa)及工具等(deng)。

(九)開放大模型評測基準及工具

構建(jian)多模態多維度(du)的(de)(de)(de)基(ji)(ji)礎(chu)模型(xing)評(ping)(ping)測基(ji)(ji)準(zhun)及評(ping)(ping)測方法。建(jian)立基(ji)(ji)礎(chu)模型(xing)評(ping)(ping)測工(gong)(gong)具(ju)集,提供適(shi)應性(xing)(xing)的(de)(de)(de)工(gong)(gong)具(ju)進行評(ping)(ping)測。建(jian)立公平(ping)高效(xiao)的(de)(de)(de)自(zi)適(shi)應評(ping)(ping)測機(ji)制,根據評(ping)(ping)測目標的(de)(de)(de)不同,自(zi)動適(shi)配不同的(de)(de)(de)工(gong)(gong)具(ju)和指標。研究人(ren)工(gong)(gong)智能輔助的(de)(de)(de)智能模型(xing)評(ping)(ping)測算法,面向主(zhu)觀型(xing)或生成式的(de)(de)(de)任務,構建(jian)自(zi)動化評(ping)(ping)估工(gong)(gong)具(ju)。集成包括通用性(xing)(xing)、高效(xiao)性(xing)(xing)、智能性(xing)(xing)、魯棒性(xing)(xing)在內的(de)(de)(de)多維度(du)評(ping)(ping)測工(gong)(gong)具(ju),構建(jian)基(ji)(ji)礎(chu)模型(xing)線上評(ping)(ping)測服(fu)務平(ping)臺。

(十)推動大模型基礎軟硬件體系研發

支持研發分布式高效訓練系統,實現模型訓練任務高效自動并行。研發適用于模型訓練場景的新一代人工智能編譯器,實現算子自動生成和自動優化,推動人工智能芯片與框架的廣泛適配。研發人工智(zhi)能芯片評(ping)測系統,實(shi)現(xian)多(duo)芯片多(duo)框架的(de)自動化評(ping)測。為大(da)模(mo)型(xing)訓練和應用提供自主創(chuang)新的(de)基礎軟硬件生態底座。

(十一)探索具身智能、通用智能體和類腦智能等通用人工智能新路徑

發展面向通用人工智能的基礎理論框架體系,加強人工智能數學機理、自主協同與決策等基礎理論研究。推動具身智(zhi)能(neng)系(xi)統研究及應(ying)用(yong)(yong),突破機器人在開放環境、泛化場景、連(lian)續任務等復雜條件下的感知(zhi)、認知(zhi)、決策技術。探索(suo)價值與因果驅動的通(tong)(tong)(tong)用(yong)(yong)人工(gong)(gong)智(zhi)能(neng)新路(lu)徑研究,打造通(tong)(tong)(tong)用(yong)(yong)人工(gong)(gong)智(zhi)能(neng)統一理(li)論(lun)框(kuang)架(jia)體系(xi)、評級標(biao)準及測(ce)試(shi)平臺,研發(fa)通(tong)(tong)(tong)用(yong)(yong)人工(gong)(gong)智(zhi)能(neng)操作(zuo)系(xi)統和編程語(yu)言,推動通(tong)(tong)(tong)用(yong)(yong)智(zhi)能(neng)體底層技術架(jia)構應(ying)用(yong)(yong)。探索(suo)類腦智(zhi)能(neng)等交(jiao)叉學科研究,通(tong)(tong)(tong)過大腦神(shen)經元連(lian)接模式(shi)、編碼機制、信息處理(li)原理(li)研究,啟發(fa)新型(xing)人工(gong)(gong)神(shen)經網(wang)絡模型(xing)建模和訓(xun)練(lian)方法(fa)。

四、推動通用人工智能技術創新場景應用

(十二)推動在政務服務領域率先試點應用

圍繞政務咨詢、政策服務、接訴即辦、政務辦事等工作,率先實現大模型技術賦能。借助大模型語義理解、自主學習和智能推理等能力,提高政務咨詢系統智能問答水平,增強多語種交互能力。支撐“京策”平臺建設,優化政策規范管理和精準服務。輔助市民服務熱線更高效回應市民訴求,深化民生大數據高效利用。提升辦事(shi)服務(wu)便利(li)度(du),輔助(zhu)引(yin)導辦事(shi)人(ren)(ren)員表單(dan)填寫,輔助(zhu)綜合(he)窗(chuang)口人(ren)(ren)員更精準提供辦事(shi)指引(yin),輔助(zhu)審(shen)批人(ren)(ren)員提高(gao)審(shen)批效率,推進業(ye)務(wu)數據更充分共享、業(ye)務(wu)流程更高(gao)效協同。

(十三)探索在醫療領域示范應用

支持我市有條件的研究型醫療機構提煉智能導診、輔助診斷、智能治療等場景需求,充(chong)分(fen)挖掘醫(yi)(yi)學文獻、醫(yi)(yi)學知識(shi)圖譜、醫(yi)(yi)學影像(xiang)等多模態醫(yi)(yi)療數據(ju),構建基于醫(yi)(yi)療領域通用數據(ju)與(yu)專業數據(ju)的(de)智能應用,實現對各種(zhong)疾病(bing)和(he)(he)(he)癥狀的(de)準確識(shi)別和(he)(he)(he)預測,輔(fu)助醫(yi)(yi)療機構提高疾病(bing)診斷、治(zhi)療和(he)(he)(he)預防的(de)決策(ce)水(shui)平。

(十四)探索在科學研究領域示范應用

發展科學智能,加速人工智能技術賦能新材料和創新藥物領域科學研究。支(zhi)持我市能源、材料、生物(wu)領域相關(guan)(guan)實驗室設立科(ke)研(yan)(yan)合(he)(he)(he)作專項(xiang),與我市相關(guan)(guan)科(ke)研(yan)(yan)機構和創新企(qi)業開展聯(lian)合(he)(he)(he)研(yan)(yan)發,充分挖掘材料、蛋(dan)白質和分子藥(yao)物(wu)領域實驗數據(ju),研(yan)(yan)發科(ke)學計算模型,開展新型合(he)(he)(he)金材料、蛋(dan)白質序列和創新藥(yao)物(wu)化學結構序列預測,縮(suo)短科(ke)研(yan)(yan)實驗周期。

(十五)推動在金融領域示范應用

進一(yi)步挖掘我市金(jin)(jin)融(rong)行業(ye)應(ying)用場(chang)景,系統(tong)布局(ju)一(yi)批金(jin)(jin)融(rong)機構(gou)場(chang)景開放“揭榜(bang)掛帥(shuai)”項(xiang)目(mu)。支持金(jin)(jin)融(rong)科技企(qi)業(ye)針對(dui)金(jin)(jin)融(rong)場(chang)景中信(xin)息(xi)負載高,信(xin)息(xi)更新(xin)快,金(jin)(jin)融(rong)從業(ye)者難以快速全面(mian)(mian)的獲取(qu)準(zhun)確信(xin)息(xi)的問題,探索面(mian)(mian)向(xiang)金(jin)(jin)融(rong)文本深(shen)度理(li)解(jie)和分析的人(ren)工(gong)智能(neng)(neng)技術(shu)應(ying)用。聚焦智能(neng)(neng)風控、智能(neng)(neng)投顧(gu)、智能(neng)(neng)客服等環節(jie),推動(dong)實現(xian)金(jin)(jin)融(rong)專業(ye)長文本的精準(zhun)解(jie)析和模型知(zhi)識的更新(xin),突破復雜決策邏輯(ji)與模型信(xin)息(xi)處理(li)能(neng)(neng)力間的融(rong)合技術(shu),實現(xian)從復雜金(jin)(jin)融(rong)信(xin)息(xi)處理(li)到投資(zi)決策建(jian)議的轉化,支撐(cheng)金(jin)(jin)融(rong)領域的投資(zi)輔助決策。

(十六)探索在自動駕駛領域示范應用

支持自動駕駛企業研發多模態自動駕駛技術,發揮大型語言模型高維語義理解和泛化優勢,基于車路協同數據和車輛行駛多傳感器融合數據,提高自動駕駛模型多維感知和預測性能,有效解決復雜場景長尾問題,輔助提高車載自動駕駛模型泛化能力。支持在北京市高級別自動駕駛示范區3.0建設中,構建車路協同數據庫,引導企業開展基于真實場景的自動駕駛模型訓練迭代。探索(suo)基于低時延通(tong)訊的云控(kong)自動駕(jia)(jia)駛模型測(ce)試,發(fa)展自動駕(jia)(jia)駛新技術路徑。

(十七)推動在城市治理領域示范應用

支持人工智能研發企業結合智慧城市建設場景需求,率先在城市大腦建設中引進大模型技術,開展多感(gan)知系(xi)統融合處理(li)技術研發(fa),打破城市(shi)治(zhi)理(li)中各系(xi)統數據(ju)孤島,實現智慧城市(shi)底層業(ye)務的(de)統一感(gan)知、關聯分析和(he)態勢預測,科學調配(pei)政(zheng)府資源(yuan)和(he)行政(zheng)力(li)量,為城市(shi)治(zhi)理(li)提供更加綜(zong)合全面的(de)輔助決策能力(li)。

五、探索營造包容審慎的監管環境

(十八)持續推動監管政策和監管流程創新

探索營造穩定包容的監管環境,積極推動人工智能領域新技術賦能傳統行業的包容審慎監管,支持人工智能算法、框架等基礎技術的自主創新、推廣應用、國際合作。鼓勵優先采用安全可信的軟件、工具、計算和數據資源,通過改進算法等技術手段,確保訓練數據集的規范性。鼓勵生成式人工智能產品在科研等非面向公眾服務領域實現向上向善應用。積極向國家網信部門爭取,在中關村核心區建立先行先試,推動實行包容審慎監管試點。

(十九)建立常態化服務和指導機制

做好對擬面(mian)向公(gong)(gong)眾提供服(fu)務(wu)的(de)生成(cheng)式人(ren)(ren)工智能產(chan)品(pin)的(de)安(an)全(quan)(quan)(quan)評(ping)估工作,建立常態化聯(lian)系服(fu)務(wu)和指(zhi)導機制(zhi),督促企(qi)業遵(zun)守(shou)法(fa)律法(fa)規要(yao)求,尊(zun)重社會公(gong)(gong)德、公(gong)(gong)序良俗。優化安(an)全(quan)(quan)(quan)評(ping)估流程機制(zhi),細化對大模型算法(fa)設計、訓練數據源篩(shai)選、內容安(an)全(quan)(quan)(quan)性、人(ren)(ren)工標注規則的(de)審核評(ping)估標準(zhun),開展精(jing)準(zhun)化服(fu)務(wu)指(zhi)導,加快推進我市人(ren)(ren)工智能企(qi)業相關技術產(chan)品(pin)的(de)安(an)全(quan)(quan)(quan)評(ping)估工作。指(zhi)導企(qi)業建立健(jian)全(quan)(quan)(quan)算法(fa)安(an)全(quan)(quan)(quan)防(fang)范機制(zhi),在產(chan)品(pin)研發階段引入(ru)技術工具進行安(an)全(quan)(quan)(quan)檢測,督促企(qi)業積極(ji)履行算法(fa)備案和變更、注銷備案手(shou)續。發布(bu)《北京市互聯(lian)網信息服(fu)務(wu)算法(fa)推薦合(he)(he)規指(zhi)引》,引導創新主體樹立安(an)全(quan)(quan)(quan)責任意識,健(jian)全(quan)(quan)(quan)管理制(zhi)度、強化技術手(shou)段、促進企(qi)業算法(fa)合(he)(he)規發展。

(二十)加強網絡服務安全防護和個人數據保護

指導(dao)算力運營主(zhu)體(ti)(ti)落(luo)實(shi)(shi)《網(wang)絡(luo)安全(quan)(quan)(quan)法(fa)》《數據(ju)安全(quan)(quan)(quan)法(fa)》《個人信息(xi)保(bao)護法(fa)》等法(fa)律規定,加(jia)強網(wang)絡(luo)和(he)數據(ju)安全(quan)(quan)(quan)管(guan)理(li)(li),明確網(wang)絡(luo)安全(quan)(quan)(quan)、數據(ju)安全(quan)(quan)(quan)和(he)個人信息(xi)保(bao)護主(zhu)體(ti)(ti)責任,強化安全(quan)(quan)(quan)管(guan)理(li)(li)制度建設(she)和(he)工作落(luo)實(shi)(shi),鼓勵企業開展數據(ju)安全(quan)(quan)(quan)管(guan)理(li)(li)認證及(ji)個人信息(xi)保(bao)護認證,落(luo)實(shi)(shi)數據(ju)跨境(jing)傳輸安全(quan)(quan)(quan)管(guan)理(li)(li)制度,全(quan)(quan)(quan)面提升網(wang)絡(luo)安全(quan)(quan)(quan)和(he)數據(ju)安全(quan)(quan)(quan)防護能力。

(二十一)持續提升人工智能產業倫理治理自律自治能力

落實國家新(xin)一代人工智(zhi)能創新(xin)發(fa)(fa)展試驗區(qu)建(jian)設任務(wu),加強人工智(zhi)能倫理(li)安全規(gui)范(fan)(fan)及(ji)社會治(zhi)(zhi)理(li)實踐研究,研發(fa)(fa)并部署(shu)人工智(zhi)能倫理(li)治(zhi)(zhi)理(li)公共(gong)服(fu)務(wu)平臺,服(fu)務(wu)政府監管與產業自律自治(zhi)(zhi),強化相關責(ze)任主體科(ke)技倫理(li)規(gui)范(fan)(fan)意識,提升(sheng)科(ke)技倫理(li)治(zhi)(zhi)理(li)能力。

來源:首都之窗