
智東西(公眾號:zhidxcom)
文 | 韋世瑋
智東西8月25日消息,今天,百度在百度大腦語言與知識技術峰會上發布語義理解技術與平臺文心(ERNIE)、智能文檔分析平臺TextMind、AI同傳會議解決方案3項新產品,以及智能創作平臺和智能對話定制與服務平臺UNIT的多項升級。
其中,文心基于深度學習平臺飛槳打造,能夠為用戶提供一站式能力,將為開發者減少90%數據標注量、90%算力投入、85%模型開發時長,進一步降低(di)NLP定制開發的成本(ben)。
據了解,這些新產品發布與升級覆蓋語言理語言生成、對話、機器翻譯4大NLP(自然語言理解)領域重點研究方向。
除此之外,百度CTO王海峰也來到現場,為大家分享百度大腦發展歷程的同時,也從知識圖譜、語言理解與生成技術等方面介紹了百度完整的語言與知識技術布局。
值得一提的是,百度還聯合中國計算機學會、中國中文信息學會,共同發起中文自然語言處理數據共建計劃——千言,同時百度技術委員會主席吳華還發布了百度語言與知識技術算力共享計劃。
一、三大新品發布與兩大產品升級,豐富落地應用
峰會上,百度集團副總裁吳甜以理解、生成、對話、翻譯四大方向,分別介紹了三款百度語言與知識技術的新產品,以及兩項新升級。
1、文心(ERNIE):語義理解技術與平臺
2019年,百度發布了(le)具備(bei)持續(xu)學習和知(zhi)識增強的語(yu)義理解框架ERNIE,語(yu)言(yan)理解能(neng)力得到了(le)大幅提(ti)升。而今(jin)年,百度在ERNIE核心(xin)技(ji)術基(ji)礎上(shang)延展開發了(le)語(yu)義理解技(ji)術與平臺(tai),并取名為“文心(xin)”,意義取自《文心(xin)雕龍》。
據介紹,文(wen)心(xin)基于深度學習平臺飛槳打造,集(ji)成(cheng)了預(yu)訓練模型(xing)、全面的NLP算(suan)(suan)法集(ji)、端到(dao)端開(kai)發套件(jian)和平臺。文(wen)心(xin)將減少開(kai)發者90%數據標注量(liang)、90%算(suan)(suan)力投入、85%模型(xing)開(kai)發時長,為開(kai)發者提供一站式NLP開(kai)發與服務(wu),從而降(jiang)低NLP定制開(kai)發的成(cheng)本。
目前,文心已(yi)經廣(guang)泛(fan)用于百度產品中(zhong),包括搜索(suo)引擎、推(tui)薦系統(tong)、智(zhi)能音箱、智(zhi)能客(ke)服等。同時,文心已(yi)累計支持超過20000名開發者,應(ying)用場景覆蓋金融(rong)、通信、教(jiao)育、電(dian)商等各(ge)行(xing)各(ge)業(ye),顯著(zhu)提升企(qi)業(ye)應(ying)用效(xiao)果(guo)和效(xiao)率。
2、TextMind:智能文檔分析平臺
TextMind是百度面向企業文本智能(neng)化需求,推出的智能(neng)文檔分析(xi)平臺(tai),主要(yao)面向文檔解析(xi)、文書審核等(deng)場景。
TextMind的底層基于OCR和NLP技術(shu),以文檔(dang)解析為核(he)(he)心能(neng)(neng)(neng)力,支持文檔(dang)對比(bi)、文檔(dang)審(shen)核(he)(he)等功能(neng)(neng)(neng)。同時(shi),TextMind還結合了知(zhi)識圖譜的能(neng)(neng)(neng)力,能(neng)(neng)(neng)幫助(zhu)企業(ye)在合同審(shen)核(he)(he)時(shi)能(neng)(neng)(neng)發現(xian)更多的隱(yin)含法(fa)律風險。
吳甜介紹,TextMind核(he)心優勢為“多(duo)、快(kuai)、好、省(sheng)”。
其中,“多”指(zhi)支持多種(zhong)格式,TextMind目前(qian)可(ke)(ke)解析6種(zhong)格式、20類(lei)文(wen)檔;“快”指(zhi)顯著提(ti)高企業文(wen)檔處理效率,比如,可(ke)(ke)將企業報(bao)銷時間從(cong)3-5個工作日(ri)縮(suo)短至1分鐘;“好”指(zhi)效果(guo)好,基(ji)于TextMind預置的文(wen)檔解析能力(li),企業開箱(xiang)即用,實現零門(men)檻定制(zhi);“省”指(zhi)文(wen)檔規范(fan)化解析可(ke)(ke)幫助企業降低人力(li)成本80%以上。
3、AI同傳會議解決方案
百度(du)自2017年推出同傳(chuan)(chuan)系統以來,其AI同傳(chuan)(chuan)已逐步(bu)構(gou)建(jian)起較為豐富的產(chan)品形態,包(bao)括桌面(mian)(mian)助手、翻譯(yi)、同傳(chuan)(chuan)功能等。這(zhe)次百度(du)則面(mian)(mian)向(xiang)會議場(chang)景(jing),發布AI同傳(chuan)(chuan)會議解決方(fang)案(an),覆蓋會議全(quan)場(chang)景(jing)、全(quan)流(liu)程(cheng)。
現場,吳(wu)甜(tian)還為大家展(zhan)示了如何只(zhi)用一(yi)臺電(dian)腦和一(yi)部手機,就能快速搭建(jian)一(yi)套同傳(chuan)服(fu)務,只(zhi)需點點鼠標、打幾個字(zi),就能快速獲(huo)得專業的(de)同傳(chuan)服(fu)務。
值得一提的是,用戶在會(hui)議(yi)前(qian)可以根據會(hui)議(yi)設計的特定(ding)領域進行屬于定(ding)制(zhi),來應對各(ge)類專業議(yi)題中(zhong)獨有(you)的詞(ci)義,讓翻(fan)譯更準確(que)。同(tong)時,用戶在會(hui)議(yi)中(zhong)也(ye)可以隨時進行術(shu)語(yu)干預,并(bing)實時生效(xiao),會(hui)議(yi)結束后還能自動生成會(hui)議(yi)記錄并(bing)保(bao)存到網盤中(zhong)。
4、百度大腦智能創作平臺
2019年初,百度上線(xian)了智能創作平臺,尤其在媒體行業進行了重點深入,通過輔助創作和自動(dong)創作等多(duo)項能力(li),輔助用戶進行內(nei)容(rong)創作、圖(tu)文轉(zhuan)換視頻等工(gong)作。
此次,百度(du)大腦(nao)智(zhi)能創作平臺針(zhen)對媒體(ti)的應用場(chang)景,更(geng)新了智(zhi)能策劃、智(zhi)能采編、智(zhi)能審校3大媒體(ti)場(chang)景方(fang)案,幫助媒體(ti)人更(geng)快、更(geng)好地進行創作。
例如,在智能策劃(hua)方面,百度大腦(nao)創作平臺上(shang)匯聚了(le)全網(wang)數據(ju)資(zi)源,利用(yong)知識圖譜(pu)與自然語言處理的技(ji)術對數據(ju)深度的理解和分(fen)析(xi),圍繞媒(mei)體(ti)(ti)行(xing)業(ye)推出系列智能策劃(hua)場景方案,高時(shi)效性的匯聚全網(wang)主流(liu)媒(mei)體(ti)(ti)線索(suo),關(guan)聯分(fen)析(xi)得到行(xing)業(ye)地(di)域的熱(re)點信(xin)息(xi)。
自平臺推出以來,它已自動創作文章超過200萬篇,圖文轉視頻能力已有7000多用戶,已生產短視頻15萬個,相當于一個人(ren)至少100年的工作量,并已落地人(ren)民日報、央(yang)視網等20多家媒體機構。
5、UNIT:智能對話定制與服務平臺
為了(le)讓開發者(zhe)更加高(gao)(gao)效的(de)獲(huo)得(de)高(gao)(gao)質量的(de)對(dui)話(hua)理(li)(li)解(jie)能(neng)力,此次百(bai)度(du)升級了(le)UNIT的(de)3大特性,包括任(ren)務式(shi)對(dui)話(hua)理(li)(li)解(jie)、表格(ge)問答和新對(dui)話(hua)引(yin)擎,將數據標注(zhu)成本進(jin)一步降低到(dao)30%以上(shang),并融合通用對(dui)話(hua)能(neng)力提升交(jiao)互體驗。
一是小樣本(ben)意圖理解能力升級。每個意圖將提供大約10個標注樣本(ben)就能達到高(gao)準確率(lv)的意圖識別,顯(xian)著降低數據標注的成本(ben)。
同時,UNIT基(ji)于最(zui)新升級的依存句法(fa)分析技術和(he)通用關(guan)(guan)鍵詞(ci)(ci)識別技術,為開(kai)發者帶(dai)來了詞(ci)(ci)槽修(xiu)飾(shi)關(guan)(guan)系的識別能力(li)。
二(er)是表格問(wen)答能(neng)力升級。百度通過對表格的分析和自(zi)動化構建(jian),基(ji)于表格內在知識(shi)能(neng)力,能(neng)夠(gou)自(zi)動理解用戶提(ti)出的問(wen)題,并分析出相(xiang)應(ying)答案(an)。此外表格問(wen)答還具備較好的口語化交互效(xiao)果,支持在對話場景(jing)中(zhong)使用。
例如,開發者(zhe)只需(xu)上(shang)傳業務(wu)數(shu)據表格,經(jing)過(guo)UNIT一分(fen)鐘自動(dong)分(fen)析后,產出的(de)(de)問(wen)答機(ji)器(qi)人就(jiu)可(ke)以準確回答大部分(fen)基(ji)于這些表格的(de)(de)事(shi)實性(xing)問(wen)題;加之(zhi)1小(xiao)時左(zuo)右的(de)(de)人工輔助(zhu)調優,問(wen)答機(ji)器(qi)人達到的(de)(de)水(shui)平相當于以往通過(guo)至少2周(zhou)的(de)(de)人工整理(li)FAQ建(jian)設(she)的(de)(de)問(wen)答系統的(de)(de)水(shui)平。
三是新(xin)一代(dai)融合(he)任(ren)務式對話和通(tong)用對話引(yin)擎(qing)(qing)。該(gai)引(yin)擎(qing)(qing)通(tong)過通(tong)用對話的(de)(de)主動式人(ren)性化交互,進一步提升(sheng)用戶體驗(yan),同(tong)時動態分析當前對話進程,以適當推薦引(yin)導的(de)(de)方式嘗試觸發任(ren)務,滿(man)足用戶的(de)(de)具體需求。
二、百度語言與知識技術的十年布局發展
在王海峰看來,要(yao)讓自然語(yu)言(yan)表達靈活,其普遍語(yu)言(yan)結(jie)構分析和語(yu)義理(li)解(jie)難度很大。因此,以語(yu)言(yan)和知識為研(yan)究對(dui)象,研(yan)究如(ru)何(he)讓機器像人一樣掌握知識,理(li)解(jie)語(yu)言(yan)的(de)NLP技術(shu)對(dui)AI技術(shu)的(de)發展至關重要(yao)。
在現場,王海峰向大家分享了百度的語言和知識技術在過去十年是如何布局發展的。
▲百度CTO王海峰
“我們始終把握(wo)技術(shu)發(fa)展和(he)產(chan)業(ye)發(fa)展兩(liang)個趨勢。”王海峰談到,從研(yan)究(jiu)方法上看,百度初(chu)期以規則和(he)統計機器學習技術(shu)為主(zhu),探(tan)索深度學習、神經網(wang)絡語義匹(pi)配框架、多語言神經網(wang)絡及翻譯(yi)等技術(shu),近兩(liang)年還(huan)擴展到知識增強的(de)深度學習。
從研(yan)究(jiu)對(dui)象(xiang)上看,詞、短語、句子以及篇章都是(shi)百度的研(yan)究(jiu)對(dui)象(xiang)。
隨(sui)著(zhu)AI技術的(de)發展(zhan),應用場景(jing)變的(de)愈發復雜,百度的(de)研究對(dui)象也從(cong)語(yu)言擴(kuo)展(zhan)到語(yu)音(yin)、視覺等多模態信息,探(tan)索跨模態語(yu)義理(li)解技術,例如語(yu)音(yin)一體化、圖像語(yu)言一體化等。
從研究(jiu)方向上看(kan),從語(yu)言分析(xi)、語(yu)言生成、知(zhi)識(shi)圖譜(pu)及翻譯拓展(zhan)到(dao)深度與(yu)理解(jie),完(wan)整的技(ji)術(shu)體系也促(cu)進了各項技(ji)術(shu)的融合發展(zhan)。
在(zai)百度語言和知識(shi)技術發展的(de)過程中,其技術已應用到搜索(suo)、翻譯(yi)、地圖(tu)、信息(xi)流和智(zhi)能(neng)硬件等產品,并廣泛應用于金(jin)融、醫療、教育和能(neng)源(yuan)等各(ge)行各(ge)業,在(zai)為社會提供(gong)全方位智(zhi)能(neng)服務(wu)的(de)同(tong)時(shi),加(jia)速產業智(zhi)能(neng)化升級。
歷經11年的發展,如今百度已形成了完整的NLP技術布局,包括知識圖譜、語言理解與生成技術,以及應用系統等。
王(wang)海峰(feng)對(dui)百度NLP技術布局的部分關鍵技術進行了(le)解讀,并分享了(le)部分最新進展。
1、知識圖譜技術
作為(wei)機(ji)器認知世界(jie)的(de)重(zhong)要基(ji)礎,知識圖譜主要以結構化的(de)形式(shi)描述真實世界(jie)中(zhong)的(de)實體屬性、關系等。
基于搜索引(yin)擎,從多(duo)元異構(gou)(gou)的(de)大(da)規模數據(ju)中能(neng)構(gou)(gou)建非常龐大(da)的(de)知(zhi)識圖譜。基于此(ci),百(bai)度提出了一整套(tao)構(gou)(gou)建方案(an),包括無標簽大(da)數據(ju)、開放知(zhi)識挖掘(jue)技術知(zhi)識體系、自(zi)學習技術,以及融合多(duo)源異構(gou)(gou)數據(ju)的(de)知(zhi)識補(bu)全和整合技術等(deng)。
據王(wang)海峰介(jie)紹,如今百度打(da)造了一個多元(yuan)異構(gou)知識圖譜,擁有超(chao)過(guo)50億實(shi)體和(he)5500億事(shi)實(shi),并在(zai)不斷演進和(he)更新,已(yi)應用(yong)于各行各業,每日調用(yong)次數超(chao)過(guo)400億次。
2、語言理解技術
在知識的加持下,百度(du)的語言(yan)理解相關技術也不(bu)斷增強(qiang)。
百度(du)提(ti)出知識增(zeng)強的(de)語義理解框架文心(ERNIE),即在深度(du)學習的(de)基礎(chu)上融(rong)入知識,具備人類一樣的(de)學習能力(li),曾一舉登頂(ding)全球權威(wei)數據集GLUE榜單,首(shou)次突破90分(fen)大(da)關,刷新榜單歷史(shi),并且(qie)超越人類得(de)分(fen)。
同(tong)時,百(bai)度還研制了知識增強(qiang)的(de)跨模(mo)(mo)態(tai)深度語(yu)(yu)義理解方(fang)法,通過知識關(guan)聯(lian)跨模(mo)(mo)態(tai)信息,運用語(yu)(yu)言描(miao)述不同(tong)模(mo)(mo)態(tai)信息的(de)語(yu)(yu)義,進而讓(rang)機(ji)器實現從(cong)“看清(qing)”到(dao)“看懂(dong)”、從(cong)“聽(ting)清(qing)”到(dao)“聽(ting)懂(dong)”,即圖像和語(yu)(yu)言、語(yu)(yu)音和語(yu)(yu)言的(de)一體(ti)化理解。
在NLP技術領域(yu),還有一個重要的(de)任務是語言生(sheng)成,主要研(yan)究如何讓(rang)機器使用自然(ran)語言進行(xing)表達和寫作。
百度(du)提(ti)出了基于多流機制的語(yu)言生(sheng)成預訓練技(ji)術,在(zai)語(yu)言生(sheng)成過程(cheng)中兼顧詞(ci)、短語(yu)等不同粒度(du)的語(yu)義信息,顯著提(ti)升(sheng)生(sheng)成和應用(yong)效果(guo)。
基于(yu)語言生成技(ji)術(shu),百(bai)度(du)還結合了其他語言和知識技(ji)術(shu),并應(ying)用(yong)到百(bai)度(du)智能(neng)創作平臺,在(zai)各個(ge)環(huan)節全方位幫助用(yong)戶進行智能(neng)創作。
隨(sui)著百(bai)度大(da)腦語(yu)言與知識(shi)技術(shu)的廣泛落地應用,百(bai)度已經(jing)收獲(huo)了許多行(xing)業成果。據王海峰介紹,百(bai)度大(da)腦語(yu)言與知識(shi)技術(shu)已獲(huo)得包括(kuo)國家(jia)科技進步(bu)獎在內的20多個獎項(xiang),30多項(xiang)國際競(jing)賽(sai)冠軍(jun),發表(biao)學術(shu)論文超過(guo)300篇(pian),申(shen)請專利2000多項(xiang)。
未來,隨著NLP技術的不(bu)斷(duan)突破(po)創新,百度也(ye)將在產品(pin)上繼(ji)續保(bao)持(chi)探(tan)索,進一步賦(fu)能智能搜索、智能推薦、智慧城市(shi)、智慧醫療(liao)等各(ge)(ge)行各(ge)(ge)業。
三、發布兩大計劃,助力語言與知識技術發展
為了突破語言與知識技術在研發過程中面臨的數據匱乏、算力不足的瓶頸,百度聯合中國計算機學會、中國中文信息學會共同發布全球最大中文自然語言處理“千言”數據共建計劃。
百度千言目標(biao)覆蓋更(geng)豐富的任務(wu)類型,從語義理解、知識融(rong)(rong)合(he)(he)、跨(kua)模態融(rong)(rong)合(he)(he)等角度推動技術進(jin)步,同(tong)時(shi)提供能進(jin)行多維(wei)度綜合(he)(he)評價的數據集。
據(ju)(ju)百(bai)度技術委員會主席(xi)吳華(hua)介紹,千言(yan)一期項目由來自國內(nei)11家高校(xiao)和(he)企業(ye)的數據(ju)(ju)資(zi)源研發(fa)者(zhe)共同建設,已涵(han)蓋(gai)開放域(yu)對話、閱(yue)讀理解(jie)等(deng)7大(da)任務,20余個中文開源數據(ju)(ju)集(ji)。
未來三年,百度計劃面向超20個任務,收集和建設不少于100個中文自然語言處理數據集,覆蓋知識圖譜、語言理解、語言生成、跨模態融合、NLP 應用系統等多個領域。
吳(wu)華談到,算力(li)是語言(yan)與知(zhi)識技術(shu)發展中面臨的另一大挑戰(zhan),超大規模深度(du)學習模型帶來顯著(zhu)效果提升的同時,算力(li)的需求也呈現出(chu)指數(shu)級的增長(chang)。
因此,吳華正式發布了語言與知識算力共享計劃,通過百度AI STUDIO平臺,百度將提供價值一億元的免費算力支持,幫助廣大開發者更好地專注技術創新。
結語:百度NLP技術版圖的十年布局
如(ru)王海峰(feng)所說,語(yu)言(yan)(yan)與(yu)知識技術(shu)是人工智能(neng)(neng)認(ren)知能(neng)(neng)力的(de)核(he)心。回顧這場峰(feng)會,我(wo)們也能(neng)(neng)看到(dao)過去(qu)十年(nian)百(bai)度在語(yu)言(yan)(yan)與(yu)知識領域(yu)的(de)技術(shu)發展(zhan)和產(chan)業布(bu)局,如(ru)今已(yi)逐步(bu)構建起一套成熟和豐富的(de)NLP技術(shu)版圖。
下一個十年,百度的(de)NLP技術(shu)布局還會給我們帶來(lai)哪些驚(jing)喜?它能(neng)否推動(dong)行業(ye)離通(tong)用人工智能(neng)(AGI)的(de)目標(biao)更近一步(bu)?我們拭目以待。