智東西(公眾號:zhidxcom)
作者?|?程茜
編輯?|?漠影

智(zhi)東西5月6日報道,今天(tian)下午,訊飛星火認知大模型發布(bu),以(yi)及(ji)大模型在(zai)教育、辦公、汽車、數字員工行(xing)業領域(yu)的(de)應用(yong)成果同(tong)步亮(liang)相。

同時,科大訊飛還提出了通用人工智能(AGI)在7大維度481項的評測體系,這七大維度包括文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力。經科大訊飛評測對比,星火認知大模型已經在文本生成、語言理解、數學能力上(shang)優于ChatGPT。

訊飛星火大模型采用了“1+N”的整(zheng)體布局,其中“1”是(shi)通用認知智能(neng)大(da)模型,包含(han)7大(da)維度(du)的能(neng)力(li),“N”是(shi)大(da)模型在教(jiao)育、辦公、汽(qi)車、數(shu)字(zi)員(yuan)工等多個行業領域的應用。

科大訊飛董事長劉慶峰還透露了星火認知大模型在2023年的關鍵里程碑,6月9日,星火認知大模型將突破開放式問答,實現多輪對話能力再升級、數學能力再升級;8月15日,突破代碼能力、實現多模態交互再升級;10月24日,通用大模型要對標(biao)ChatGPT能(neng)力(li),實(shi)現中文(wen)能(neng)力(li)超越、英(ying)文(wen)能(neng)力(li)相當的目(mu)標(biao)。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

▲科大訊(xun)飛董事長劉慶峰

劉慶(qing)峰認為,當下認知大模(mo)型已經(jing)成為通用(yong)人工智能的(de)(de)曙光(guang),這一技術(shu)的(de)(de)出現產生(sheng)的(de)(de)影響不亞于PC或互聯網(wang)的(de)(de)誕生(sheng)。

一、七大通用能力現場演示,語音輸入、實時互動

劉慶峰(feng)談道,從(cong)ChatGPT關注的48個主(zhu)要(yao)任務方向和訊飛開(kai)放平臺(tai)上(shang)400多萬開(kai)發者團隊(dui)的需(xu)求分析,通(tong)用(yong)人(ren)工智能(neng)(neng)應該具備七大(da)維度能(neng)(neng)力(li),分別是文本生成(cheng)、語言理(li)解、知識問答、邏輯推(tui)理(li)、數學能(neng)(neng)力(li)、代(dai)碼能(neng)(neng)力(li)、多模態能(neng)(neng)力(li)等。

因(yin)此,現場星火認知(zhi)大模型基(ji)于這七(qi)大維度(du)進行了演示(shi),并(bing)且(qie)現場輸入完全通過語(yu)音轉寫文字(zi)鍵入需求(qiu),無需打字(zi)輸入。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

一開(kai)始(shi),星火(huo)認知大模(mo)型就展示了自己名字的由(you)來(lai)。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

1、多風格多任務長文本生成

首先,星火(huo)認(ren)知(zhi)大模(mo)型為這場發布會生成了一篇(pian)歡(huan)迎詞,“今天是訊飛星火(huo)認(ren)知(zhi)大模(mo)型的(de)發布會,現場高(gao)朋滿座,我們也特(te)別希望(wang)和(he)各位朋友們精誠(cheng)合(he)作(zuo),共(gong)同建(jian)設美好(hao)世界。請(qing)幫我寫(xie)一篇(pian)歡(huan)迎詞”。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

在(zai)故事(shi)生(sheng)成能力上,星火認知大模型也毫不遜色,“在(zai)今天的(de)訊(xun)飛星火認知大模型的(de)發布會上,孫悟(wu)空和奧特曼也偷偷潛入(ru)了現場,他們都搶(qiang)著想做星火大模型的(de)發言(yan)人,還(huan)為(wei)此吵了一(yi)架(jia),根(gen)據上述信(xin)息(xi)來(lai)創作一(yi)個故事(shi)”。

星(xing)火認知大(da)模(mo)型不僅(jin)將孫悟(wu)空和奧特曼的相關情節(jie)描述(shu)得十分(fen)生(sheng)動(dong),還在故事中引入了(le)另一個主要人物“一位白發蒼蒼的老(lao)者”來保(bao)證故事情節(jie)的完整性。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

星火還能幫助用戶起草工作郵(you)件(jian),如“幫我寫(xie)一封內部工作郵(you)件(jian)發給訊(xun)飛(fei)翻(fan)譯(yi)機(ji)團隊,針對五(wu)一的銷售計(ji)劃,明天上午9點在201會議室(shi)討論訊(xun)飛(fei)翻(fan)譯(yi)機(ji)4.0新品的營銷計(ji)劃和產(chan)品功能”。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

此外,在多語言生成(cheng)中,星火還可以(yi)快速生成(cheng)“英文的訊飛翻(fan)譯機4.0新品品宣文案”。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

有趣的是,當(dang)你將文案發布情(qing)境設定到小(xiao)紅(hong)書(shu)時(shi),星火(huo)也可以(yi)快(kuai)速轉換(huan)語言(yan)風(feng)格重新(xin)生成文本。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

劉慶峰說,經過評測,訊飛星火認知大模型的中文語言理解能力已經超過ChatGPT,在英文理解能力上,ChatGPT的能力達到4.48分,星火認知大模型為4.29分

2、多層次跨語種語言理解

針對(dui)英(ying)文文案,星(xing)火(huo)還可以(yi)快速對(dui)其(qi)進行語(yu)法檢查和糾錯。劉慶(qing)峰透(tou)露(lu),對(dui)于英(ying)文語(yu)法、句式的糾錯能力(li),星(xing)火(huo)認知大模型已經做到業界最強。

當面對一些模(mo)(mo)棱兩可的話語需要大(da)模(mo)(mo)型更高層次的理解能(neng)力時,星火(huo)認知大(da)模(mo)(mo)型也可以準確剖析其不同含義。如“俗(su)話說(shuo)男(nan)子(zi)漢大(da)丈夫(fu)(fu)要寧(ning)死不屈,俗(su)話又(you)說(shuo),男(nan)子(zi)漢大(da)丈夫(fu)(fu)能(neng)屈能(neng)伸(shen),這兩種說(shuo)法(fa)應(ying)該怎么理解”。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

放到具(ju)體(ti)情境中,“如果有(you)個小伙子和女朋友吵(chao)架了,他(ta)應該寧死(si)不(bu)屈(qu)還是能屈(qu)能伸”,星火也可以準確回(hui)復。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

對(dui)于一些文字表(biao)意一樣,但含義不同的(de)詞語,如“今(jin)天小(xiao)明參加比賽(sai)拿到冠軍,他拿著獎杯(bei)默(mo)默(mo)地(di)站(zhan)了(le)一分(fen)(fen)鐘,今(jin)天我被(bei)老師批評了(le),走(zou)出(chu)教室后(hou)我默(mo)默(mo)地(di)站(zhan)了(le)一分(fen)(fen)鐘,請問上面這(zhe)兩(liang)個‘默(mo)默(mo)地(di)站(zhan)了(le)一分(fen)(fen)鐘’,分(fen)(fen)別表(biao)達(da)了(le)什么樣的(de)心情(qing)?”

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

星火(huo)還(huan)可以使用(yong)上面“默默地站了一分(fen)鐘(zhong)”組詞,并且(qie)能根據(ju)具體需求(qiu)生成相應句子。重(zhong)新生成后,星火(huo)也會輸出(chu)完(wan)全不同的幾個句子。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

可以看出(chu),星火(huo)是確(que)實理解了文字背(bei)后的(de)含義再進(jin)行文本輸出(chu)。

對于語言理解能力,劉慶峰透(tou)露, 和國(guo)內可(ke)測的(de)現有(you)系統相比,星火認(ren)知大(da)模型(xing)明(ming)顯遙(yao)遙(yao)領先,與ChatGPT有(you)細微(wei)差(cha)距。

3、泛領域開放式知識問答

飲(yin)食(shi)類問題中,當詢問“菠菜(cai)和(he)豆腐(fu)能不(bu)能一起吃”,星火給出了專(zhuan)業的(de)答案。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

在科技領(ling)(ling)域,星火也(ye)能應(ying)(ying)對“量子科技主要有哪些(xie)應(ying)(ying)用(yong)領(ling)(ling)域?”的問題。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

當將兩(liang)個不同(tong)的概念(nian)放到一(yi)起,如“量(liang)子糾纏和心靈感應是不是一(yi)回事”,星火(huo)也沒有被繞(rao)暈(yun)。劉慶峰透露,在中(zhong)國科學院的支持(chi)下,星火(huo)仍在持(chi)續(xu)學習科技(ji)領域(yu)的知識。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

對于專業性(xing)更強的(de)醫療領域,當問及“如果家中(zhong)老人突然暈倒,如何判(pan)斷是(shi)不(bu)是(shi)中(zhong)風?”,星火(huo)給(gei)出了四個判(pan)斷的(de)維度。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

當追問“能不能馬上(shang)(shang)把(ba)他扶(fu)到(dao)床上(shang)(shang)去休息”,星火也提出(chu)了專業的建議。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

劉慶峰談道,目前在(zai)醫療(liao)治理方(fang)(fang)面(mian),科大訊飛智醫助理的能(neng)力比GPT-4要(yao)強(qiang)很多,但由于(yu)醫療(liao)領(ling)域對專(zhuan)業性的更(geng)高(gao)要(yao)求,這一方(fang)(fang)面(mian)能(neng)力的開放需要(yao)更(geng)加謹(jin)慎,將于(yu)今年(nian)訊飛1024開發者節期間正式發布。訊飛的目標是讓(rang)星火大模型不僅要(yao)成為醫生的診療(liao)助手,還能(neng)成為每個(ge)人的健(jian)康助手。

4、情境式思維鏈邏輯推理

當提問(wen)“孔子在2008年的(de)奧(ao)運(yun)會上說了什么?”,星火可以(yi)快速理解“孔子不可能(neng)出現在2008年的(de)奧(ao)運(yun)會上”。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

換一個風(feng)格(ge)后,星火還能編出“孔(kong)子(zi)在2008年奧運會上給大家做漢語培訓”的故事。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

面對更(geng)復雜的(de)邏輯問題,“當黃兔、黑兔、白(bai)兔在(zai)(zai)賽跑(pao),黑兔說自己跑(pao)的(de)不是最快,但(dan)比(bi)白(bai)兔快,誰跑(pao)的(de)最快,誰跑(pao)的(de)最慢”,涉及三個主體的(de)推(tui)理問題時,星火(huo)第(di)一次生成(cheng)的(de)答案在(zai)(zai)“誰跑(pao)的(de)最快”上出現了偏差。重新生成(cheng)后,星火(huo)也快速給出了正確答案。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

5、多題型可解析數學能力

在一些容易混(hun)淆的數(shu)字問題上,如“某(mou)個公(gong)司(si)的股票昨天漲(zhang)了(le)10%,今天又(you)跌(die)了(le)10%,請(qing)問到底是漲(zhang)了(le)還(huan)是跌(die)了(le)”,星火也(ye)沒有被(bei)難倒(dao)。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

幾何問(wen)題中(zhong),但(dan)問(wen)到“等腰(yao)三(san)(san)角(jiao)形的(de)底角(jiao)是(shi)頂(ding)角(jiao)的(de)兩倍,這一三(san)(san)角(jiao)形的(de)角(jiao)度是(shi)多少”,星火(huo)給出(chu)了下面(mian)的(de)答(da)案:

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

6、多功能多語言代碼能力

目(mu)前(qian)星火(huo)的代碼生成能(neng)力是針對工業(ye)互聯網、企業(ye)內部的應用(yong)。

當(dang)問到(dao)“用代碼找出(chu)1到(dao)100之內(nei)的所有(you)質數”,星火輸出(chu)了(le)Python代碼實(shi)現(xian)過程和(he)最終結果。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

7、多模態輸入和表達能力不斷豐富

在多(duo)模態能力上,星火可以(yi)把(ba)圖片中的英(ying)文(wen)翻譯成中文(wen)。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

并且,星火(huo)還可(ke)(ke)以(yi)化身一個美食助手,可(ke)(ke)以(yi)回(hui)答每道(dao)菜是什么口(kou)味等問題。大模(mo)型的(de)加持下,星火(huo)可(ke)(ke)以(yi)從簡單的(de)文字到文字翻譯變為文字到導游角色的(de)升(sheng)級。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

文(wen)字輸(shu)(shu)出(chu)方面(mian),星(xing)火(huo)以立夏為主題,生成了一篇200字左右的散(san)文(wen)。同時,星(xing)火(huo)還支持用語音、虛(xu)擬(ni)人合成輸(shu)(shu)出(chu)音頻和視頻。在視頻中(zhong),不僅有女生的虛(xu)擬(ni)人形象,還有相對應的背景畫(hua)面(mian)、虛(xu)擬(ni)人手勢隨著文(wen)字內(nei)容變化。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

劉慶峰透露,多模態輸入和表達(da)目前還沒有開放,這一能力將(jiang)在8月(yue)份開放給VIP客戶(hu)使(shi)用。

演示現場還有現場隨機抽(chou)取問題回(hui)答環節,針對于一些奇奇怪怪的(de)(de)問題,星(xing)火認知大(da)模型也沒有被難到。包括外(wai)星(xing)人感(gan)冒了需要戴口(kou)罩嗎?我想(xiang)把四十(shi)平的(de)(de)房(fang)子裝(zhuang)修成七十(shi)平的(de)(de)感(gan)覺等。

在輸(shu)出的(de)答案中,星火(huo)大模型會對問題場景(jing)進行一些(xie)限(xian)制,考(kao)慮到多個場景(jing)來使(shi)得回答更(geng)為(wei)準(zhun)確(que)。劉慶峰說,星火(huo)大模型在不斷(duan)的(de)進步過程(cheng)中,很(hen)多答案也(ye)會超出他們的(de)預期。

二、落地四大應用領域,星星之火“燎原”教育、辦公、汽車、數字員工

除了強大的通用能力外(wai),星火認知(zhi)大模型(xing)也(ye)已經在實實在在的產(chan)業(ye)場景中實現了應(ying)用落(luo)地,包括教育、辦公、汽車和數字員工四大領域。

1、教育:批改中英文作文能力升級,形成批改、修訂、學習閉環

訊飛(fei)AI學(xue)(xue)習(xi)機已經可(ke)以精準分析每個學(xue)(xue)生的薄弱環節,并在五萬多所中小學(xue)(xue)校實現(xian)應(ying)用。此次,星火(huo)大模型也(ye)再次將學(xue)(xue)習(xi)機的語言學(xue)(xue)習(xi)能力升級(ji)。

此前,老師對(dui)一個學生的(de)作文(wen)進行精(jing)批大(da)概要(yao)花(hua)費(fei)半個小時時間,批改完一個班的(de)學生會(hui)付出大(da)量(liang)的(de)時間成本。

在演示中,星火認(ren)知大模型針對小學(xue)四年(nian)級上冊第八單(dan)元的(de)作文“我的(de)心(xin)兒怦(peng)怦(peng)跳”的(de)寫(xie)作要(yao)素(su)和寫(xie)作要(yao)求(qiu)進行批改。

學習機批改的過程包括錯別字、語句、內容,最后會生成批改評價以及寫作建議,并且用戶點擊錯別字還能(neng)看到相(xiang)應的知(zhi)識卡(ka)片。

批改修訂建議還(huan)會用不同顏色區分,紅色代表不符(fu)合某(mou)一條(tiao)寫(xie)(xie)作要(yao)求,綠色代表符(fu)合寫(xie)(xie)作要(yao)求,此外(wai),學習機還(huan)給出了優化參考內(nei)容。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

在英文作文批改方面,學習機會批改單詞拼寫、詞匯用法(fa)、句型(xing)結(jie)構,最后(hou)同樣會給出(chu)內(nei)容評(ping)價。

并且,學習機(ji)在作文有錯(cuo)誤的地(di)方(fang)會給(gei)出相對應的學習資(zi)料,完成基(ji)礎批改、高級批改、提示建議、優化(hua)參考(kao)的閉(bi)環過程。

劉慶峰談(tan)道:“這在業界是0到1的突破。”搭(da)載大模型的訊(xun)飛AI學習機(ji)在批改、修訂(ding)等(deng)的準(zhun)確率上已經超過了一般老(lao)師的平(ping)均水平(ping)。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

口語和聽說能力上,訊飛AI學習機可以在家庭里為用戶營造一個真實的對話環境,例如針(zhen)對(dui)“最愛的季(ji)節”這一開放(fang)式問答,訊飛學習機能夠和用戶實現類(lei)人(ren)對(dui)話。

并且英文(wen)口(kou)語對話中(zhong),如(ru)果用(yong)戶有(you)不會說的單詞,可以(yi)用(yong)中(zhong)文(wen)表述,星火認(ren)知大模(mo)型也能(neng)理解。

劉慶峰稱,這一功(gong)能今天已經(jing)在訊飛AI學(xue)習(xi)機(ji)上T20 Pro開放,此前已購買該(gai)設(she)備的(de)(de)用戶(hu)可以在線下(xia)載(zai)更新獲得功(gong)能。訊飛AI學(xue)習(xi)機(ji)上T20 Pro也是全球首款搭載(zai)大(da)模型(xing)的(de)(de)AI學(xue)習(xi)機(ji)。

2、辦公:快速生成紀要、摘要,音頻能一鍵轉化新聞稿件

訊(xun)飛(fei)此(ci)次通過星火大模型對辦公產(chan)品進行了(le)升級,包括訊(xun)飛(fei)智(zhi)能辦公本(ben)、錄(lu)音筆、訊(xun)飛(fei)聽見(jian)、智(zhi)能麥克風。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

現場劉慶峰(feng)講述了會議場景(jing)下,用戶(hu)往(wang)往(wang)有記(ji)不全(quan)、找不到、對數據安全(quan)性擔(dan)憂幾(ji)大痛點。智能辦公本可以通過語音轉(zhuan)文字、字音同步(bu)、離線模式(shi)錄音轉(zhuan)寫的(de)方式(shi)解決上(shang)述痛點。

搭載大模型的智能辦公本針對上述內容快速生成了會議紀要,不僅包含(han)文本摘要,還結合(he)了用戶(hu)的手(shou)寫(xie)筆(bi)記。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

在一些(xie)演(yan)講(jiang)場景(jing)下,演(yan)講(jiang)嘉賓(bin)的(de)口語表達會和書面成稿(gao)內容有(you)較(jiao)大差距,智能辦公本可以將重復的(de)語氣詞去掉并保(bao)留(liu)演(yan)講(jiang)中的(de)關鍵信息(xi),同時(shi)調整(zheng)口語語序,使其讀(du)起來更加(jia)通(tong)順。

劉慶峰介紹道,語篇規整能力可以實現(xian)原文忠實度保留(liu)96%以上(shang),原文篇幅縮小40%-60%,閱(yue)讀(du)效率提升50%以上(shang)。

訊飛(fei)(fei)智能(neng)辦公本(ben)X2也(ye)是業界首個搭載(zai)大模型(xing)的智能(neng)辦公硬件,同樣,用戶(hu)可以免費下載(zai)更新相關功能(neng)。他補充說,后續訊飛(fei)(fei)也(ye)會將大模型(xing)搭載(zai)到辦公的全系列產(chan)品上。

同時,訊飛聽見還支持一鍵成稿,用戶導(dao)入音(yin)頻(pin)后,就可以立即生成新聞(wen)稿(gao)件、品(pin)宣文案、工作總結、工作計劃(hua)、工作待辦等。

演(yan)示中,星火(huo)接收到一段音(yin)頻文(wen)(wen)件后,先進行了音(yin)頻轉寫,再根據用戶需求(qiu)生(sheng)(sheng)成相應的(de)(de)文(wen)(wen)稿。同(tong)時,當用戶輸入(ru)了想要(yao)在這(zhe)篇“新(xin)聞稿件”中涉及的(de)(de)關(guan)鍵(jian)(jian)信息后,智能辦公本會(hui)將標(biao)題、內容重(zhong)新(xin)生(sheng)(sheng)成,并(bing)重(zhong)點突(tu)出描述(shu)這(zhe)一關(guan)鍵(jian)(jian)信息。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

劉(liu)慶峰(feng)說,現在登陸訊飛(fei)(fei)(fei)聽(ting)見(jian)的官網可以馬上運用這(zhe)些功能。除此以外,訊飛(fei)(fei)(fei)智能錄音筆SR702和訊飛(fei)(fei)(fei)智能麥克風M2也升級了(le)會議紀要(yao)、語篇(pian)調整、一鍵成稿功能。

3、汽車:人車對話更加智能,汽車上也能訂餐、購票

科(ke)大(da)訊飛汽車座艙人(ren)機交(jiao)互系統可以提供多輪、多人(ren)、多區域(yu)、多模(mo)態的智(zhi)能汽車人(ren)機交(jiao)互范式,在星(xing)火大(da)模(mo)型的加持(chi)下(xia),這一交(jiao)互模(mo)式可以讓用戶(hu)在車上的對話更(geng)加自由、更(geng)人(ren)性化(hua)、更(geng)懂(dong)汽車、更(geng)加開放。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

同時,星(xing)火大(da)模型還支持各種(zhong)插件在汽車(che)場景下與之行結合,如汽車(che)的導航、餐飲、購票(piao)等功能都可以用星(xing)火大(da)模型實現(xian)。

在演示視頻(pin)中,用戶可以和汽車上的(de)人機交互系統對話(hua),詢問旅游計劃、避(bi)開(kai)節假(jia)日人流密集的(de)旅游路線、生成故事(shi)、接聽電(dian)話(hua)等。

劉慶峰說,這樣一來,汽車上的體(ti)驗和原來會完全不同(tong),人們在汽車里(li)生(sheng)活(huo)、工作的效(xiao)率(lv)也(ye)會上一個臺(tai)階(jie)。

4、數字員工:生成式自動RPA,自然語言自動生成業務流程

此前,科大訊飛虛擬人(ren)智能交互機可以通(tong)過虛擬形象(xiang),以對話的(de)形式扮演導游、虛擬客服、醫院導診、志愿者服務等角色(se),這些(xie)更人(ren)性化的(de)交互機也大幅提高了(le)各行業的(de)工(gong)作效率(lv)。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

在演示過程(cheng)中,基于星火認知(zhi)大(da)模(mo)型的(de)(de)生成式RPA能夠(gou)讓工作人員(yuan)通過自然(ran)語言輸入(ru),大(da)模(mo)型去理解員(yuan)工通過自然(ran)語言描述的(de)(de)需(xu)求,自動生成業務流程(cheng)和可執(zhi)行(xing)的(de)(de)RPA能力清單,并調度RPA的(de)(de)執(zhi)行(xing)能力實現流程(cheng)自動化(hua)的(de)(de)運行(xing)。

這一能力(li)在人力(li)資(zi)源領(ling)域的應用也(ye)已(yi)經在訊(xun)飛內(nei)部實現場(chang)景落地(di)。

劉慶峰(feng)透(tou)露,下一(yi)步,訊飛星火認知大模型還(huan)會賦能城市、工業等(deng)各(ge)個行業。

三、應用落地引領者,用評測體系指明大模型發展前路

作為(wei)國(guo)內人工(gong)智能領域(yu)國(guo)家(jia)隊,科大訊(xun)飛(fei)早在2011年就肩負起語音及語言(yan)處(chu)理國(guo)家(jia)工(gong)程實驗室的重任(ren)。

2014年(nian)(nian),科大訊飛推出“訊飛超腦(nao)計劃”,明確提出要(yao)讓(rang)(rang)機器像人(ren)一樣(yang)具備能(neng)理解會(hui)思考的(de)能(neng)力(li),2022年(nian)(nian),這一計劃升(sheng)級為“訊飛超腦(nao)2030計劃”,提出讓(rang)(rang)懂知識、善學習、能(neng)進化的(de)通用(yong)人(ren)工(gong)智能(neng)技術成為每個(ge)人(ren)未來發展(zhan)的(de)重要(yao)機會(hui),讓(rang)(rang)機器人(ren)走(zou)進家(jia)庭。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

星火認知智能大模型也是這一(yi)計(ji)劃(hua)的重要(yao)一(yi)環(huan)。劉(liu)慶(qing)峰談道,在科學常識推理能力中,單模型已經(jing)超過了人類(lei)平均水(shui)平。

事實(shi)上,去(qu)年11月30日ChatGPT發布(bu)會,科大訊飛就迅速(su)進行了(le)相關技術和研發體系驗(yan)證,12月15日啟動了(le)認(ren)知(zhi)智(zhi)能大模型(xing)的“1+N”專項(xiang)攻關。

他認為,想要讓這一次智慧涌現的認知智能真的解決社會剛需,要建立一套實實在在的科學系統的評測體系,來告訴這個行業“技術發展到了什么程度、下一個發展趨勢應該往哪邊走?”

因此,科(ke)大(da)訊(xun)飛與中科(ke)院人(ren)工智(zhi)能(neng)產學(xue)研創新(xin)聯(lian)盟和長(chang)三角(jiao)人(ren)工智(zhi)能(neng)產業(ye)鏈聯(lian)盟共同探討形(xing)成了(le)覆蓋7大(da)類481個(ge)細分任務類型的科(ke)學(xue)系統評測(ce)體系。

訊飛版大模型來了!首發通用人工智能評測體系,三大能力不輸ChatGPT

當下,劉慶(qing)峰也談道(dao),純(chun)大模型技術有很多待攻克(ke)的(de)技術缺陷,如對新(xin)知(zhi)識難以(yi)及時更(geng)新(xin)、事實類(lei)問題容易發生張冠(guan)李戴的(de)現象等。

但對(dui)于(yu)這些(xie),訊(xun)(xun)飛都有非常明確(que)的(de)解決方案。他透露在科大訊(xun)(xun)飛成立24周年(nian)之際,星火大模型要(yao)突(tu)破開放式問答(da),類(lei)搜索插件可以全部知道新知識,通過多輪對(dui)話進行升級,數(shu)學能(neng)力再上一個(ge)新的(de)臺階。

這都(dou)得(de)益于(yu)科(ke)大(da)訊(xun)飛(fei)此前在人工智(zhi)能領(ling)域的技術積累,以及在認知智(zhi)能領(ling)域取(qu)得(de)的領(ling)先成果。如2017年科(ke)大(da)訊(xun)飛(fei)讓機器在全(quan)(quan)球首(shou)次(ci)通(tong)過國家職業醫(yi)師資格考試、超(chao)過了96.3%參加考試的醫(yi)生,并且在SQuAD機器閱讀理解(jie)中(zhong)全(quan)(quan)球首(shou)次(ci)超(chao)過人類平均水平,2022年在OpenBookQA科(ke)學知識推理中(zhong),單(dan)模型也(ye)超(chao)過人類平均水平。

作為將大(da)模(mo)(mo)型率先(xian)應用落地的玩(wan)家,科大(da)訊飛(fei)還通過訊飛(fei)開放平臺開放了560項(xiang)AI能力(li),并且有首批來自(zi)36個行業(ye)的3000余家企(qi)業(ye)開發(fa)者將接入星火大(da)模(mo)(mo)型。基于此,科大(da)訊飛(fei)將聯合行業(ye)合作伙伴(ban)共建大(da)模(mo)(mo)型“星火”生態,讓大(da)模(mo)(mo)型能真正落地到行業(ye)中去。

結語:訊飛打響大模型應用落地“第一槍”!

大模(mo)型的(de)真正價值(zhi)在于(yu)成為生產力工具(ju),使得(de)產業(ye)應(ying)用真正與前沿技術相結合。當下,大模(mo)型也已經進入產業(ye)落地(di)的(de)關鍵期。

科大(da)訊飛此(ci)前(qian)在認知(zhi)智能領域的技術積累優(you)勢(shi),以及在教育、辦公等(deng)場景下的深耕(geng)使得其成為大(da)模型(xing)應(ying)用落地的率先(xian)突破者。

同(tong)時,AI新的(de)技(ji)(ji)術(shu)革命已經到來,正在對各(ge)行(xing)各(ge)業產(chan)生深遠影響(xiang),訊飛星(xing)火大模型的(de)應用成果發布將進(jin)一步助攻大模型AI技(ji)(ji)術(shu)在各(ge)行(xing)各(ge)業的(de)規模化普(pu)及。