
智東西(公眾號:zhidxcom)
作者?|?程茜
編輯?| 心緣
智東西10月(yue)24日報道,今天(tian),2024科大訊飛全(quan)球1024開發者節上(shang),科大訊飛星火大模型再(zai)次重磅升級,星火4.0 Turbo多(duo)項能力全(quan)面超過GPT-4 Turbo。
訊飛星火大模型4.0 Turbo在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力七大能力中全面超過GPT-4 Turbo,數學能力、代碼能力超過GPT-4o,星(xing)火4.0 Turbo效(xiao)率相對提升50%。
此外科大訊飛還首發了星火(huo)(huo)(huo)超擬(ni)人數字人、星火(huo)(huo)(huo)多語言(yan)大(da)模型、汽車端側星火(huo)(huo)(huo)大(da)模型。面向醫療、教育、工業等場景,科大訊飛首發基于“問題鏈”的高中(zhong)數學智能(neng)教師助手,以及實現了訊飛星火醫療大模型2.0的六大核心場景能力升級,同時發布訊飛星火醫學(xue)影(ying)像大模型。
基礎設施層面,科大訊飛董事長劉慶峰宣布科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大(da)規模智算(suan)平臺“飛星(xing)二號”正式啟動。
劉慶峰公布了科大訊飛亮相星火大模型一年來的應用落地成績單:訊飛(fei)星(xing)火央國企中標第(di)(di)一(yi)、教育醫療(liao)市(shi)(shi)場(chang)第(di)(di)一(yi)、智能(neng)(neng)(neng)汽車(che)市(shi)(shi)場(chang)第(di)(di)一(yi)、智能(neng)(neng)(neng)硬件市(shi)(shi)場(chang)第(di)(di)一(yi)、工業大模(mo)(mo)型(xing)第(di)(di)一(yi)、賦(fu)能(neng)(neng)(neng)科(ke)研應用第(di)(di)一(yi)、大模(mo)(mo)型(xing)開發者生態第(di)(di)一(yi)。
具體的一(yi)些數據指標為,2024年1-9月(yue),訊飛(fei)星火(huo)智(zhi)能硬件GMV同比提升50%,截(jie)至10月(yue)23日,雙十一(yi)大(da)促全渠(qu)道GMV同比增長280%;訊飛(fei)星火(huo)App安卓平(ping)臺(tai)累計下載量2億。
一(yi)開場,劉慶峰就展示了幾(ji)個科(ke)大訊飛應(ying)用落地的典型案(an)例。
科大訊飛和華為聯合研發了小藝(yi)聲音修(xiu)復,能讓特殊(shu)人群的發音更(geng)加(jia)清晰,實(shi)現(xian)正常交(jiao)流(liu)。
硬件方面,科大訊飛基于翻譯技術打造的多語種AI翻譯透明屏,能幫助用(yong)戶通過這塊透明顯(xian)示(shi)屏(ping)實現無障(zhang)礙(ai)交流。
從檢測(ce)(ce)空調到(dao)檢測(ce)(ce)智(zhi)能汽車(che),科(ke)大訊飛的VIAS智(zhi)能座艙人機交互(hu)效果評測(ce)(ce)機器人,目前在測(ce)(ce)試場景能覆蓋車(che)控(kong)、導航等(deng)1383個功能點,達到(dao)了(le)人工檢測(ce)(ce)的90%以(yi)上(shang),測(ce)(ce)試提效10倍(bei)。
一、七大能力超GPT-4 Turbo,首發超擬人數字人
訊飛星火4.0 Turbo實現了七大能力全面超過GPT-4 Turbo,其中數學能力、代碼能力超過GPT-4o,星火4.0 Turbo效率相對提升50%。同時,在國內外中英文14項主流測試集中,星火4.0 Turbo拿下9項第一。
在數學能力中,星火4.0 Turbo的標準考(kao)試(shi)任務能力、實(shi)用數(shu)學任務均超過GPT-4o。劉慶峰介紹,該模型已經完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可以實現類o1的(de)高(gao)難度數學能力顯著提升。
代碼能力層(ceng)面,在(zai)HumanEval測試集(ji)上(shang),星火4.0 Turbo性能已超越GPT-4o,并且針對個人開發者,科大(da)訊(xun)飛還推出7B版本,支(zhi)持(chi)大(da)模(mo)型在(zai)本地運行。
科大訊飛(fei)將萬物互聯時代(dai)的多模(mo)AIUI交互標(biao)準進一步擴展,從此(ci)前的遠(yuan)場高噪(zao)、全雙工(gong)、多語(yu)種多方言(yan)、多模(mo)態,延伸到(dao)了超(chao)擬人、個性化(hua)。
基于星火大模型,科大訊飛的語音交互拓展到了音視頻流的實時多(duo)模交互(hu)。
首次發布的星火超擬人(ren)數字人(ren),可以實現口唇、表情、動作的語義(yi)貫穿(chuan),用大模(mo)型自動生成(cheng),并保(bao)持(chi)語義(yi)一致(zhi)性(xing)。
科(ke)大訊飛副總裁、研究院(yuan)(yuan)院(yuan)(yuan)長劉聰現(xian)場進行了(le)真機演(yan)示,超(chao)擬人數字人可以展現(xian)出目(mu)瞪口呆、賣萌(meng)的(de)表情,實時與用戶實現(xian)交流。
并且,超(chao)擬人數字人還(huan)擁有實時(shi)視頻流的動(dong)態(tai)交(jiao)互能力。用(yong)戶只要打開攝像頭(tou),將其(qi)對準想(xiang)要詢(xun)問的畫面(mian)就(jiu)能對動(dong)態(tai)畫面(mian)進行實時(shi)交(jiao)互提問。
劉聰演(yan)示過程中,在桌子上擺了孫悟空、奧特曼、怪獸的玩偶,超擬(ni)人(ren)數(shu)字人(ren)直接(jie)根據玩偶的站(zhan)位變化,講述(shu)了一個生動的故事。
旅(lv)游(you)場景中,超擬人數字人還(huan)能幫你快(kuai)速了解(jie)挑選的(de)化妝(zhuang)品(pin)、禮(li)品(pin)的(de)信息(xi),同(tong)時也能快(kuai)速識別(bie)花(hua)草,以及種植花(hua)草的(de)注意點。
用戶還(huan)能一張照(zhao)片(pian)生成自(zi)己的虛(xu)擬人(ren),一句話創建發(fa)音(yin)。在(zai)虛(xu)擬人(ren)的編輯頁面,用戶可以(yi)自(zi)主選(xuan)擇聲(sheng)音(yin)或者讀一句話創建自(zi)己的擬人(ren)發(fa)音(yin),也可以(yi)調(diao)整(zheng)自(zi)己的人(ren)像照(zhao)片(pian)、性格等(deng)。
下面就是演示(shi)過程中,劉聰創建(jian)的數字人(ren)。
超擬(ni)人數字人的聲音(yin)自然度達到(dao)4.2分(fen),劉慶(qing)峰稱,最好的播音(yin)員可以達到(dao)5.0分(fen)左(zuo)右,真人水平一般為4.0分(fen)左(zuo)右。
此外,在遠(yuan)場(chang)高噪場(chang)景,今年9月,科(ke)大(da)訊飛在語音識別(bie)領域的賽事CHiME-8奪冠(guan),并(bing)拿下連(lian)續五連(lian)冠(guan)。當下,科(ke)大(da)訊飛的語音識別(bie)也首次實現全國地(di)級市方(fang)言全覆蓋,包括288個地(di)市202種(zhong)方(fang)言。
二、首發八個語種多語言大模型,1.3B汽車端側大模型
基于(yu)全新(xin)發(fa)布的星(xing)火(huo)4.0 Turbo,科大(da)訊飛首(shou)發(fa)了星(xing)火(huo)多語(yu)言大(da)模型(xing)、汽車端側星(xing)火(huo)大(da)模型(xing)。
星火(huo)多語言大模型首批可以支(zhi)持中文、英語之外的八個語種(zhong),其能(neng)力整體達到GPT-4o 96%的水(shui)平,多行(xing)業(ye)任務場(chang)景效(xiao)果超過GPT-4o。
與(yu)此(ci)同時,多語言的(de)交互也(ye)為汽車的(de)智能交互提供了工具。
基(ji)于(yu)大(da)模(mo)型(xing)能力,用戶與汽車(che)的交互(hu)已經從導航、命令控制等(deng)基(ji)礎應(ying)用交互(hu),提升(sheng)到包括(kuo)用車(che)助手、旅行家等(deng)應(ying)用層面,使得活躍用戶的日均(jun)交互(hu)從7次(ci)提升(sheng)到了18次(ci)。
為了讓大(da)模(mo)型直接在汽車部署,科大(da)訊飛(fei)發布了參(can)數(shu)規模(mo)為1.3B的汽車端側(ce)(ce)星(xing)火大(da)模(mo)型,相比于參(can)數(shu)規模(mo)更大(da)的模(mo)型,其(qi)效果損(sun)失≤1%,端側(ce)(ce)首響40ms,端云融(rong)合交互(hu)低(di)至(zhi)1.3s。
2024年第四季(ji)度,該(gai)模(mo)型將(jiang)會在奇瑞、廣(guang)汽、長城將(jiang)有多款車型陸續上市開售。
在(zai)交互之外(wai),科(ke)大訊飛正(zheng)在(zai)與開發伙伴一起為車企構(gou)建豐富智能體生態,包括汽車內的(de)支付、影視(shi)等。
三、深入教育、醫療、法律場景,用AI過濾作業、診斷醫療影像
訊飛星火大模型的軟硬件(jian)已(yi)經在教育(yu)、醫療等場景實現(xian)了深入應用。
1、教育:高中數學教師助手,用AI過濾作業必答題、選做題
在教(jiao)育領域,科大訊(xun)飛(fei)首發(fa)了基于“問(wen)題(ti)鏈(lian)”的高中數學智能(neng)教(jiao)師(shi)助手,并邀請12個區域的50多位數學教(jiao)研員、400多位教(jiao)師(shi)人(ren)員共創。這一教(jiao)師(shi)助手可以(yi)幫(bang)助老(lao)師(shi)定位孩(hai)子薄(bo)弱環節,進行啟發(fa)式(shi)講解。明天,科大訊(xun)飛(fei)還將發(fa)布帶有智能(neng)教(jiao)師(shi)助手的星(xing)火智慧(hui)黑板2.0。
面向家庭(ting)學習(xi),科大訊(xun)飛發布了搭載到學習(xi)機(ji)上(shang)的AI作(zuo)業(ye)過濾器(qi),能夠幫助學生(sheng)對作(zuo)業(ye)、考題篩選(xuan),基(ji)于(yu)其對學生(sheng)的知識習(xi)得能力等進行判斷(duan),選(xuan)出(chu)學生(sheng)的分為必答題、選(xuan)做(zuo)題和可不做(zuo)題。這(zhe)一功能預(yu)計在11月中旬上(shang)線。
2、醫療:醫療大模型六大核心場景升級,發布醫學影像大模型
訊飛星(xing)火醫療(liao)大模型此前(qian)發(fa)布的功能包括(kuo)智(zhi)醫助理、智(zhi)慧醫院、訊飛曉醫等。
其中(zhong)智醫(yi)助理(li)(li)已經在611個區縣,完成(cheng)了(le)8.6億輔助診斷次數(shu),8100萬不合理(li)(li)處(chu)方提示;智慧醫(yi)院完成(cheng)了(le)5000萬次AI患者(zhe)服務(wu),完成(cheng)6億次疾(ji)病(bing)隨訪;訊飛曉醫(yi)的下載量達(da)到(dao)1500萬次,完成(cheng)了(le)1.1億次AI咨詢。
在此基礎上,訊飛星火醫療大模型2.0實現了六大核心場景能力升級,包括醫(yi)(yi)療(liao)(liao)(liao)海(hai)量知識問(wen)答、醫(yi)(yi)療(liao)(liao)(liao)復雜語言理解、醫(yi)(yi)療(liao)(liao)(liao)診斷治療(liao)(liao)(liao)推薦、醫(yi)(yi)療(liao)(liao)(liao)專業文書生成(cheng)、醫(yi)(yi)療(liao)(liao)(liao)多輪(lun)交互、醫(yi)(yi)療(liao)(liao)(liao)多模態交互。
在細分的醫(yi)學影(ying)像(xiang)方面,目前圍繞(rao)醫(yi)學影(ying)像(xiang)的診斷(duan)治療,存(cun)在影(ying)像(xiang)科(ke)醫(yi)生(sheng)(sheng)數(shu)量相(xiang)對(dui)不(bu)足、拍片質量參(can)差不(bu)齊(qi)、重(zhong)復影(ying)像(xiang)檢查發生(sheng)(sheng)率達到(dao)41.82%的問題。
在此背景(jing)下,安徽省(sheng)實(shi)現(xian)了全(quan)國應用(yong)規(gui)模最大的影像云(yun)平臺,實(shi)現(xian)了一次(ci)檢查全(quan)省(sheng)互通互認(ren)。
科大訊飛(fei)發(fa)布(bu)訊飛(fei)星火醫學影像大模型,能(neng)(neng)(neng)完(wan)成(cheng)智(zhi)(zhi)能(neng)(neng)(neng)智(zhi)(zhi)控、智(zhi)(zhi)能(neng)(neng)(neng)診斷、智(zhi)(zhi)能(neng)(neng)(neng)讀片。影像助(zhu)手可以幫助(zhu)醫師進行(xing)解(jie)釋溯(su)源,找到對應的(de)判(pan)斷標準,還(huan)能(neng)(neng)(neng)對比(bi)患(huan)者之前的(de)影像CT。
3、法律、企業、科研:用戶工作效率翻倍提升,政務場景審核時間縮短80%
星(xing)火大(da)模型賦(fu)能法(fa)律和政務,法(fa)律大(da)模型的(de)場景(jing)應(ying)用包括AI書記員、AI文書助理、AI法(fa)律檢索助手;政務場景(jing)的(de)星(xing)火智辦一(yi)體機,使得用戶遞交材料的(de)審核時間縮短80%,登記效率提(ti)升5倍,
面向企(qi)業(ye),科大訊飛為企(qi)業(ye)大模(mo)型(xing)構建提(ti)供頂層規劃到執行落地(di)的(de)全套解決(jue)方案,包括數據工具請洗臉(lian)、SFT數據工具鏈、場景(jing)優化工具鏈、多(duo)模(mo)態知識零(ling)采編系統,提(ti)升“理數據、訓模(mo)型(xing)”的(de)效率(lv)。
在科(ke)(ke)(ke)研(yan)方面(mian),星火科(ke)(ke)(ke)研(yan)助手2.0已經(jing)(jing)中國科(ke)(ke)(ke)學院下屬116個院所使用(yong),同時(shi),科(ke)(ke)(ke)大訊飛(fei)已經(jing)(jing)聯(lian)合團隊開展了AI+生物科(ke)(ke)(ke)技、AI+科(ke)(ke)(ke)學裝置的科(ke)(ke)(ke)研(yan)攻關。
結語:大模型生態繁榮,AI正改變科研范式
訊飛星火(huo)大模型從發(fa)布至今,都在強調基(ji)座(zuo)模型升(sheng)級(ji)與(yu)行業應用(yong)的緊(jin)密結合,目前其(qi)已經發(fa)布20多個行業大模型,打造(zao)了300多個智能體應用(yong),這些形(xing)成了可以相互借(jie)鑒(jian)和(he)復用(yong)的規模化效應。
如今(jin),以大模型為代表的(de)(de)通用(yong)人(ren)工智能發展(zhan)迅猛,今(jin)年諾貝爾獎、物理學(xue)獎、化學(xue)獎都與AI強相關,AI改變科(ke)研范(fan)式(shi)已經成(cheng)為科(ke)技界的(de)(de)共識(shi)。以科(ke)大訊(xun)飛為代表的(de)(de)國內(nei)大模型廠(chang)商,正在其中扮演著愈加(jia)重要的(de)(de)角色(se)。