智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 漠影

智東西6月28日下午,昨日下午,科大訊飛的星火大模型迎來重磅升級,基于全國首個國產萬卡算力集群“飛星一號”的訊飛星火大(da)模型V4.0性能表現已超越(yue)GPT-4 Turbo,并且(qie)相關應用已經在醫療、教育等(deng)領域落地。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

星火(huo)大模型核心性能的升級以(yi)及與千行百(bai)業業務場(chang)景的深入結合,與當下大模型產(chan)業的兩大焦點問題(ti)密切相關。

一開場,科大訊飛董事長劉慶峰就談道,一方面,底座大模型的能力決定了我們可以在通用人工智能的浪潮中走多遠;另一方面,大模型未來不僅將改變信息獲取、內容生產模式,還會改變整個產業競爭格局、科研范式,因此對于企業而言,讓大模(mo)型真正(zheng)科學合理地在剛需場景中落(luo)地才更有(you)價值

星火大模型V4.0在國內外多個主流權威評測體系中,在多項能力中已經全面超越GPT-4 Turbo,成為支撐大模型走向應用的核心底座,與此同時,科大訊飛推出星火企業智能(neng)體平臺,通過交(jiao)互(hu)的(de)方式(shi)大幅降低智能(neng)體創建門(men)檻,讓每個(ge)崗(gang)位都能(neng)擁有(you)AI智能(neng)體。

可以(yi)看出,星火大模型V4.0以(yi)及基于其(qi)打造的自(zi)主可控、軟(ruan)硬一(yi)體解決方案,就是科(ke)大訊(xun)飛為(wei)當下(xia)大模型產業(ye)面對這兩大核心技(ji)術問題亮(liang)出的最優解之(zhi)一(yi)。

一、全面對標GPT-4 Turbo,可執行復雜指令、空間推理等高階任務

國內大模型已(yi)經(jing)在全面(mian)趕超GPT-4 Turbo之路上突飛猛進,能力持(chi)續躍升必然是大模型產業當下的(de)必答題。

去年,科大訊飛參與設計的國產通用認知智能大模型測評體系,形成覆蓋7個方面481個測試項的評估基準。在七大衡量大模型的關鍵指標中,星火大模型V4.0已經在其中的文本生成、語言理解、知識問答、邏輯推理、數學(xue)能力已經(jing)全面超越GPT-4 Turbo。

另外的代碼能力和多模態能力上,星火大模型V4.0略有差距。劉慶峰談道,代碼能力是未來的產業信息化和信息產業化的核心,星火大模型預計在今年8月達到當前GPT-4 Turbo 86分以上的水平。此外在多(duo)模態能力上,星火大(da)模型圖文識別能(neng)力(li)在科研、金融、醫療、司法(fa)、辦(ban)公等(deng)場(chang)景的(de)應用效果已領先GPT-4o。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

不僅如此,在國內外中英文12項主流測試集中,星火V4.0在其中8項(xiang)測試集中全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

在具體的業務場景中,訊飛星火V4.0的能力(li)也(ye)在不斷進階。

實際情況中,大模型往(wang)(wang)往(wang)(wang)需要聽懂多元化(hua)的復雜指令,或者基于(yu)已有的空間信息(xi)進行(xing)推理、基于(yu)邏輯關系進行(xing)多模理解(jie)等(deng)。并且大模型生成內(nei)容更為準(zhun)確、能夠減少幻覺對于(yu)應(ying)用(yong)端來說(shuo)都至關重要。

因此,星火大模型長文(wen)本能力在長文檔要素抽取、長文檔總結摘要、長文檔問答、長文檔文本生成能力全面升級的同時,還首發了內容溯源功能。也就是說,用戶在查閱大模型生成(cheng)的文本內容(rong)時(shi),可以點(dian)擊答(da)案附近(jin)的超鏈(lian)接(jie),就能準(zhun)確(que)找(zhao)到這部分答(da)案的出處(chu)。

中英文(wen)長(chang)文(wen)檔以及(ji)音(yin)視頻等的(de)解讀、問(wen)答,星火大模型V4.0均可(ke)勝任,同時(shi)在溯源時(shi)能幫用戶快速定位到文(wen)字(zi)、視頻的(de)相(xiang)應(ying)位置。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

當根據(ju)兩篇長文檔提問孫悟空的(de)(de)金箍棒和哈(ha)利(li)波(bo)特的(de)(de)魔(mo)杖有什么相同點和不(bu)同點時,星火大模型(xing)V4.0從神(shen)奇屬性、身份象征(zheng)以及材質來(lai)源、功(gong)能等方面進(jin)行了詳細分(fen)(fen)析。遇(yu)到不(bu)理解(jie)的(de)(de)部分(fen)(fen),用(yong)戶可以直接點擊鏈接分(fen)(fen)分(fen)(fen)鐘找到內容(rong)出處。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

同時,星火大模型的圖文生成能力還從單張圖進階到了多張圖(tu)片之間的邏輯理解、生成文本,可以根據多張圖片生成小(xiao)故事并且進行語(yu)音朗讀。正如下(xia)圖所(suo)演示的,將小(xiao)兔子和小(xiao)鳥的互(hu)動情節進行了生動串聯(lian)。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

大模(mo)型(xing)的(de)(de)能(neng)力(li)正在從單(dan)一的(de)(de)生成、問答、理解能(neng)力(li)進階,向著更高階的(de)(de)能(neng)力(li)演(yan)進,同時也逐漸朝著大模(mo)型(xing)走(zou)向落地(di)應(ying)用,解決企業(ye)或者個人真正需求的(de)(de)底座演(yan)進。

二、兩大路徑、三大優勢,科大訊飛為企業大模型落地鋪路搭橋

從(cong)整(zheng)個產(chan)業(ye)的發展格(ge)局(ju)來(lai)看,大模型(xing)的競爭焦點已經(jing)逐漸外延,從(cong)百(bai)模大戰、排名刷榜逐漸深(shen)入行業(ye)應用中(zhong)。

今年(nian)上半(ban)年(nian),已經(jing)有(you)數十個(ge)大(da)模(mo)型(xing)(xing)(xing)大(da)單公布中(zhong)標結(jie)果。以訊飛(fei)星(xing)火(huo)大(da)模(mo)型(xing)(xing)(xing)為(wei)代表的越(yue)(yue)來越(yue)(yue)多大(da)模(mo)型(xing)(xing)(xing)玩家已經(jing)奔赴大(da)模(mo)型(xing)(xing)(xing)落(luo)(luo)地戰,伴隨(sui)著下(xia)半(ban)年(nian)的新一批大(da)單涌(yong)現,AI落(luo)(luo)地應用競爭進入白熱(re)化態勢(shi)。

這背(bei)后,如何(he)讓(rang)(rang)企(qi)業(ye)對(dui)于大(da)模(mo)型(xing)應用落地(di)的感知(zhi)度更強,讓(rang)(rang)大(da)模(mo)型(xing)與企(qi)業(ye)業(ye)務場景的結合更便捷、高效,且真正融入其(qi)核心痛點中至關重要。

相比于(yu)C端(duan),企(qi)(qi)業(ye)業(ye)務(wu)場(chang)景的需求(qiu)更為明確,且(qie)能深(shen)度集成(cheng)至企(qi)(qi)業(ye)業(ye)務(wu)場(chang)景中進行定(ding)制化,能在幫助(zhu)企(qi)(qi)業(ye)解(jie)決復雜問題、真正提質(zhi)增效,對(dui)于(yu)大模型(xing)玩家而(er)言,其產品價值(zhi)的體現也更具針對(dui)性。

總體來看,大模型賦能企業的核心路徑有兩條,一是基于認知大模型的(de)能力直接完(wan)成任(ren)務,二是認知(zhi)大(da)模型作為大(da)腦,調度(du)內外(wai)部工具完(wan)成任務

對(dui)大(da)(da)模型(xing)落(luo)地(di)應(ying)用的思考,正(zheng)從訊(xun)飛星火大(da)(da)模型(xing)的全體系升級布(bu)局中(zhong)清晰(xi)呈現出來(lai)。劉慶峰將大(da)(da)模型(xing)的能力(li)邊界在企業應(ying)用中(zhong)進行(xing)了更(geng)為(wei)細致的拆解(jie),一般難(nan)(nan)度(du)指的是代(dai)碼生成、文案翻譯、文本摘要等大(da)(da)模型(xing)可以拿來(lai)即用,中(zhong)等難(nan)(nan)度(du)就是需要企業對(dui)基座大(da)(da)模型(xing)進行(xing)定(ding)制優化,例(li)如檢(jian)索類的知識問答、多輪(lun)對(dui)話等應(ying)用化的服(fu)務。

而高難度任(ren)務(wu)就是更難的數學推理、多階推理類知識(shi)問答,這一(yi)能(neng)力需要開放域的通用智能(neng)體(ti)來完成,但(dan)短期(qi)內還沒(mei)有(you)實現(xian)。

這(zhe)對(dui)應到(dao)企業(ye)中就是(shi)(shi)一(yi)個核(he)心問題,如何用更少的(de)算力、更高(gao)的(de)效率打造專屬(shu)模型和專屬(shu)應用。這(zhe)就對(dui)大(da)模型玩家本(ben)身產品是(shi)(shi)否易(yi)用、好用、可用提出(chu)了更高(gao)的(de)要(yao)求(qiu),這(zhe)也是(shi)(shi)企業(ye)為大(da)模型買單的(de)關(guan)鍵。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

因此,科(ke)大訊飛在錨定真正(zheng)讓大模型落地應(ying)用(yong)這一核(he)心目標之后(hou),將自己的技(ji)術(shu)優勢、應(ying)用(yong)經驗、生態范式真正(zheng)打通(tong)。

從去年發布至今,訊飛星火大模(mo)型能力不斷躍(yue)升,且(qie)打(da)造了面向企業(ye)的智能體開發平臺,進一步降(jiang)低企業(ye)業(ye)務與大模型能力相(xiang)互影響、對齊的門檻。

與此同時,作為AI國家隊的科大訊飛,在加速當下國內大模型商業化加速落地過程中具有天然的優勢,其技術實力在AI產業的發展中已經被充分驗證。以智能語音交互技術為例,深耕十余年且近日科大訊飛拿下過去十年人工智能領域首個國家科學技術進步獎一等獎——作為第(di)一完成單(dan)位的“多語種智能語音關鍵技術及產業化”項目斬獲國家科學技術進步獎一等獎

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

技術創新與產業落地在科大(da)訊(xun)飛的(de)業(ye)(ye)務(wu)布局中相(xiang)(xiang)輔相(xiang)(xiang)成。科大(da)訊(xun)飛已經在教育、醫療(liao)、汽(qi)車(che)等諸多賽(sai)道上有了大(da)量的(de)商業(ye)(ye)化積累。訊(xun)飛星火(huo)大(da)模型已經應用于國(guo)(guo)家(jia)(jia)能源集團、中國(guo)(guo)石油(you)、中國(guo)(guo)移動、中國(guo)(guo)人保(bao)、太平洋保(bao)險、交通(tong)銀行、奇(qi)瑞汽(qi)車(che)、中國(guo)(guo)一汽(qi)、海爾集團、美(mei)的(de)集團等各賽(sai)道頭部玩家(jia)(jia)的(de)業(ye)(ye)務(wu)場景中。

在(zai)這些優勢的支撐之上,科大(da)訊飛正(zheng)在(zai)朝著構建(jian)面向未來(lai)的AI新生態(tai)突圍,以源頭技術生態(tai)、智能體生態(tai)、應用(yong)生態(tai)、行業生態(tai)真正(zheng)在(zai)大(da)模型的發展過程中流轉起(qi)來(lai)。

科大訊飛正為大模型落地企業(ye)提(ti)供了無限的(de)想象空間。

三、企業的專屬崗位AI助手,對話交互就能搞定智能體

伴(ban)隨著訊飛(fei)星火(huo)V4.0的重磅升級,科(ke)大訊飛(fei)為大模型賦能(neng)(neng)企業(ye)(ye)亮出了另一(yi)大殺手锏——星火(huo)企業(ye)(ye)智能(neng)(neng)體平臺(tai),為每個崗位打造專屬的AI助(zhu)手。

在解(jie)決企業(ye)(ye)大(da)模(mo)型應用(yong)最后一公里上,劉慶峰(feng)談道(dao),企業(ye)(ye)首先要科學地認(ren)識(shi)大(da)模(mo)型能(neng)力的(de)邊(bian)界,根據任務難度選擇(ze)合(he)適方案,并且用(yong)更(geng)少的(de)算力、更(geng)高的(de)效率,打(da)造(zao)企業(ye)(ye)專屬大(da)模(mo)型。基于星(xing)火V4.0的(de)強大(da)能(neng)力,他認(ren)為用(yong)智能(neng)體平(ping)臺打(da)造(zao)每(mei)個崗位的(de)專屬助手的(de)時間(jian)已經到了(le)。

智能體在(zai)企業的(de)(de)業務場景中,可以(yi)通(tong)過(guo)拆解分析(xi)用(yong)戶(hu)的(de)(de)任(ren)務需求并進行任(ren)務執(zhi)行的(de)(de)步驟(zou)規(gui)劃,然后匹(pi)配相應的(de)(de)任(ren)務工具(ju),同時(shi)調用(yong)打通(tong)內(nei)外部(bu)知識信源,最后能夠準(zhun)確執(zhi)行用(yong)戶(hu)的(de)(de)任(ren)務需求。

現(xian)在科大訊飛(fei)將企業創建(jian)智能(neng)(neng)體的門檻降低,只需(xu)三個步(bu)驟:提出(chu)需(xu)求、構建(jian)智能(neng)(neng)體、功(gong)能(neng)(neng)驗證。用戶(hu)只需(xu)說(shuo)出(chu)需(xu)求,就(jiu)可以實現(xian)一句(ju)話(hua)創建(jian)。在對話(hua)框中,用戶(hu)只需(xu)要說(shuo)出(chu)智能(neng)(neng)體的相應功(gong)能(neng)(neng),該(gai)平臺就(jiu)會自動生成開(kai)場白、所(suo)需(xu)信源、技能(neng)(neng)規劃等。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

如果企(qi)業內部的辦公(gong)平(ping)臺已經與星(xing)火智能體平(ping)臺連接(jie),智能體還會自動同步到企(qi)業內部辦公(gong)平(ping)臺上,用戶就可以進行功能驗(yan)證。

以下圖演示的彩頁智能分析專家為(wei)例,用(yong)戶可以直(zhi)接上(shang)傳彩(cai)頁圖片,該(gai)智能體就可以通過OCR識(shi)別并將其(qi)中(zhong)的信息(xi)進行結(jie)構(gou)化呈現,并且迅速檢索給出企業的核(he)心業務(wu)以及與其(qi)他公司的合作(zuo)方向等供用(yong)戶參考(kao),最(zui)后將這(zhe)些內(nei)容進行總(zong)結(jie)梳理(li),以分析(xi)報告的形式發(fa)送到用(yong)戶郵(you)箱中(zhong)。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

如見簡便高效的智能體生成流程,這背后依靠的是星火企業智能體平臺的三大關鍵能力,AI原子能力、集成(cheng)外部(bu)信源、打通內部(bu)IT系統

劉(liu)慶峰透露,目前AI原(yuan)子能力集(ji)成已經超(chao)過(guo)400多家(jia),涵蓋90多個重(zhong)要外部(bu)信(xin)源(yuan),打(da)通了超(chao)過(guo)100個的(de)內部(bu)IT系(xi)統(tong),包(bao)括公司的(de)財務(wu)、法務(wu)等諸多部(bu)門。

在常見(jian)的生產、科創(chuang)、辦公和管理領域,科大訊飛已經首批創(chuang)建了32個企(qi)(qi)業智能體,企(qi)(qi)業可實現即插即用。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

特別在AI編程(cheng)領域,正如(ru)前文所(suo)所(suo)提到(dao)的,其在信(xin)息化(hua)產(chan)業與產(chan)業信(xin)息化(hua)的發(fa)展中至(zhi)關重要,因此科大(da)訊(xun)飛不斷(duan)迭代(dai)(dai)(dai)代(dai)(dai)(dai)碼智能(neng)體iFlyCode,可以滿足(zu)代(dai)(dai)(dai)碼生成(cheng)、架(jia)構設計、代(dai)(dai)(dai)碼問答、測試(shi)、數據庫優化(hua)、代(dai)(dai)(dai)碼審核方面實(shi)現應用。在科大(da)訊(xun)飛內(nei)部(bu),代(dai)(dai)(dai)碼智能(neng)體的代(dai)(dai)(dai)碼采納率已經從(cong)30%提升到(dao)52%。

此外(wai),還有(you)企(qi)業(ye)中需(xu)要大量數據分析處理、信息(xi)檢索或(huo)者(zhe)耗(hao)時耗(hao)力的商機線索、評標等(deng)方面,訊飛創建(jian)的企(qi)業(ye)智能體已經深入不(bu)同(tong)的企(qi)業(ye)業(ye)務流程中,幫助不(bu)同(tong)環節(jie)的員工實現了將本增效(xiao)。

面向企業,科(ke)大訊(xun)飛(fei)還在人(ren)機交互領域(yu),全面升級了支持37個語種、37種方(fang)(fang)言自(zi)由對話的(de)星(xing)火(huo)語音(yin)大模(mo)型(xing),重(zhong)構用戶(hu)的(de)交互體驗(yan),已應用在星(xing)火(huo)汽車智能座艙等(deng)產品里。在家(jia)電、機器人(ren)、運(yun)營商等(deng)行業場景下,科(ke)大訊(xun)飛(fei)的(de)云(yun)邊端和軟硬件一體化解決方(fang)(fang)案(an)也為這些(xie)玩(wan)家(jia)提供了更具靈活性(xing)的(de)方(fang)(fang)案(an),去(qu)釋放大模(mo)型(xing)潛(qian)能。

當下,企業的(de)數(shu)字化轉型(xing)(xing)需求,與大模(mo)型(xing)(xing)日益進階(jie)的(de)性能提升(sheng)相(xiang)契合。科大訊飛已經形成(cheng)了底座大模(mo)型(xing)(xing)支撐,外加通(tong)過智能體(ti)平臺深入(ru)業務“細枝末節”,為(wei)企業搭建起堅(jian)實(shi)的(de)技術(shu)底座。

還(huan)有更為重(zhong)要的一點是(shi),劉慶峰強調,新的AI生態體系建設的根基就是底座技術完全可控(kong),總結起來就是“軟硬(ying)一體+自主可控”。這也正(zheng)是訊飛星火大模型(xing)V4.0此次升級迭代(dai)的底層邏輯(ji),既真(zhen)正(zheng)為企業釋放(fang)大模型(xing)價值,又要讓軟硬件一體(ti)化的解(jie)決方(fang)案成長于(yu)中(zhong)國自己的土(tu)壤之(zhi)上。

打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”

結語:大模型商業化落地爆點降至,科大訊飛率先布局

大(da)(da)模(mo)型在企業(ye)(ye)的(de)各個業(ye)(ye)務環節中(zhong)發揮(hui)作用、釋放價值(zhi)已(yi)經成為這(zhe)一產業(ye)(ye)發展的(de)重要趨勢,因此,大(da)(da)模(mo)型玩(wan)家與不同的(de)企業(ye)(ye)需要對大(da)(da)模(mo)型本身的(de)能力(li)以及企業(ye)(ye)的(de)核(he)心痛點進行拆(chai)解與對齊,在此之上才能讓AI能力(li)真(zhen)正(zheng)普(pu)惠,落地到千(qian)行百(bai)業(ye)(ye)之中(zhong)。

點點“星火(huo)”,已(yi)成燎原之勢(shi)。訊飛(fei)星火(huo)正在以(yi)(yi)基座大(da)模型(xing)為核心,進一步助攻大(da)模型(xing)技術在各(ge)(ge)行各(ge)(ge)業的規模化普及。對于國內的大(da)模型(xing)玩家而言,既需(xu)要科學理性(xing)認(ren)識(shi)到(dao)中美(mei)科技的綜(zong)合差異,還需(xu)要在朝著通用(yong)人工智能加速前進的同時,以(yi)(yi)長期主義來打(da)造(zao)真正自主可控的AI產業生態。

科大訊(xun)飛(fei)已經(jing)成為先行(xing)者,并且讓大模型(xing)在企業(ye)剛需場景的更多應(ying)用價(jia)值逐漸被釋放出來,加速大模型(xing)應(ying)用生態的蓬勃發展。