
智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 漠影
大(da)模型(xing)毋庸置疑是去年以來科技行業(ye)的“主(zhu)角(jiao)”,今天,大(da)模型(xing)產業(ye)競爭的核心已然改變。
自2022年11月ChatGPT發布掀起的科技革命,到百模大戰群雄逐鹿,如今隨著大模型與產業落地的結合日益緊密,各類應用層出不窮,大模型商業化成為所有參與者的核心目標。2024年儼(yan)然(ran)已經成為(wei)大模(mo)型商(shang)業化(hua)元年。
此前(qian)大(da)模(mo)型受研發成本(ben)(ben)高昂、落地場景不(bu)明晰(xi)、部署成本(ben)(ben)高等困(kun)擾商業(ye)化進程緩慢。就(jiu)在(zai)昨天,2024年(nian)農歷春節前(qian)夕,AI國家(jia)隊、國內(nei)大(da)模(mo)型產業(ye)賽(sai)道的(de)重要玩家(jia)科大(da)訊(xun)飛給出了自(zi)己的(de)破局之道。
科大訊飛董事長劉慶峰、研究院院長劉聰正式發布基于首個全國產算力訓練的訊飛星火V3.5,訊飛星火V3.5七大核心能力全面提升,數學、語言理解、語音交互能力超GPT-4 Turbo。
科大訊飛發布了星火語音大模型,語音識別方面首批37個主流語種效果超過OpenAI Whisper V3,基于此重磅升級了能自動識別語種的訊飛翻譯機,并首次發布深度適配國產算力的訊飛星火開源大模型“星火開源-13B”,已在昇思開源社區聯合首發(fa)上線。
自去年5月以來(lai),以訊飛(fei)(fei)星(xing)火認(ren)知大模(mo)型為核心的技術積累與應(ying)用經驗,已經成為科大訊飛(fei)(fei)在大模(mo)型商業化應(ying)用元(yuan)年的重(zhong)要(yao)支撐。
那么(me),曾困擾大(da)(da)模(mo)型商業(ye)化(hua)的(de)難題如(ru)何(he)解?科大(da)(da)訊飛眼(yan)中的(de)大(da)(da)模(mo)型落地場景應該是(shi)什么(me)樣?科大(da)(da)訊飛又是(shi)如(ru)何(he)找(zhao)到(dao)一步步走出(chu)(chu)屬于自己的(de)路,成為行業(ye)引(yin)領者(zhe)?我們試(shi)圖從(cong)科大(da)(da)訊飛星火大(da)(da)模(mo)型V3.5的(de)重磅升級出(chu)(chu)發,找(zhao)到(dao)這些問題的(de)答(da)案。
一、大模型進入商業化元年,三大難題待解
轟轟烈烈的百模大戰熱(re)潮逐(zhu)漸冷靜,但技術變革(ge)的深遠(yuan)影響尚未停歇,科技發展的進階無不是真正與(yu)產業相結合,在(zai)真正的應用中發揮(hui)價值。
數(shu)據研究和分(fen)析(xi)機構Gartner預測,到2026年超過80%的(de)企業將(jiang)使用(yong)生成式AI的(de)API(應用(yong)程(cheng)(cheng)序編程(cheng)(cheng)接口)、模型,或在生產環境(jing)中部署支持生成式AI的(de)應用(yong),而(er)在2023年初這一比例不到5%。
但一(yi)直以來,大(da)模型真正在行業(ye)應(ying)用中(zhong)發揮價值,走向(xiang)落地(di)的進程都十分(fen)緩(huan)慢。這與大(da)模型的能力(li)、應(ying)用落地(di)場景、算力(li)三大(da)挑戰有關。
首(shou)先是(shi)模型能力(li)的挑戰(zhan)。大模(mo)型(xing)的(de)(de)幻覺(jue)、智能(neng)化程度不夠等問題(ti),直接會影響不同行業(ye)用戶對其(qi)的(de)(de)接受程度。不同于(yu)消費者,企業(ye)對于(yu)數據的(de)(de)安(an)全(quan)隱私(si)、大模(mo)型(xing)的(de)(de)可用性、生成(cheng)(cheng)內容的(de)(de)準確性要求極高,因(yin)此大模(mo)型(xing)除強大的(de)(de)生成(cheng)(cheng)、理(li)解等能(neng)力,還(huan)需要真正解決(jue)行業(ye)問題(ti),在業(ye)務(wu)中發揮價值(zhi)。
其次是應用場景的挑戰。大(da)(da)模型需(xu)(xu)要(yao)找(zhao)到(dao)有效(xiao)的(de)(de)(de)落地(di)場景,其在(zai)(zai)企(qi)業內(nei)部(bu)的(de)(de)(de)應用(yong)范圍十(shi)分寬泛,需(xu)(xu)要(yao)和(he)內(nei)部(bu)大(da)(da)量數據進行深度融(rong)合,找(zhao)到(dao)企(qi)業真(zhen)正的(de)(de)(de)痛點,并通過(guo)大(da)(da)模型的(de)(de)(de)能力(li)加以解決。這(zhe)才能讓企(qi)業最迫切的(de)(de)(de)需(xu)(xu)求(qiu)與大(da)(da)模型能力(li)相互匹配,在(zai)(zai)進一步提(ti)升(sheng)大(da)(da)模型能力(li)的(de)(de)(de)同時,形成豐富的(de)(de)(de)應用(yong)場景。
第三是算力挑戰。這(zhe)既包(bao)(bao)含企業(ye)定制、微調大模型的算力成本(ben),還包(bao)(bao)含國產大模型算力底座(zuo)的自主(zhu)可控(kong)。
對于下游企業(ye)而言,其沒(mei)有足夠算(suan)力(li)(li)成(cheng)本去定(ding)制(zhi)、微(wei)調大(da)(da)模型(xing)。算(suan)力(li)(li)是大(da)(da)模型(xing)訓練和推理階段極為重要(yao)的物質基礎,但大(da)(da)模型(xing)熱潮涌起使得算(suan)力(li)(li)成(cheng)本高漲(zhang),中小企業(ye)難以維(wei)系。然(ran)而,企業(ye)想要(yao)讓大(da)(da)模型(xing)與(yu)自(zi)己業(ye)務(wu)深度結合,就必須對大(da)(da)模型(xing)進行定(ding)制(zhi)、微(wei)調,這也(ye)成(cheng)為企業(ye)面前的一大(da)(da)攔(lan)路虎(hu)。
受波(bo)譎云詭的(de)國(guo)際形勢影響,國(guo)產(chan)化大模(mo)型產(chan)業的(de)自主可控也是一大難題。只有(you)建(jian)立在(zai)自主可控的(de)國(guo)產(chan)化算力平臺(tai)上,大模(mo)型產(chan)業才(cai)能(neng)實現可持(chi)續的(de)良(liang)好(hao)發展(zhan)。
隨著這些難題被(bei)逐(zhu)漸(jian)突(tu)破,大模(mo)型(xing)(xing)的實用性更(geng)上一個臺(tai)階,結(jie)合(he)其綜合(he)能力(li)解決真實世(shi)界的剛需被(bei)提上日(ri)程。在這一背景(jing)下,在大模(mo)型(xing)(xing)核心能力(li)升級(ji)、商業(ye)落(luo)地應(ying)用、算力(li)平臺(tai)部署(shu)上面(mian)有諸多經(jing)(jing)驗的訊飛,已經(jing)(jing)成為大模(mo)型(xing)(xing)商業(ye)化準備最充分(fen)的玩家代表(biao),并向著成為大模(mo)型(xing)(xing)落(luo)地的領跑者突(tu)圍。
二、訊飛星火V3.5升級,發語音、開源大模型,均基于全國產算力平臺“飛星一號”訓練
大(da)模(mo)型(xing)(xing)改變世界的(de)愿景(jing)逐漸清(qing)晰(xi),那么(me)站在大(da)模(mo)型(xing)(xing)商(shang)業(ye)化元年(nian)?科大(da)訊(xun)飛(fei)到底有哪些(xie)儲備(bei)?又(you)該(gai)如(ru)何領(ling)跑?我們可以(yi)從這場發布會的(de)重點抽離出這家如(ru)今大(da)模(mo)型(xing)(xing)頭部玩家的(de)布局邏(luo)輯(ji),也代表了(le)下一步(bu)大(da)模(mo)型(xing)(xing)商(shang)業(ye)落地的(de)競(jing)爭焦點。
訊飛星火V3.5實現了文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力七大核心能力升級。其中,語言理解、數學能力超過GPT-4 Turbo,代碼能力達到GPT-4 Turbo的96%,多模態理解能力達到GPT-4V的91%。
這些強大(da)的能力(li)已經在解決(jue)真(zhen)實世界的剛(gang)需方面展現出強大(da)潛力(li)。
萬物互聯時代的人機交互方式正在被重塑,訊飛星火App上線了語音交互功能,該功能在與人的對話中能自動調用大模型的外部能力,實現全語音的自然交互。劉慶峰談道,從DOS界面到Windows界面成就了微軟的傳奇,從鍵盤到觸摸有了蘋果的神話,這一次全語音的自然交互會推動整個產業出現新一次的繁榮。
語音(yin)技術(shu)(shu)一直以(yi)來都是科(ke)大(da)訊飛的(de)(de)強(qiang)項(xiang),自成立之初該公司就確定了(le)實現人(ren)類和人(ren)機信息溝通(tong)無障(zhang)礙的(de)(de)愿景。科(ke)大(da)訊飛在通(tong)用人(ren)工智能時代,繼續保持在語音(yin)交(jiao)互方面(mian)領先(xian)優勢的(de)(de)同時,看到了(le)新技術(shu)(shu)浪(lang)潮下的(de)(de)更多可(ke)能性。大(da)模型可(ke)以(yi)幫(bang)助(zhu)小(xiao)語種語料訓練,通(tong)過(guo)更統一的(de)(de)多任(ren)務(wu)建模能力(li)推動語音(yin)技術(shu)(shu)發展。
訊飛星火語音大模型基于語音屬性解耦表征預訓練,結合常規的語音大模型架構,實現了首批37個主流語種語音識別效果超過OpenAI Whisper V3,在多語種(zhong)語音合(he)成(cheng)、超(chao)擬人語音合(he)成(cheng)方面MOS分有絕(jue)對優勢,MOS分指的就(jiu)是生成(cheng)的聲音是否自然。
此次搭(da)載星火語(yu)音大模型的訊飛翻(fan)譯機還實(shi)現了(le)重磅(bang)升級,可以實(shi)現多語(yu)種(zhong)自主識(shi)別(bie),無需用(yong)戶自主選擇,就可以自動識(shi)別(bie)說(shuo)話人的語(yu)種(zhong)并翻(fan)譯成中文(wen)。
此外,為了豐富大模型應用生態,科大訊飛發布了130億參數規模的星火開源大模型系列,包括基礎模型(xing)、精調模型(xing)、微調工(gong)具和人設定(ding)制工(gong)具。星(xing)火開(kai)源-13B在多項知(zhi)名公(gong)開(kai)評測任(ren)務中的文本生成、語言(yan)理解(jie)等典型(xing)場景(jing)中排名靠前。
最后就是大模型訓練的堅實底座——算力平臺,訊飛星火V3.5、星火語音大模型、星火開源大模型都是基于“飛星一號”訓練,飛(fei)星一號就是去年(nian)10月24日訊飛(fei)宣布(bu)正(zheng)式啟用(yong)的首個(ge)支撐(cheng)萬億參數大(da)模型訓練的國(guo)產算力平臺。
訊飛星火V3.5是國內首個基于全國產算力訓練的大模型。星火開源大模型也基于(yu)飛星一號(hao)實(shi)現了全棧國(guo)產適配優(you)化,訓(xun)練效(xiao)率達A100的(de)90%。這也意味著(zhu),科大訊飛為企業客戶(hu)提供了另外(wai)一種“大模型+算力”的(de)選擇(ze)。
在這一特殊(shu)節點,大模(mo)型要(yao)立(li)足于(yu)國產(chan)自主可控的算(suan)力平臺至關重(zhong)要(yao),劉慶峰稱,訊飛星(xing)火3.5正是對于(yu)國產(chan)算(suan)力平臺能否支撐起未來(lai)大模(mo)型研(yan)發(fa)的一次重(zhong)要(yao)檢驗。
可(ke)以看出,科大訊飛在大模型產業(ye)的(de)浪潮中很清楚自(zi)己要做什么,怎么做,并(bing)且在此前深厚的(de)行業(ye)積累中,真正瞄準了行業(ye)痛點,知道自(zi)己要如何在這(zhe)個(ge)行業(ye)中扎根生存并(bing)實現領先。
三、大模型升級與解決行業痛點并進,從通用大模型進階到解決民生剛需
縱觀整個大模型產業的發展,如今的商業化之爭既是全球科技的競爭,也成為國內生成式AI與全球(qiu)同頻發(fa)展的關鍵環節,國內玩家這(zhe)一波(bo)百(bai)模大(da)戰也進(jin)入了新的競爭關鍵。
從去年(nian)8月至今(jin),國產大模(mo)型已經有共(gong)計4批通(tong)過大模(mo)型備案面向公眾化(hua)開放,并(bing)且(qie)如(ru)今(jin)在金融(rong)、教育(yu)、辦(ban)公賽(sai)道已經有諸多(duo)大模(mo)型應用。
作為首批通(tong)過(guo)備(bei)案的(de)訊飛(fei)(fei)星火(huo)(huo)大模(mo)(mo)型(xing)(xing)的(de)應用(yong)(yong)進展(zhan)也毫不(bu)遜色。自去年5月至今(jin),星火(huo)(huo)大模(mo)(mo)型(xing)(xing)在七大核心能力不(bu)斷升級(ji)的(de)同時,硬件(jian)方(fang)面在教育領域打造了訊飛(fei)(fei)AI學習機,辦公領域有(you)訊飛(fei)(fei)智能辦公本、訊飛(fei)(fei)錄音筆(bi),軟件(jian)方(fang)面有(you)訊飛(fei)(fei)聽(ting)見、訊飛(fei)(fei)星火(huo)(huo)App、訊飛(fei)(fei)輸入(ru)法等(deng),還有(you)內容創(chuang)作的(de)工(gong)具(ju),如(ru)音視頻創(chuang)作工(gong)具(ju)“訊飛(fei)(fei)智作”、圖文(wen)創(chuang)作工(gong)具(ju)“星火(huo)(huo)內容運營大師”等(deng)已經將(jiang)大模(mo)(mo)型(xing)(xing)的(de)價(jia)值逐(zhu)漸釋放給大量(liang)的(de)用(yong)(yong)戶。
在訊飛開放平臺之上,大模型總開發者超35萬,其中企業開發者超22萬。
大量用戶(hu)的體(ti)驗與反(fan)饋(kui),也(ye)在反(fan)哺大模(mo)型核心能力的不(bu)斷提升。
與此同時,劉慶峰談道,大模型如今已經不是用來簡單的寫詩、作畫,而是賦能科研、賦能工業、賦能民生的剛需場景,就是要讓大(da)模型能(neng)夠提升成為數字化時(shi)代(dai)、智能(neng)化時(shi)代(dai)的全新生產力。
科(ke)技(ji)創新到產(chan)業(ye)落地的(de)(de)(de)距(ju)離,需(xu)要終(zhong)端企業(ye)用戶(hu)與核心(xin)大模(mo)型玩(wan)家(jia)的(de)(de)(de)結合,才能(neng)逐漸縮短這之(zhi)中的(de)(de)(de)距(ju)離,同(tong)時也(ye)讓大模(mo)型商用落地的(de)(de)(de)路徑(jing)更為清晰。
科大訊飛已經在不同賽道上有了大量的商業化積累。面向教育行業,科大訊飛推出了星火智慧黑板,具備多模態理解與推薦、全自然(ran)交(jiao)互、虛擬人輔學、智(zhi)慧化(hua)錄課與分(fen)享四大功能(neng)(neng)。這一功能(neng)(neng)將黑板(ban)的(de)價值(zhi)邊界進一步(bu)擴寬,成(cheng)為老師(shi)的(de)AI助手。
同時,科大訊(xun)飛與中國移動聯合推(tui)出5G新(xin)通話創新(xin)應用“商務速記”,可以實現用戶通話過程中同步紀要語音、提煉關鍵待辦事項等。
汽車行業頭部玩家奇瑞汽車中應用的智能語音交互技術由科大訊飛提供,其出口的國家覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種。可以看出,支撐中國(guo)汽車出海也是國(guo)產大(da)模型商業化落地的一大(da)潛力場景。
由此可以看出,大模型正在同步驅動B端和C端商業化落地,一方面(mian),翻譯機、商(shang)務(wu)5G通話、AI PPT等能力(li)正(zheng)在被大(da)(da)模型重塑,讓(rang)前沿(yan)技術創新成(cheng)為(wei)個人(ren)用戶的(de)生產力(li)工具;另(ling)一方面(mian)各(ge)行(xing)各(ge)業(ye)(ye)的(de)頭(tou)部玩(wan)家、創企正(zheng)在與以科大(da)(da)訊飛(fei)為(wei)代表的(de)大(da)(da)模型核心玩(wan)家,進行(xing)商(shang)業(ye)(ye)化落地探索,在加速(su)產業(ye)(ye)轉型升級的(de)同時(shi)找到新的(de)增(zeng)長(chang)機遇。
更為重要的是,作為AI國家隊的科大訊飛,在(zai)當下國內(nei)大模型商(shang)業化加速落地的同(tong)時,對于提供(gong)自主可(ke)控全(quan)國產(chan)算力平臺方面具(ju)有天然優勢。
如今,大(da)(da)模型(xing)商業(ye)化應(ying)(ying)用(yong)已經(jing)聚集了算力(li)(li)、大(da)(da)模型(xing)、終端企(qi)業(ye)等各(ge)方玩(wan)家之力(li)(li),使得大(da)(da)模型(xing)核心能力(li)(li)與應(ying)(ying)用(yong)落地進展同(tong)步推進,并且堅持安全可控。
即便此前(qian)在(zai)(zai)大模型(xing)核心能力(li)方(fang)面,國(guo)內與國(guo)外一直存在(zai)(zai)較大差距,但進入商(shang)業(ye)化落地的(de)(de)(de)新(xin)階段,依托國(guo)內豐富的(de)(de)(de)應用場景與落地土壤(rang),以(yi)科大訊(xun)飛為代(dai)表的(de)(de)(de)玩家正(zheng)引領大模型(xing)新(xin)時代(dai)的(de)(de)(de)變革。
結語:加碼大模型商業化落地,科大訊飛已快人一步
大(da)模型在生成(cheng)、理解等方(fang)面(mian)展現出的(de)強大(da)能(neng)力,使(shi)得(de)AI正不斷拓寬(kuan)其在千行百業中的(de)應用(yong)邊界。當下,AI驅動(dong)的(de)各類應用(yong)正在變革著人們(men)的(de)工作(zuo)、生活(huo)、學習等。
但從大(da)模(mo)型(xing)的(de)商業(ye)化(hua)應(ying)用角(jiao)度來看,正如前文所(suo)說,相比于C端消(xiao)費者,企業(ye)業(ye)務集成大(da)模(mo)型(xing)能力需要考慮(lv)模(mo)型(xing)能力、應(ying)用場景、算力的(de)具體特(te)點(dian)。這也是當下大(da)模(mo)型(xing)產業(ye)迭代升級,向(xiang)商業(ye)化(hua)進(jin)階的(de)重(zhong)中之重(zhong)。
大(da)(da)模(mo)型玩家的(de)交(jiao)鋒并沒有(you)停(ting)歇,從百模(mo)大(da)(da)戰的(de)拼算力、拼參數,如(ru)今的(de)大(da)(da)模(mo)型已經越來(lai)越具備實(shi)用屬性。在這(zhe)背后,既離不(bu)開業(ye)(ye)務端企業(ye)(ye)對前沿(yan)技術(shu)(shu)的(de)深入了解,以及勇于(yu)探索嘗試,也離不(bu)開擁(yong)有(you)核心技術(shu)(shu)的(de)企業(ye)(ye)不(bu)斷突圍(wei)技術(shu)(shu)創新,堅定投入。
國內大(da)(da)模型(xing)核心玩家(jia)、企(qi)業、算力商(shang)等諸(zhu)多玩家(jia)已(yi)被卷入新一(yi)波大(da)(da)模型(xing)浪潮中,成(cheng)為(wei)大(da)(da)模型(xing)商(shang)業化(hua)應用(yong)生態構建的(de)(de)重要參與(yu)(yu)者,進一(yi)步彌補國內大(da)(da)模型(xing)產業與(yu)(yu)國外水平的(de)(de)差距。
面向未來,大(da)模型將作(zuo)為一(yi)種必需品,在(zai)企業提升全球競(jing)爭(zheng)力的(de)過(guo)程中(zhong)扮演著關鍵(jian)角色,科大(da)訊飛在(zai)AI行業深耕20余年積累(lei)的(de)一(yi)系列先發優勢(shi),將成(cheng)為當下其在(zai)大(da)模型競(jing)爭(zheng)關鍵(jian)環節快(kuai)人(ren)一(yi)步的(de)重要支(zhi)撐(cheng)。