智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣

智東西4月26日報道,今(jin)天下午(wu),AI獨角獸第四范式首次公開了其(qi)面(mian)向企業(ye)的(de)大模(mo)型產品SageGPT(式說大模(mo)型),并且(qie)首次提出(chu)AIGS(AI-Generated Software)戰略(lve),也就是以生(sheng)成式AI重構企業(ye)軟件。

第四(si)范式創始人、首席執行官戴文淵現(xian)場拔網線測試了式說大模型在圖(tu)片理解、多輪對話(hua)、圖(tu)片代(dai)(dai)碼、生成代(dai)(dai)碼、邏(luo)輯推(tui)理上的能力。

除了這些(xie)通用(yong)大模型外(wai),戴文淵認(ren)為,在C端(duan),用(yong)戶對于軟件(jian)的使用(yong)體驗已經優化的十分到位,但對于B端(duan)軟件(jian)來說,很多企業在報銷(xiao)、申請(qing)辦(ban)公室(shi)等方面(mian)的軟件(jian)體驗很差,因此B端(duan)軟件(jian)的體驗有巨大的提(ti)升(sheng)空間。

第四(si)范式提出了AIGS戰略,并(bing)將式說定位為基于多模態大模型(xing)的新(xin)型(xing)開(kai)發平臺。他補(bu)充道,要做到(dao)AIGS,大模型(xing)需要具備Copilot(副(fu)駕(jia)艙)和思維(wei)鏈CoT(chain of thoughts,多步推理)的能(neng)力(li)。

第四范(fan)式今天公(gong)開的(de)(de)已經是式說(shuo)的(de)(de)第三個版本,從今年2月開始,該(gai)公(gong)司就發布了具備生成語言(yan)能(neng)(neng)力(li)的(de)(de)式說(shuo)1.0,后續又推出加入文本、語音、圖(tu)像、表格、視頻(pin)等多模態輸入及(ji)輸出能(neng)(neng)力(li)以及(ji)企業級Copilot能(neng)(neng)力(li)的(de)(de)式說(shuo)2.0。

一、寫代碼、文圖互生、“裝箱”難題均不在話下

首先是圖片(pian)(pian)(pian)理解能力(li),測試人員(yuan)上(shang)傳了一張(zhang)電視劇(ju)(ju)《狂飆》的劇(ju)(ju)照(zhao),式說不僅(jin)可以描(miao)述這張(zhang)圖片(pian)(pian)(pian)的大致情況,還可以回答圖片(pian)(pian)(pian)中有幾個人、他們在做(zuo)什么(me)。

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

其次是圖片生(sheng)成能力,測(ce)試人員讓(rang)式(shi)說“畫一(yi)張配色鮮艷(yan)的(de)籃球(qiu)鞋”,它還(huan)可以通過背景來突出“籃球(qiu)”這一(yi)元素:

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

在代(dai)碼生成能(neng)力上,測試人員讓式說“請用VBA編(bian)寫一(yi)個(ge)求兩個(ge)數乘積(ji)的(de)代(dai)碼”:

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

在(zai)CoT思維(wei)鏈(lian)能力(li)中,測試人員告訴(su)式說“我想研(yan)發一個萬億參(can)數的生成式大語(yu)言(yan)模型,請告訴(su)我解決這個問題(ti)的每一步”,它會將涉及到(dao)的基本步驟都羅列出來:

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

更為基(ji)本的聊(liao)天能力(li)方面,測試人員讓它做個自我介紹,不過在第一句話(hua)上其生成(cheng)的內容出現了(le)重復性(xing)詞語:

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

測試(shi)人員(yuan)讓式(shi)說(shuo)做(zuo)一(yi)(yi)個旅(lv)游(you)規劃,如“五一(yi)(yi)假期去硅谷旅(lv)游(you),有什(shen)么推(tui)薦的(de)地方?”,式(shi)說(shuo)羅(luo)列了幾大值(zhi)得(de)逛的(de)景點(dian):

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

寫作能力方(fang)面(mian),式說可以“根據電影《流浪地球2》的(de)情節,寫一個《流浪地球3》的(de)劇(ju)(ju)本”,它還將前兩部的(de)劇(ju)(ju)情梗(geng)概展現了出(chu)來:

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

在(zai)推(tui)理更(geng)為復雜的“裝箱”操作(zuo)上,式(shi)說也快速、準確的完成了任務,并(bing)且(qie)測(ce)試人(ren)員還能查看它的思考(kao)過(guo)程:

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

二、三個階段,要用生成式AI重構企業軟件

除了具備這些通用能力外,第四范式還提出了AIGC時代的AIGS(AI-Generated Software戰略,也就是以生成式AI重構企業軟件。

戴文淵(yuan)認(ren)為(wei),生成式AI可(ke)能先改造B端的(de)軟件。他(ta)舉了(le)一個關于(yu)二(er)維(wei)碼的(de)例子,二(er)維(wei)碼支付(fu)在(zai)(zai)國內已經(jing)無處不在(zai)(zai),但海外的(de)二(er)維(wei)碼支付(fu)并不普及,原因(yin)在(zai)(zai)于(yu)美國信(xin)用卡(ka)非常(chang)成熟,二(er)維(wei)碼相較于(yu)信(xin)用卡(ka)的(de)提升并不大,因(yin)此(ci)其替(ti)代性并不強(qiang)。但國內,二(er)維(wei)碼支付(fu)帶來的(de)體驗升級是從現金支付(fu)開始(shi)的(de),因(yin)此(ci)更(geng)為(wei)直觀。

同樣,生成(cheng)式(shi)AI改造(zao)C端(duan)的(de)軟件體驗不(bu)見(jian)得非常明顯,但(dan)對于B端(duan)菜單式(shi)的(de)軟件,生成(cheng)式(shi)AI可(ke)以將其轉化成(cheng)更自然(ran)的(de)交互方式(shi)。

例(li)如,當前的(de)員工(gong)想要通過(guo)企業軟(ruan)件(jian)預定會(hui)(hui)議(yi)(yi)室,他們需要找到這個時間段內想用的(de)辦公室,然后再去挑選沒(mei)有(you)被占用的(de)會(hui)(hui)議(yi)(yi)室。而經(jing)過(guo)生成式AI改造后的(de)范式AI助手(shou),員工(gong)只需要和它說“查詢會(hui)(hui)議(yi)(yi)室:下午14點7樓(lou)空閑(xian)的(de)會(hui)(hui)議(yi)(yi)室”,就能清晰看(kan)到當前可用的(de)會(hui)(hui)議(yi)(yi)室。

因此,AIGS還可以讓復雜的工作變得更加簡單,第四(si)范式將AIGS的路徑總(zong)結為三個階段(duan):

第一個是(shi)Copilot階段,用戶使用自然語言(yan)就(jiu)可以(yi)讓Copilot調動不同的(de)信息、數據、應(ying)用,來完(wan)成指令。例如用戶想要把照片的(de)亮度(du)提升20%,不需(xu)要用戶拖到修圖軟件中,只(zhi)需(xu)要通(tong)過(guo)自然語言(yan)來輸入(ru)進去。

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

第二個階段是Copilot+基于企業規則的“知識庫”絕大多(duo)數用(yong)戶(hu)使用(yong)軟件都并不是(shi)使用(yong)單(dan)一(yi)(yi)功能(neng),而是(shi)多(duo)個功能(neng)的集合,而AI可以(yi)參照這一(yi)(yi)相應的規(gui)則(ze)來執行(xing)指(zhi)令。例(li)如任(ren)務是(shi)“把(ba)這張照片p的好看(kan)一(yi)(yi)點”,式(shi)說(shuo)就(jiu)可以(yi)查(cha)詢“人像美化”知(zhi)識庫(ku)后,依(yi)次(ci)調節圖片的亮度、對比度等。

第三個階段(duan)是Copilot+思維鏈,軟(ruan)件系統的(de)使用行為不斷被大模(mo)型(xing)學習,最終(zhong)形(xing)成(cheng)AI針對(dui)這個(ge)領域的(de)思維(wei)鏈(lian),AI就(jiu)可以自動(dong)按照(zhao)步(bu)驟完成(cheng)“把(ba)照(zhao)片處理得更好看”等(deng)任務。

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

除此以(yi)外,生(sheng)成式AI對(dui)軟(ruan)件(jian)的(de)改造(zao),不僅僅體(ti)現在(zai)體(ti)驗上,還體(ti)現在(zai)開(kai)發(fa)效(xiao)率(lv)上。戴文淵(yuan)說道(dao),當(dang)前(qian)的(de)軟(ruan)件(jian)開(kai)發(fa),絕(jue)大多數都(dou)是以(yi)月計算時(shi)間,更(geng)復雜的(de)軟(ruan)件(jian)開(kai)發(fa)可能要以(yi)年計算。但生(sheng)成式AI改造(zao)后的(de)軟(ruan)件(jian)開(kai)發(fa),可以(yi)將這一時(shi)間維度縮(suo)短到(dao)以(yi)天計算。

他補充(chong)道,AIGC最重要的(de)是將(jiang)它的(de)能力變(bian)成生產力工(gong)具,提(ti)升企(qi)業的(de)生產效(xiao)率。因此,第四范式將(jiang)式說定(ding)義為一個(ge)軟(ruan)件開發平(ping)(ping)臺,是基(ji)于(yu)大模型(xing)的(de)新型(xing)開發平(ping)(ping)臺。

式(shi)說大模(mo)型的優勢(shi)包括數(shu)據安全、成(cheng)本可控的多模(mo)態大模(mo)型能(neng)(neng)力(li),內容可信的知識庫能(neng)(neng)力(li),執行(xing)可控、知錯能(neng)(neng)改的Copilot能(neng)(neng)力(li),以及能(neng)(neng)夠實現多步推理、復(fu)雜任務拆分(fen)、形成(cheng)數(shu)據飛輪的思維鏈能(neng)(neng)力(li)。

第四范式正在快(kuai)速(su)迭代(dai)產品(pin),基于AIGC的能力,幫(bang)助企業(ye)內部軟件實現(xian)效果提升(sheng)。據(ju)了解(jie),目前,其產品(pin)已經落地數十家頭部行業(ye)公(gong)司,覆(fu)蓋金融(rong)、醫療(liao)、能源、航空行業(ye)等。

三、四大能力積累,未來讓機器自己實驗找答案

第四(si)范式(shi)在AIGC領(ling)域的(de)(de)布局分為四(si)層(ceng),分別是底層(ceng)的(de)(de)式(shi)說(shuo)大模型,能力(li)層(ceng)的(de)(de)Copilot、知(zhi)識庫、思維鏈(lian)CoT,平臺層(ceng)的(de)(de)開(kai)發平臺,以及最后在金融(rong)、零售、醫療、制造行業的(de)(de)應用(yong)。

第四范式主任(ren)科學家(jia)涂威威談道,他(ta)們(men)想讓語言(yan)模型不只擁(yong)有能聊天、會畫畫的能力(li),而(er)是要成(cheng)為一個(ge)生產力(li)工具。

在(zai)1.0階段,大(da)規模預訓練(lian)模型(xing)存在(zai)知識過時、上下文長度(du)受限的(de)缺(que)陷,第四(si)范式(shi)基于Memory Augmentation的(de)核心技術,能輔(fu)助大(da)模型(xing)進行相應(ying)推理(li),解決用戶的(de)實際(ji)問題(ti)。

此外,這(zhe)一技術(shu)不僅是將數(shu)據(ju)接(jie)進來,還能構建(jian)一整套的反饋機制,來讓用戶越用越好。

第四范式參戰AI大模型!首提AIGS戰略,現場問答畫畫寫代碼

2.0階(jie)段大模(mo)型的核(he)心能力是知識(shi)庫結(jie)合Copilot,也就是讓機器(qi)具(ju)有一定的視覺、聽覺和執(zhi)行能力。

通過Plugin模(mo)式,大模(mo)型可以做一(yi)些(xie)科學(xue)計算, 讓其(qi)應用到實際領域中去的時候,能(neng)針對(dui)每個領域具(ju)有專業的能(neng)力(li)。

并且,2.0階段(duan)大模(mo)(mo)型(xing)主要是企業已(yi)有的(de)操作規范,來讓機器模(mo)(mo)仿人(ren)并代替人(ren)執行相關流程。

3.0階段就要(yao)機器做(zuo)更多的事情,大模型擁有學(xue)習(xi)更多思維鏈的能力,可以(yi)復制、模仿(fang)、學(xue)習(xi)人的行為,甚至于模仿(fang)人的一系(xi)列動(dong)作來執行更加復雜的任務(wu)。

涂(tu)威(wei)(wei)威(wei)(wei)談道,他(ta)們下一個階段的(de)目標(biao)就是讓機(ji)(ji)器對(dui)著任務的(de)最終目標(biao)去(qu)學習(xi),而不是簡(jian)單復制人的(de)步(bu)驟,而這往(wang)往(wang)需要機(ji)(ji)器去(qu)做實驗。

因此,為了(le)降低(di)機器的實(shi)驗成本,第四范式未來的方(fang)向就是利用(yong)大(da)型語言模(mo)型,讓機器在虛擬環境中進行(xing)迭代,再應用(yong)到實(shi)際環境中去,擁有(you)可以解決更高(gao)層目標(biao)的能力。

結語:B端企業軟件或成大模型應用爆發點

OpenAI造就的ChatGPT的爆(bao)火,驗(yan)證了生成式AI產品的可行(xing)性,也提升了市場對于大模型(xing)的信心,但對于其(qi)商(shang)業(ye)化路徑的探索,更多還要(yao)依靠企業(ye)選擇的方(fang)向。

生(sheng)成式AI的(de)爆火很大程度來源于它對(dui)于人們(men)生(sheng)產效率的(de)顛覆(fu)性提升,但(dan)對(dui)于企業來說(shuo),私域數據的(de)安(an)全性與如何快速(su)應用前(qian)(qian)沿技術(shu)同樣重要,就(jiu)需要更專業的(de)技術(shu)公司來為(wei)提供支(zhi)持(chi),找到前(qian)(qian)沿技術(shu)與數據安(an)全保護(hu)的(de)平衡(heng)點。