
智東西(公眾號:zhidxcom)
作者 | 香草
編輯 | 李水青
智(zhi)東西4月2日報(bao)道,今天,亞(ya)馬遜云科技(AWS)與智(zhi)東西等少數(shu)媒體分享了與AI創企Anthropic合作的最新進展(zhan),并現場演示了Claude 3大模(mo)型(xing)的多(duo)模(mo)態、長文本(ben)、語(yu)境理解等能力。
AWS近日宣(xuan)布向(xiang)Anthropic追(zhui)加投資27.5億美(mei)(mei)元,截(jie)至目前(qian)已經向(xiang)這家(jia)OpenAI強力競對累計注資40億美(mei)(mei)元。此外,雙方的(de)合作關系也(ye)再次加深(shen),Amazon Bedrock引入了Anthropic最新發布的(de)Claude 3模型。
會后(hou),AWS大(da)中華區產品部總經理陳曉建向我們(men)分享了(le)大(da)模型落地(di)(di)實踐的解讀。在他看來,大(da)模型想(xiang)要(yao)打通落地(di)(di)最后(hou)N公里,需要(yao)選(xuan)擇(ze)一個(ge)具體的、簡單的切入(ru)點(dian)(dian),從點(dian)(dian)到面逐步擴展應用(yong)場景(jing),由簡單到復雜逐步切入(ru)。
當(dang)談到AWS下一(yi)步的發展戰略時,他稱從客戶需求來看,目前芯片等(deng)硬件(jian)設施仍然落后(hou)于大模(mo)(mo)型的發展,其迭代速度跟不上模(mo)(mo)型參數(shu)規模(mo)(mo)的指數(shu)級提升,如何將(jiang)底層能(neng)力與大模(mo)(mo)型復雜度相匹配,是現(xian)在(zai)面臨(lin)的主要(yao)挑戰。
一、從基礎設施、工具鏈到AI應用,構建生成式AI完整技術棧
陳曉建首先(xian)解讀了(le)AWS的(de)生成式AI技術(shu)棧。目前,AWS在(zai)基礎設(she)施(shi)層面提(ti)供(gong)GPUs、自(zi)研Trainium芯片(pian)、Nitro系(xi)統等(deng)底層設(she)施(shi),在(zai)大模(mo)型構建工具層面提(ti)供(gong)大模(mo)型托管平臺Amazon Bedrock,在(zai)應用層面則推出了(le)智能助手Amazon Q、代(dai)碼(ma)助手Amazon CodeWhisperer等(deng)。
▲AWS生成式AI技術棧
在模(mo)型(xing)層面(mian),除了此前(qian)提(ti)供(gong)的AI21Labs、Cohere、Meta、Stability AI以(yi)及亞馬遜自研的模(mo)型(xing)之(zhi)外,近期新增了Anthropic和法國創企(qi)Mistral AI的新模(mo)型(xing)。其(qi)中,Anthropic的Claude 3以(yi)其(qi)多模(mo)態推理、翻(fan)譯、總結等方面(mian)的優異能力(li)突出。
▲Amazon Bedrock提供的(de)基礎(chu)模型
Claude 3于3月初(chu)推出,分(fen)為Opus、Sonnet、Haiku三個規模,其中性能(neng)最強的Opus模型引各(ge)方面測評(ping)結果超(chao)越(yue)GPT-4一舉成為“最強大模型”。
▲Claude 3各模(mo)型性能對(dui)比
與Claude 2相比(bi),Claude 3最明顯的迭代體現在(zai)多模態能(neng)力、幻覺的降低、長(chang)文(wen)本(ben)能(neng)力等方(fang)面。例如借助視覺能(neng)力,Claude 3可以(yi)理解圖(tu)表、圖(tu)形(xing)、報告等文(wen)件,并從中提取數據。
▲Claude 3的多模態能力(li)
在準確率(lv)方面,Claude 3大幅改(gai)善(shan)了幻(huan)覺問(wen)題,對沒(mei)有把握的答案會進行(xing)標(biao)明(ming),而不(bu)是(shi)直接給出錯誤答案。
▲Claude 3幻覺降低
在應用(yong)(yong)場景上,Claude 3可(ke)(ke)以適用(yong)(yong)于代碼(ma)輔(fu)助、內容續寫、長文本(ben)知識召回總結等,也可(ke)(ke)以用(yong)(yong)在亞(ya)馬遜的“老本(ben)行”電商(shang)領域,用(yong)(yong)來撰(zhuan)寫電商(shang)商(shang)品(pin)描(miao)述。
基于Amazon Bedrock的(de)能力,AWS面向企(qi)業提供(gong)了(le)知識(shi)庫工具Knowledge Bases,為基礎模型和Agents提供(gong)來自企(qi)業內(nei)部數(shu)據源的(de)上下文信息,用于RAG(檢索(suo)增強生成),從(cong)而提供(gong)更(geng)相關、更(geng)準確(que)和更(geng)個(ge)性(xing)化的(de)響應。
Amazon Bedrock的Agents功(gong)能則利用基(ji)礎模(mo)型,提供使用自然(ran)語(yu)言進行(xing)交互(hu)和響應來執行(xing)多(duo)步驟業務任務的能力。
二、現場演示為老黃續寫PPT,扮演不同MBTI人格答題
AWS技(ji)術(shu)人員為我們現場演示了Claude 3“中杯”模型Sonnet的(de)多(duo)模態、長文本、代(dai)碼、翻譯等能力。
在第一個演示(shi)(shi)中,演示(shi)(shi)人(ren)員輸入了一張(zhang)英偉達(da)CEO黃仁勛演講的PPT,讓(rang)Claude總結(jie)PPT的內容。
▲輸入的PPT圖像
明顯能看出,Amazon Bedrock上搭載的Claude 3生成速度非常快,迅速總結出了(le)PPT上主(zhu)要(yao)內容。
▲Claude 3總結PPT內(nei)容
隨(sui)后,演示人員追(zhui)問Claude 3下一頁PPT可以考慮放(fang)哪些內(nei)容,又讓其(qi)按年份總(zong)結圖(tu)中內(nei)容,并歸(gui)納為表格形式。
▲Claude 3將PPT內容(rong)總結為(wei)表格形式
第二個(ge)演示展(zhan)現了(le)Claude 3的(de)(de)長文本能力。演示人員輸入(ru)小說(shuo)《流浪地球》中(zhong)(zhong)的(de)(de)一個(ge)片(pian)段(duan),在其中(zhong)(zhong)插入(ru)了(le)一句《三體》中(zhong)(zhong)的(de)(de)內(nei)容,讓Claude 3從(cong)中(zhong)(zhong)找(zhao)出不合理(li)的(de)(de)部分。
這(zhe)(zhe)是(shi)(shi)(shi)大(da)模型長文本(ben)能力(li)評(ping)測中十分(fen)重(zhong)要的(de)一(yi)種(zhong)測試。AWS大(da)中華區產品(pin)技(ji)術總監王曉野談道,之所以長文本(ben)能力(li)這(zhe)(zhe)么重(zhong)要,是(shi)(shi)(shi)因為在情(qing)感(gan)陪伴(ban)、資料讀取等應用場景(jing)中,對(dui)大(da)模型的(de)“記(ji)憶”能力(li)要求很(hen)高。尤其是(shi)(shi)(shi)AI陪伴(ban)類(lei)產品(pin),如果大(da)模型能記(ji)住幾(ji)(ji)個月甚至(zhi)幾(ji)(ji)年前用戶聊過(guo)的(de)內(nei)容,體驗感(gan)會大(da)幅提升。
▲Claude 3大海撈針能力(li)
隨后演示(shi)(shi)人員又展示(shi)(shi)了Claude 3的(de)詩歌翻譯能力,并與GPT-4做對(dui)比(bi)。雖然二者都未達(da)到“信達(da)雅”的(de)水準,但Claude 3的(de)翻譯用語更貼合(he)中文用詞(ci)習慣一些。
▲Claude 3翻譯能力
第四個(ge)演(yan)示針對代碼能力,演(yan)示人員(yuan)要求Claude 3生成一個(ge)貪吃蛇游戲的Python代碼設計,并(bing)給出了基本玩法和失(shi)敗條件。
▲貪(tan)吃蛇游戲Prompt
Claude 3按照(zhao)需(xu)求(qiu)生成了一個(ge)完整的代碼文檔(dang),演示人員將(jiang)代碼復制到(dao)編譯器中運行,貪吃蛇游(you)戲(xi)成功運行起來(lai),并且符合失敗(bai)條件,在(zai)蛇撞到(dao)地圖邊緣(yuan)時游(you)戲(xi)結束。
▲貪吃蛇游戲演示
最后(hou),演示人員展(zhan)示了(le)Claude 3的(de)(de)開放(fang)性(xing)問題(ti)(ti)理(li)解能力。通過一個網上很(hen)火的(de)(de)性(xing)格測試MBTI的(de)(de)問題(ti)(ti),讓大模型判斷不同MBTI人格對同一個問題(ti)(ti)的(de)(de)反(fan)應(ying):如果看到一匹馬進入(ru)酒(jiu)吧(ba),你認為馬會說什么?
在扮演(yan)ESTJ、ENFP兩種不同(tong)人格時,Claude 3分別(bie)站在理性務實、富有想(xiang)象力和創造力的角度回答了這個問題(ti)。
▲Claude 3扮演ESTJ人(ren)格(ge)
▲Claude 3扮演ENFP人(ren)格
結語:AWS為企業客戶打通大模型落地“最后三公里”
通過(guo)投資Anthropic和提(ti)供(gong)Claude 3模(mo)(mo)型,AWS再次提(ti)升了作為云平(ping)臺的競爭力。相(xiang)比直接(jie)使用(yong)Claude 3的API(應用(yong)程序接(jie)口),Amazon Bedrock能夠提(ti)供(gong)更為穩定的大(da)模(mo)(mo)型能力,并通過(guo)知識庫(ku)、Agents等(deng)工具提(ti)供(gong)差異(yi)化(hua)價(jia)值(zhi),幫(bang)助企業(ye)平(ping)衡成本與模(mo)(mo)型能力。
通(tong)過構建完整(zheng)的(de)生成(cheng)式(shi)AI技術棧,從基(ji)礎(chu)設(she)施(shi)到工具(ju)鏈,再到具(ju)體的(de)AI應用,AWS全方位支持企業客戶數字化轉型(xing)。Amazon Bedrock平(ping)臺為企業提供(gong)了強大的(de)知識(shi)庫(ku)工具(ju)和Agents功(gong)能,使得大模型(xing)的(de)應用更加貼(tie)合實際業務需求,同時,AWS還通(tong)過試驗迭代、專業培訓(xun)、原(yuan)型(xing)開(kai)發(fa)等(deng)服務,為企業用戶提供(gong)打通(tong)大模型(xing)落地(di)的(de)“最后(hou)三(san)公(gong)里”。