AWS搭载“最强大模型”！40亿美元投向OpenAI竞对，打通商业化落地“最后三公里”

智東西（公眾號：zhidxcom）
作者 | 香草
編輯 | 李水青

智(zhi)東西4月2日報(bao)道，今天，亞(ya)馬遜云科技（AWS）與智(zhi)東西等少數(shu)媒體分享了與AI創企Anthropic合作的最新進展(zhan)，并現場演示了Claude 3大模(mo)型(xing)的多(duo)模(mo)態、長文本(ben)、語(yu)境理解等能力。

AWS近日宣(xuan)布向(xiang)Anthropic追(zhui)加投資27.5億美(mei)(mei)元，截(jie)至目前(qian)已經向(xiang)這家(jia)OpenAI強力競對累計注資40億美(mei)(mei)元。此外，雙方的(de)合作關系也(ye)再次加深(shen)，Amazon Bedrock引入了Anthropic最新發布的(de)Claude 3模型。

會后(hou)，AWS大(da)中華區產品部總經理陳曉建向我們(men)分享了(le)大(da)模型落地(di)(di)實踐的解讀。在他看來，大(da)模型想(xiang)要(yao)打通落地(di)(di)最后(hou)N公里，需要(yao)選(xuan)擇(ze)一個(ge)具體的、簡單的切入(ru)點(dian)(dian)，從點(dian)(dian)到面逐步擴展應用(yong)場景(jing)，由簡單到復雜逐步切入(ru)。

當(dang)談到AWS下一(yi)步的發展戰略時，他稱從客戶需求來看，目前芯片等(deng)硬件(jian)設施仍然落后(hou)于大模(mo)(mo)型的發展，其迭代速度跟不上模(mo)(mo)型參數(shu)規模(mo)(mo)的指數(shu)級提升，如何將(jiang)底層能(neng)力與大模(mo)(mo)型復雜度相匹配，是現(xian)在(zai)面臨(lin)的主要(yao)挑戰。

一、從基礎設施、工具鏈到AI應用，構建生成式AI完整技術棧

陳曉建首先(xian)解讀了(le)AWS的(de)生成式AI技術(shu)棧。目前，AWS在(zai)基礎設(she)施(shi)層面提(ti)供(gong)GPUs、自(zi)研Trainium芯片(pian)、Nitro系(xi)統等(deng)底層設(she)施(shi)，在(zai)大模(mo)型構建工具層面提(ti)供(gong)大模(mo)型托管平臺Amazon Bedrock，在(zai)應用層面則推出了(le)智能助手Amazon Q、代(dai)碼(ma)助手Amazon CodeWhisperer等(deng)。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲AWS生成式AI技術棧

在模(mo)型(xing)層面(mian)，除了此前(qian)提(ti)供(gong)的AI21Labs、Cohere、Meta、Stability AI以(yi)及亞馬遜自研的模(mo)型(xing)之(zhi)外，近期新增了Anthropic和法國創企(qi)Mistral AI的新模(mo)型(xing)。其(qi)中，Anthropic的Claude 3以(yi)其(qi)多模(mo)態推理、翻(fan)譯、總結等方面(mian)的優異能力(li)突出。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Amazon Bedrock提供的(de)基礎(chu)模型

Claude 3于3月初(chu)推出，分(fen)為Opus、Sonnet、Haiku三個規模，其中性能(neng)最強的Opus模型引各(ge)方面測評(ping)結果超(chao)越(yue)GPT-4一舉成為“最強大模型”。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3各模(mo)型性能對(dui)比

與Claude 2相比(bi)，Claude 3最明顯的迭代體現在(zai)多模態能(neng)力、幻覺的降低、長(chang)文(wen)本(ben)能(neng)力等方(fang)面。例如借助視覺能(neng)力，Claude 3可以(yi)理解圖(tu)表、圖(tu)形(xing)、報告等文(wen)件，并從中提取數據。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3的多模態能力(li)

在準確率(lv)方面，Claude 3大幅改(gai)善(shan)了幻(huan)覺問(wen)題，對沒(mei)有把握的答案會進行(xing)標(biao)明(ming)，而不(bu)是(shi)直接給出錯誤答案。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3幻覺降低

在應用(yong)(yong)場景上，Claude 3可(ke)(ke)以適用(yong)(yong)于代碼(ma)輔(fu)助、內容續寫、長文本(ben)知識召回總結等，也可(ke)(ke)以用(yong)(yong)在亞(ya)馬遜的“老本(ben)行”電商(shang)領域，用(yong)(yong)來撰(zhuan)寫電商(shang)商(shang)品(pin)描(miao)述。

基于Amazon Bedrock的(de)能力，AWS面向企(qi)業提供(gong)了(le)知識(shi)庫工具Knowledge Bases，為基礎模型和Agents提供(gong)來自企(qi)業內(nei)部數(shu)據源的(de)上下文信息，用于RAG（檢索(suo)增強生成），從(cong)而提供(gong)更(geng)相關、更(geng)準確(que)和更(geng)個(ge)性(xing)化的(de)響應。

Amazon Bedrock的Agents功(gong)能則利用基(ji)礎模(mo)型，提供使用自然(ran)語(yu)言進行(xing)交互(hu)和響應來執行(xing)多(duo)步驟業務任務的能力。

二、現場演示為老黃續寫PPT，扮演不同MBTI人格答題

AWS技(ji)術(shu)人員為我們現場演示了Claude 3“中杯”模型Sonnet的(de)多(duo)模態、長文本、代(dai)碼、翻譯等能力。

在第一個演示(shi)(shi)中，演示(shi)(shi)人(ren)員輸入了一張(zhang)英偉達(da)CEO黃仁勛演講的PPT，讓(rang)Claude總結(jie)PPT的內容。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲輸入的PPT圖像

明顯能看出，Amazon Bedrock上搭載的Claude 3生成速度非常快，迅速總結出了(le)PPT上主(zhu)要(yao)內容。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3總結PPT內(nei)容

隨(sui)后，演示人員追(zhui)問Claude 3下一頁PPT可以考慮放(fang)哪些內(nei)容，又讓其(qi)按年份總(zong)結圖(tu)中內(nei)容，并歸(gui)納為表格形式。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3將PPT內容(rong)總結為(wei)表格形式

第二個(ge)演示展(zhan)現了(le)Claude 3的(de)(de)長文本能力。演示人員輸入(ru)小說(shuo)《流浪地球》中(zhong)(zhong)的(de)(de)一個(ge)片(pian)段(duan)，在其中(zhong)(zhong)插入(ru)了(le)一句《三體》中(zhong)(zhong)的(de)(de)內(nei)容，讓Claude 3從(cong)中(zhong)(zhong)找(zhao)出不合理(li)的(de)(de)部分。

這(zhe)(zhe)是(shi)(shi)(shi)大(da)模型長文本(ben)能力(li)評(ping)測中十分(fen)重(zhong)要的(de)一(yi)種(zhong)測試。AWS大(da)中華區產品(pin)技(ji)術總監王曉野談道，之所以長文本(ben)能力(li)這(zhe)(zhe)么重(zhong)要，是(shi)(shi)(shi)因為在情(qing)感(gan)陪伴(ban)、資料讀取等應用場景(jing)中，對(dui)大(da)模型的(de)“記(ji)憶”能力(li)要求很(hen)高。尤其是(shi)(shi)(shi)AI陪伴(ban)類(lei)產品(pin)，如果大(da)模型能記(ji)住幾(ji)(ji)個月甚至(zhi)幾(ji)(ji)年前用戶聊過(guo)的(de)內(nei)容，體驗感(gan)會大(da)幅提升。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3大海撈針能力(li)

隨后演示(shi)(shi)人員又展示(shi)(shi)了Claude 3的(de)詩歌翻譯能力，并與GPT-4做對(dui)比(bi)。雖然二者都未達(da)到“信達(da)雅”的(de)水準，但Claude 3的(de)翻譯用語更貼合(he)中文用詞(ci)習慣一些。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3翻譯能力

第四個(ge)演(yan)示針對代碼能力，演(yan)示人員(yuan)要求Claude 3生成一個(ge)貪吃蛇游戲的Python代碼設計，并(bing)給出了基本玩法和失(shi)敗條件。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲貪(tan)吃蛇游戲Prompt

Claude 3按照(zhao)需(xu)求(qiu)生成了一個(ge)完整的代碼文檔(dang)，演示人員將(jiang)代碼復制到(dao)編譯器中運行，貪吃蛇游(you)戲(xi)成功運行起來(lai)，并且符合失敗(bai)條件，在(zai)蛇撞到(dao)地圖邊緣(yuan)時游(you)戲(xi)結束。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲貪吃蛇游戲演示

最后(hou)，演示人員展(zhan)示了(le)Claude 3的(de)(de)開放(fang)性(xing)問題(ti)(ti)理(li)解能力。通過一個網上很(hen)火的(de)(de)性(xing)格測試MBTI的(de)(de)問題(ti)(ti)，讓大模型判斷不同MBTI人格對同一個問題(ti)(ti)的(de)(de)反(fan)應(ying)：如果看到一匹馬進入(ru)酒(jiu)吧(ba)，你認為馬會說什么？

在扮演(yan)ESTJ、ENFP兩種不同(tong)人格時，Claude 3分別(bie)站在理性務實、富有想(xiang)象力和創造力的角度回答了這個問題(ti)。

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3扮演ESTJ人(ren)格(ge)

AWS搭載“最強大模型”！40億美元投向OpenAI競對，打通商業化落地“最后三公里”

▲Claude 3扮演ENFP人(ren)格

結語：AWS為企業客戶打通大模型落地“最后三公里”

通過(guo)投資Anthropic和提(ti)供(gong)Claude 3模(mo)(mo)型，AWS再次提(ti)升了作為云平(ping)臺的競爭力。相(xiang)比直接(jie)使用(yong)Claude 3的API（應用(yong)程序接(jie)口），Amazon Bedrock能夠提(ti)供(gong)更為穩定的大(da)模(mo)(mo)型能力，并通過(guo)知識庫(ku)、Agents等(deng)工具提(ti)供(gong)差異(yi)化(hua)價(jia)值(zhi)，幫(bang)助企業(ye)平(ping)衡成本與模(mo)(mo)型能力。

通(tong)過構建完整(zheng)的(de)生成(cheng)式(shi)AI技術棧，從基(ji)礎(chu)設(she)施(shi)到工具(ju)鏈，再到具(ju)體的(de)AI應用，AWS全方位支持企業客戶數字化轉型(xing)。Amazon Bedrock平(ping)臺為企業提供(gong)了強大的(de)知識(shi)庫(ku)工具(ju)和Agents功(gong)能，使得大模型(xing)的(de)應用更加貼(tie)合實際業務需求，同時，AWS還通(tong)過試驗迭代、專業培訓(xun)、原(yuan)型(xing)開(kai)發(fa)等(deng)服務，為企業用戶提供(gong)打通(tong)大模型(xing)落地(di)的(de)“最后(hou)三(san)公(gong)里”。

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

一、從基礎設施、工具鏈到AI應用，構建生成式AI完整技術棧

二、現場演示為老黃續寫PPT，扮演不同MBTI人格答題

結語：AWS為企業客戶打通大模型落地“最后三公里”

相關推薦