智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月17日(ri)報道,隨著DeepSeek展現出開源的威力,大模(mo)型競賽有(you)了新的敘事方(fang)式,各路云計算廠商(shang)接連宣布(bu)接入DeepSeek模(mo)型,但實際(ji)提供的服務質量卻參差(cha)不齊。這與云服務背后(hou)的基(ji)礎(chu)設施和(he)工(gong)程化能力密切相關。

企(qi)(qi)業部署和使用模(mo)型(xing)過(guo)程(cheng)中,需要(yao)綜合考量性能(neng)與成本之(zhi)間的(de)權衡、能(neng)否針對(dui)私(si)有數據(ju)進行定制優(you)化(hua)、數據(ju)和模(mo)型(xing)安不(bu)安全、是否便于實現(xian)各(ge)種智能(neng)體的(de)復雜調(diao)度等因素。亞馬(ma)遜云科技則通(tong)過(guo)在云和AI領域展(zhan)開的(de)全棧(zhan)式(shi)創新,兼(jian)具云端本身的(de)優(you)勢、多樣化(hua)模(mo)型(xing)選擇的(de)優(you)勢,并提供了一系列(lie)快速將模(mo)型(xing)運用到企(qi)(qi)業化(hua)生產(chan)環境中所需的(de)重要(yao)工具。

作為最早(zao)適配并上(shang)線DeepSeek的(de)云巨頭之一,亞馬遜云科技(ji)現已推出(chu)針對DeepSeek-R1模型(xing)多(duo)種不同(tong)的(de)部(bu)署方式,以(yi)便企業能(neng)在(zai)熟悉的(de)亞馬遜云科技(ji)環境中(zhong)(zhong)輕松(song)部(bu)署該系列模型(xing),例如在(zai)Amazon Bedrock Marketplace中(zhong)(zhong)部(bu)署,或在(zai)Amazon SageMaker Jumpstart中(zhong)(zhong)部(bu)署,也可以(yi)通(tong)過Amazon Bedrock自定義(yi)導入(ru)功能(neng)或Amazon EC2 Trn1實例中(zhong)(zhong)部(bu)署DeepSeek-R1-Distill系列模型(xing)。

一、云端部署:靈活可擴展,與豐富服務無縫集成

相比本(ben)地部署,云(yun)端(duan)部署的(de)(de)(de)優勢是(shi)算力(li)資源更充足,而且靈活可擴展。同時在(zai)云(yun)端(duan)部署能夠與豐富且成熟的(de)(de)(de)分析、數據等(deng)基(ji)礎(chu)服務進行(xing)無縫集成。作為全球云(yun)計(ji)算的(de)(de)(de)開(kai)創(chuang)者,亞馬遜云(yun)科技近20年來積累了深厚的(de)(de)(de)技術根基(ji),引領了一(yi)代代的(de)(de)(de)云(yun)端(duan)基(ji)礎(chu)設施(shi)創(chuang)新,在(zai)提高(gao)算力(li)利用率、加速(su)模型開(kai)發等(deng)方(fang)面都有長期經驗。

比如在自研芯(xin)片領域,亞馬遜云(yun)科技推(tui)出了基于Amazon Trainium2的(de)EC2 Trn2實例,性(xing)價比比當時(shi)GPU實例高30%-40%。還有第二代(dai)的(de)UltraCluster網絡架構(gou),支持超(chao)過20000個(ge)GPU協同工作,帶(dai)寬達(da)10Pb/s,延遲低于10ms,這一升級能夠將模型訓練時(shi)間縮短至少15%。

亞馬遜云科(ke)技推出的(de)新一(yi)代Amazon SageMaker,將(jiang)快速SQL分析、PB級大(da)數(shu)據處理、數(shu)據探索和集成、模型開發和訓(xun)練以及生成式AI等功能統一(yi)到一(yi)個集成平臺(tai),從而為(wei)客戶(hu)(hu)提供一(yi)個單一(yi)的(de)數(shu)據和AI開發環境,用戶(hu)(hu)可以在其中(zhong)查找和訪問其組(zu)織中(zhong)的(de)所有數(shu)據,為(wei)各種常見的(de)數(shu)據用例選擇最佳工具,并將(jiang)數(shu)據和AI項(xiang)目擴(kuo)展至團隊內不同分工角色以實(shi)現協作。

亞馬遜云(yun)科技大中華區產品部總經理陳(chen)曉建(jian)談道,亞馬遜云(yun)科技不僅(jin)在云(yun)的(de)核心服務層(ceng)面持續創(chuang)(chuang)新,更在從芯片到模(mo)型,再到應用(yong)的(de)每一個技術堆棧取得(de)突破(po),讓不同層(ceng)級的(de)創(chuang)(chuang)新相(xiang)互賦能、協同進化。

他相信只有這樣全棧聯動的大規模創新,才能真正滿足當(dang)今客戶的發(fa)展需求(qiu),加速(su)前沿(yan)技術的價(jia)值釋放。

二、多樣化模型選擇,按需組出性價比

跟其他云服(fu)務(wu)大廠相比,亞馬遜云科技生成(cheng)式(shi)AI服(fu)務(wu)的一大特(te)色,就是模型選擇多(duo)。

基(ji)于“不會有一個模型(xing)一統天下”的(de)判斷(duan),亞(ya)馬(ma)遜(xun)云(yun)科(ke)技在自研(yan)大模型(xing)的(de)同時,也將來自不同企(qi)業、不同功能的(de)領先大模型(xing)匯聚在一起,放到云(yun)中的(de)“大模型(xing)貨架”上,供客(ke)戶按需(xu)實現最具(ju)性價比的(de)組(zu)合(he)。

在(zai)(zai)實(shi)際(ji)構建生成(cheng)式AI應(ying)用(yong)時,不同應(ying)用(yong)場景需(xu)要(yao)的(de)(de)性能、成(cheng)本、響(xiang)應(ying)速度、微(wei)調能力(li)(li)、知識庫協調能力(li)(li)、多模態支持能力(li)(li)等技術(shu)指標各不相同。比如在(zai)(zai)快速響(xiang)應(ying)場景,需(xu)要(yao)花一些時間推理的(de)(de)DeepSeek R1深層(ceng)思(si)考(kao)模式就(jiu)不太適(shi)用(yong),其生成(cheng)首個token的(de)(de)用(yong)時可(ke)能要(yao)超過30秒;而(er)Amazon Nova模型的(de)(de)響(xiang)應(ying)就(jiu)非(fei)常快,只(zhi)耗時數百毫(hao)秒。

此前其“大模型(xing)貨架”上已經有來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等(deng)知(zhi)名廠商的大模型(xing)。亞馬遜(xun)云科技還在不斷擴展其模型(xing)“朋友(you)圈”。

比如上(shang)個月(yue)Amazon Bedrock平臺剛剛上(shang)線了Luma AI的(de)最新版視頻(pin)生成模型(xing)Ray 2模型(xing),可以廣(guang)泛用于內(nei)容創(chuang)建、娛樂(le)、廣(guang)告和媒(mei)體(ti)使(shi)用案例,從(cong)(cong)而簡(jian)化從(cong)(cong)概念到執(zhi)行(xing)的(de)創(chuang)意流程(cheng)。

亞馬遜云科技(ji)的Amazon Bedrock Marketplace功能(neng)為客戶提(ti)供(gong)100多個(ge)熱門、新興及專業模型,DeepSeek-R1就(jiu)包含在內。

怎么用DeepSeek高效開發應用?解讀亞馬遜云科技三大秘籍▲在(zai)Amazon SageMaker Jumpstart中快速部署DeepSeek模型(xing)

三、企業級AI工具全家桶:從性能提升到復雜多智能體編排

選擇合(he)適的模型,下一步是如何高(gao)效(xiao)解決工程化難(nan)題。

Amazon Bedrock聚焦(jiao)企(qi)業(ye)應用AI的(de)實際(ji)需(xu)求,提(ti)供了(le)企(qi)業(ye)AI工具全家桶,涉(she)及模(mo)型從原型走向企(qi)業(ye)化生產環(huan)境時必須要(yao)考慮的(de)方(fang)方(fang)面面的(de)工具,以便開發者基于領(ling)先模(mo)型來(lai)快速構(gou)建應用。

例如DeepSeek模型(xing)有不(bu)同(tong)參(can)數量,小(xiao)至幾(ji)十億,多達(da)6710億。要實(shi)現完(wan)整部署R1并實(shi)現盡可能(neng)好(hao)的推理和(he)響應,需要如Amazon EC2 P5e性能(neng)級別的硬件和(he)配套(tao)的便(bian)捷工具(ju)。

怎么用DeepSeek高效開發應用?解讀亞馬遜云科技三大秘籍▲通過Amazon Bedrock Marketplace部署(shu)DeepSeek-R1,可選實例包括EC2 P5e的(de)48xlarge型號,單個實例包含8顆H200 GPU,以及3200Gbps的(de)網絡帶寬(kuan),充分滿(man)足DeepSeek-R1的(de)性能需求

亞馬遜(xun)云科技(ji)提供(gong)的實用(yong)工具有助于優化成本、根據(ju)自有數據(ju)定制提升準確性(xing)、安全性(xing)以及針對未來復(fu)雜的多(duo)智能體構建和管理等。可以簡(jian)要概(gai)括為以下4類:

1、優化效果、延遲和成本:如低(di)延遲優化推理(li)(li)、模(mo)型(xing)(xing)蒸餾(liu)、提示詞緩存等功能,大幅(fu)提升推理(li)(li)效(xiao)率。其(qi)中模(mo)型(xing)(xing)蒸餾(liu)功能可(ke)將(jiang)特定知識從功能強大的大模(mo)型(xing)(xing)轉移到更小更高(gao)效(xiao)的模(mo)型(xing)(xing),運(yun)行速度(du)最快可(ke)提高(gao)500%,成本降(jiang)低(di)75%。

2、基于企業自有數據的定制優化:模型(xing)微調功(gong)能、知識庫功(gong)能不斷豐富,現(xian)已(yi)支持(chi)GraphRAG等(deng)圖數據,能夠快速且經濟高效地(di)從文(wen)檔、圖像、音(yin)頻以及(ji)視頻中提取(qu)信息(xi),并(bing)將其轉換(huan)為結構化格式的Amazon Bedrock Data Automation功(gong)能等(deng)。

3、負責任AI的安全和審查:Amazon Bedrock不斷豐富其(qi)護欄功能(neng),以簡化企業實(shi)施負責(ze)任(ren)AI所需的投入,例(li)如(ru)為其(qi)加入自(zi)動(dong)推理檢查功能(neng),從而能(neng)夠輕(qing)松(song)識別事(shi)實(shi)性錯誤,以提升生成回(hui)答(da)的準(zhun)確性。

4、實現復雜功能的多智能體功能:Amazon Bedrock不(bu)但提供智(zhi)能(neng)(neng)體(ti)功(gong)能(neng)(neng),還進一步(bu)推出了多智(zhi)能(neng)(neng)體(ti)協作功(gong)能(neng)(neng),使(shi)客(ke)戶能(neng)(neng)夠(gou)輕松地構建和協調(diao)專(zhuan)業智(zhi)能(neng)(neng)體(ti)來執(zhi)行(xing)復雜的(de)工(gong)作流程(cheng)。客(ke)戶可以(yi)通過為項目的(de)特(te)定步(bu)驟創建和分配(pei)專(zhuan)用智(zhi)能(neng)(neng)體(ti),獲得更準(zhun)確的(de)結(jie)果并加速(su)任務。

怎么用DeepSeek高效開發應用?解讀亞馬遜云科技三大秘籍

▲在Amazon Bedrock模型定制頁(ye)面部署DeepSeek 88Llama Model

結語:用全棧式創新托舉企業級AI構建

在2024 re:Invent上,亞(ya)馬遜CEO Andy Jassy曾分享(xiang)亞(ya)馬遜自身部署AI中的三(san)項關鍵洞察(cha):首(shou)先,隨(sui)著生成式AI應(ying)用規模的擴大,計算成本變得至關重要;人們非常渴望獲得更高的性價比;其次,構建一個真正優秀的生成式AI應(ying)用非常困難;第三(san),永(yong)遠不會有單一的工具(ju)能夠統治世界,要提(ti)供多樣化的模型,讓開(kai)發者(zhe)自由選擇。

亞(ya)馬遜云科技(ji)在云端部署方面的(de)靈活(huo)可擴展性(xing)、多樣(yang)化(hua)模型選(xuan)擇(ze)以及實用工具的(de)提(ti)供,則無一不是(shi)對(dui)這些洞察(cha)的(de)有(you)力(li)回應(ying)。

通(tong)過上述三大優勢,亞馬(ma)(ma)遜云(yun)科技(ji)正(zheng)在幫助企業(ye)更(geng)快更(geng)好(hao)地運用(yong)領先(xian)的模(mo)型(xing)(xing)。亞馬(ma)(ma)遜云(yun)科技(ji)對DeepSeek的積極擁(yong)抱,也在踐行其(qi)此前向(xiang)客戶所承(cheng)諾的——托管最流行的、具有創(chuang)新(xin)性的AI模(mo)型(xing)(xing)。隨著DeepSeek催化開(kai)源風暴(bao),未來(lai)我們將看到更(geng)多(duo)優質(zhi)新(xin)模(mo)型(xing)(xing)的誕(dan)生(sheng),而(er)無論模(mo)型(xing)(xing)種類如何(he)繁多(duo),亞馬(ma)(ma)遜云(yun)科技(ji)的全棧式(shi)創(chuang)新(xin)都(dou)形成穩(wen)固的托舉。