
智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影
在(zai)生(sheng)成式AI競賽中,亞馬遜云科技(AWS)多少有些“另類(lei)”。它不像其他云大廠(chang)那樣強調(diao)自研模型(xing)的頂(ding)尖性能,而是早早推出一個大模型(xing)貨架,集郵般擺上了各家(jia)頭部大模型(xing),供客戶(hu)挑選。
“沒有一個模型能包辦一切”,這個被亞馬遜頻繁強調的理念,已經逐漸深入人心。而在今年的年度云計算產業盛會re:Invent上,亞馬遜云科技卻又意外地發布全新大模型系列Nova的6款前沿模型,而且劇透了明年將發布的兩款特別模型——語音到語音、任意到任意(Any-to-Any)。
這意味著(zhu)亞馬遜(xun)云科技在(zai)重押美國大(da)模型獨角獸Anthropic的同(tong)時,對自(zi)研模型也并未(wei)松懈(xie)。
在re:Invent期間,亞馬遜云科技生成式(shi)AI全球副總裁兼總經理Vasi Philomin與智東(dong)西等少數媒體就這些問題(ti)進行了(le)深入交流(liu)。他談到當(dang)前文本(ben)模型需(xu)求(qiu)最大,語音到語音也非常流(liu)行(如實(shi)時同傳翻譯),任意到任意則是更遠的未來。
任意(yi)到任意(yi)模型屬(shu)于(yu)多模態(tai)到多模態(tai),用戶可以(yi)輸入文本、語音(yin)、圖(tu)像或視(shi)頻(pin)等多種形式的內容,并相應地輸出文本、語音(yin)、圖(tu)像或視(shi)頻(pin)。
Vasi Philomin向我們解釋說,任(ren)意(yi)(yi)到(dao)任(ren)意(yi)(yi)模(mo)型(xing)適用于(yu)變化很多(duo)的情況,比(bi)如不能(neng)確定是(shi)圖像還是(shi)視頻類型(xing)。“你(ni)不能(neng)把任(ren)意(yi)(yi)到(dao)任(ren)意(yi)(yi)模(mo)型(xing)用作文本到(dao)文本的模(mo)型(xing),”他強調道,“它可能(neng)成(cheng)本挺高(gao),但效果(guo)反而不好。”
最(zui)強未(wei)必是最(zui)優解(jie),好(hao)用才是硬道理。
整場re:Invent大會都在(zai)源(yuan)源(yuan)不斷地傳遞一(yi)(yi)個(ge)(ge)信號——亞馬遜云科技(ji)的生(sheng)成(cheng)式AI競(jing)爭(zheng)力勝在(zai)全(quan)面,有琳瑯(lang)滿目(mu)的大模型(xing)品類,還有加速從訓練到推理的各種工(gong)具“套餐”,以及圍(wei)繞(rao)平臺、存儲、網(wang)絡(luo)、數據庫的一(yi)(yi)系列升級……一(yi)(yi)切變動(dong)都指(zhi)向一(yi)(yi)個(ge)(ge)目(mu)的,即讓(rang)云客戶更快(kuai)更方便地用生(sheng)成(cheng)式AI產生(sheng)價值(zhi)。
在沙利文大中華(hua)區總(zong)監李慶看來(lai),本屆re:Invent大會上(shang)的(de)新(xin)發布更加側重于產品的(de)實際應(ying)用和(he)工具(ju)優化,這(zhe)表明(ming)過(guo)去一年中,全球用戶正在積極使(shi)用亞馬遜云科技進(jin)行生成式AI應(ying)用的(de)探索和(he)創新(xin)。
有兩(liang)個方面令他印象深刻:一(yi)(yi)是隨(sui)著全(quan)球(qiu)企業對(dui)(dui)生成(cheng)(cheng)式(shi)AI的(de)深入應(ying)用,數(shu)(shu)據(ju)不僅實現(xian)跨(kua)區域的(de)傳輸與(yu)協(xie)同(tong),更實現(xian)跨(kua)地域、跨(kua)區域的(de)深度連接(jie);二是亞(ya)(ya)馬(ma)遜云科(ke)技(ji)進(jin)(jin)一(yi)(yi)步優(you)化生成(cheng)(cheng)式(shi)AI的(de)應(ying)用,從數(shu)(shu)據(ju)存儲(chu)、治理(li)(li)(li)到管(guan)理(li)(li)(li)的(de)全(quan)流程(cheng)提升,旨(zhi)在簡化AI對(dui)(dui)數(shu)(shu)據(ju)的(de)使用,同(tong)時強化模(mo)型(xing)功(gong)能(neng)、增加AI Agent管(guan)理(li)(li)(li)和應(ying)對(dui)(dui)模(mo)型(xing)幻覺的(de)功(gong)能(neng)。此外,新發(fa)(fa)布的(de)Amazon Nova大模(mo)型(xing)家族備受期(qi)待,這一(yi)(yi)系列(lie)的(de)模(mo)型(xing)和亞(ya)(ya)馬(ma)遜云科(ke)技(ji)的(de)開放選(xuan)擇(ze)理(li)(li)(li)念將為用戶帶來更多(duo)創新機會,進(jin)(jin)一(yi)(yi)步推動(dong)AI的(de)發(fa)(fa)展。
一、大模型貨架上新:不會厚此薄彼,提供試用機會
新發布的Nova基礎模型包括Micro、Lite、Pro、Premier模型,Micro是純文本模型,后三者都是多模態模型,還有文生圖模型Canvas和文生視頻模型Reel。這(zhe)些(xie)模(mo)型都支持微調和(he)蒸(zheng)餾,還(huan)與Amazon Bedrock的(de)知識庫深度集成(cheng)(cheng),可(ke)用于檢索增強生成(cheng)(cheng)(RAG)。
Vasi Philomin告訴(su)智東西,亞馬(ma)遜云科技的(de)每個新(xin)模(mo)型、新(xin)服務在面(mian)世前(qian)都會經過內(nei)部討論流程,Bedrock寓意(yi)“基(ji)石”,Nova寓意(yi)“新(xin)”。他(ta)說亞馬(ma)遜云科技不會公布模(mo)型參(can)數(shu)的(de)情況(kuang),怎(zen)么選(xuan)擇取決(jue)于客戶想要擁有怎(zen)樣的(de)靈活度(du)。
“我(wo)們對所有的模型(xing)都一視同仁(ren)。”作為Amazon Bedrock的負責人,Vasi Philomin稱自己(ji)的團(tuan)隊非常(chang)中立(li),不會(hui)在模型(xing)間厚此薄彼(bi)。
定(ding)價由(you)模型(xing)提供(gong)商設置,不同情況(kuang)下有很多不同的考量。亞馬(ma)遜云科技(ji)沒(mei)有去(qu)綁定(ding)某(mou)一個特定(ding)的模型(xing),始終向客(ke)戶(hu)提供(gong)選(xuan)擇(ze)的空間。
大(da)模(mo)型只是生成式(shi)AI應用(yong)創新的一部分。亞馬遜云科技的全托管AI平臺Amazon Bedrock除了(le)提供(gong)了(le)各(ge)種大模(mo)型外,還有專門的試用(yong)服(fu)務(wu)。客戶可以(yi)在嘗(chang)試后根據(ju)效(xiao)果和價(jia)位(wei)進行綜合考慮(lv)。
此外,亞馬遜云科(ke)技提供有(you)模(mo)型(xing)版本政(zheng)策,在(zai)模(mo)型(xing)生命周期(qi)結束的(de)時候(即新(xin)產品不(bu)再(zai)使用時),會再(zai)給客戶6個(ge)(ge)月的(de)時間(jian)。在(zai)Vasi Philomin看來,一些新(xin)老(lao)版本替代會占用計算(suan)資源,從成本、效率的(de)角(jiao)度不(bu)見(jian)得(de)劃算(suan),換個(ge)(ge)新(xin)的(de)可(ke)能更(geng)省(sheng)錢。
亞馬遜云科技對Nova模型性價比很有信心,稱它們比Amazon Bedrock中的其他領先模型大約便宜75%。
二、Amazon Bedrock五大功能:挑選模型,結合數據,構建Agent
在(zai)re:Invent大會上,亞(ya)(ya)馬遜CEO Andy Jassy分享了(le)亞(ya)(ya)馬遜內部構(gou)建近1000個生成式AI應用所積累的三(san)條經驗:
1、當(dang)生(sheng)成(cheng)式AI應用達到一定規(gui)模(mo),計算(suan)成(cheng)本(ben)的(de)重要(yao)性(xing)(xing)就凸顯出來。客戶普遍希望獲(huo)得更高性(xing)(xing)價(jia)比。
2、打造一個真正優質的(de)生成(cheng)式AI應用程序(xu)頗(po)具難度,除了有好模型(xing),還要設置恰(qia)當的(de)“護欄”,保證消息傳(chuan)遞(di)流暢,擁(yong)有合(he)適的(de)用戶界面,讓用戶用起來不(bu)卡(ka)頓(dun),而(er)且(qie)要具備合(he)理(li)的(de)成(cheng)本結構。
3、不會(hui)出現一(yi)(yi)種工具一(yi)(yi)統(tong)天下的情況。開(kai)發者并沒有(you)一(yi)(yi)窩蜂地(di)選用(yong)(yong)性能最(zui)頂尖的模(mo)型(xing),會(hui)采(cai)用(yong)(yong)不同模(mo)型(xing),也會(hui)采(cai)用(yong)(yong)一(yi)(yi)些自研(yan)模(mo)型(xing)。
亞馬遜云科技在2023年9月推出的全托管AI平臺Amazon Bedrock則做到了上述能力的集合。據Vasi Philomin分享,該平臺已發展成亞馬遜云科技目前增長速度最快的服務。
亞馬(ma)遜云科技CEO Matt Garman稱Amazon Bedrock是目前構建(jian)和(he)擴展生成式AI應用最簡(jian)便的方式,尤其(qi)擅長為客戶提供將(jiang)生成式AI集成到(dao)生產應用程序中所需的一切要素(su)。
Amazon Bedrock的定位是幫助用戶更好地試用模型,主要有五大功能:1)選模型;2)找到成本性能和準確性的一個平衡;3)集成業務數據;4)要集成業務的安全性;5)構建Agent。
該(gai)平(ping)臺的多項發布和(he)創新(xin),也圍繞這五(wu)大功能展開。
首先在選模型上,除了亞馬遜云科技新發布的自研大模型Nova系列以及來自全球9家領先AI公司的高性能基礎模型外,這家云計算大廠還推出了Amazon Bedrock Marketplace,提供來自100多個新興和專業基礎模型,支持客戶用統一API來調用并利用Amazon Bedrock中的能力來構建應用。
為了讓挑模型更省事,Amazon Bedrock智能提示詞路由功能可以動態地將請求路由到最有可能以最低成本出最佳響應的模型,在不影響準確性的情況下能將成本降低30%。這樣開發人員就不用花大量時間來試驗和找到最適合每個用例的模型。
其次在尋求業務需求、專業知識、預算與模型精度、成本、延時的平衡方面,模型蒸餾很有用。
模型蒸餾將特定知識從一個大而準確的教師模型蒸餾出一個更小但在特定場景中非常高效的定制模型。使用新推出的Amazon Bedrock模型蒸餾,蒸餾過的模型相比被蒸餾的模型,運行速度能夠快500%,成本降低75%,而且Amazon Bedrock會幫助搞定所有相關工作。
Amazon Bedrock新發布的延遲優化推理選項、提示詞緩存功能也能進一步降低延遲,大幅縮減成本。
獲得合適模型后,下一步是將企業數據與智能模型相結合。
將數據添加到模型中并進行整合的一種熱門方法叫檢索增強生成(RAG),有助于模型基于企業數據提供更相關、更準確且更具定制化的回應。
亞馬遜云科技在今年早些時候推出了Amazon Bedrock知識庫功能,它屬于托管的RAG索引,能將所有的數據攝取、檢索及增強工作流實現自動化,無需用戶自行對這些環節進行全面管理。
客戶只需將(jiang)(jiang)知識庫(ku)指向自(zi)己的數據(ju)源,它就(jiu)會自(zi)動將(jiang)(jiang)其轉換為文本嵌入,然后存(cun)儲(chu)到一個向量(liang)數據(ju)庫(ku)中。這樣客戶就(jiu)能(neng)隨時進行自(zi)動檢(jian)索了,并且所(suo)有(you)的檢(jian)索結(jie)果(guo)都會自(zi)動包含引用(yong)信息,方便用(yong)戶知曉信息來源、提升理(li)解(jie)程度。
知識庫已經是Amazon Bedrock中最受歡迎的功能之一,并在持續添加新功能,比如新增對向量數據庫、結構化數據檢索、GraphRAG的支持。
Amazon Kendra GenAI Index則能為知識庫提供語義準確性高的托管檢索方案,內置超過40多個企業數(shu)據源。
Amazon Bedrock知識庫支持結構化數據檢索、GraphRAG,可查詢各種來源的所有結構化數據,自動生成知識圖譜。新發布的Amazon Bedrock Data Automation功能則可以自動將(jiang)非(fei)結構(gou)化(hua)的多模態內容轉(zhuan)換為(wei)結構(gou)化(hua)數據,無需(xu)寫代碼,讓(rang)將(jiang)多模態內容用于生(sheng)成式AI的過程變得更容易。
導入自己的企業數據后,需要考慮安全性和設定AI應用程序的功能邊界。
對此亞馬遜云科技推出了Amazon Bedrock Guardrails護欄功能,用于輕松定義應用程序的安全性,并實施負責任的AI檢查。使用這個功能,你可以限制AI應用只在特定領域回答問題。
針對模型幻覺問題,可行技術之一是自動推理,亞馬遜云科技在諸多幕后服務中都運用了該技術。這是一種能夠從數學角度證明某事正確的AI形式,通常被用于驗證系統是否按照既定要求運行,尤其適用于系統覆蓋面大到無法人工逐一查看,且有關于系統運行方式的知識庫的場景。
最新推出的是Amazon Bedrock自動推理檢查功能,可以對模型所做出的陳述進行準確性檢查,防止因模型幻覺而導致錯誤。
亞馬遜云科技還發布了Amazon Bedrock Guardrails多模態毒性檢測功能,能夠篩查非結構化數據中可能包含的潛在有害內容。
最后涉及到怎么利用優質數據采取行動。
亞馬遜云科技此前推出了Amazon Bedrock Agent功能,讓構建智能體變得更容易。客戶只需用自然語言描述想要Agent完成的任務,它就能快速構建出來。被構建出的Agent可以處理銷售訂單、編制財務報告、分析客戶留存情況等任務。背后用到的模型推理技術使Agent能分解工作流程,調用正確的API來執行操作。
在此基礎上,針對多智能體并行操作的任務,亞馬遜云科技又推出了Amazon Bedrock多Agents協作功能,能夠構建、部署和編排多個Agents,協同處理復雜的多步驟任務。
跟前面的做法(fa)差(cha)不(bu)多(duo),客戶可以創建(jian)(jian)一(yi)個(ge)專為特(te)定個(ge)性化任務設計的Agent,再創建(jian)(jian)一(yi)個(ge)監(jian)督Agent,它(ta)就好(hao)比復雜工作流程的“大腦”,負責協(xie)調分配、確保(bao)多(duo)Agent之間能夠有效協(xie)作,并能設定哪些(xie)Agent能訪問機密(mi)信(xin)息,把原(yuan)本難以協(xie)調的工程任務變(bian)得簡單易行。
總體(ti)來說,Amazon Bedrock的(de)功能不止是(shi)為了方(fang)便客戶獲取業(ye)界先進模型,而是(shi)內置了很多配套工具和工程化能力,可以讓實(shi)際業(ye)務與(yu)生成(cheng)式AI結合的(de)操(cao)作過程更(geng)(geng)方(fang)便、結果更(geng)(geng)奏效。
三、下一代Amazon SageMaker:數據分(fen)析和(he)AI需求的統一訪問(wen)中心
生成式AI應用創新要取得成功,需要有AI ready的數據。因此,亞馬遜云科技發布了新一代Amazon SageMaker,從產品及品牌方面將其重新定位為“所有數據、分析和人工智能需求的中心”。
很多云客戶在數據的治理、發現、處理、分析以及生成式AI應用創新方面的需求越來越融合。對此,亞馬遜云科技發布了Amazon SageMaker Unified Studio。這是一個單一的數據和AI開發環境,整合了在亞馬遜云科技中分析師和數據科學家所使用的各種服務、查詢編輯器、可視化工具,以便客戶訪問組織中的所有數據,并使用最適合的工具對其進行操作。
亞馬遜云科技還推出了面向應用程序的Zero-ETL,幫客戶無需構建和管理數據管道,即可分析存儲在許多最受歡迎的第三方SaaS應用程序中的數據。
另一個新發布的Amazon SageMaker Lake House兼容Apache Iceberg,針對所有結構化和非結構化數據源提供單一界面,跨不同數據源提供簡單統一的數據接入與訪問控制。客戶可(ke)以在Unified Studio中輕(qing)松處(chu)理所有(you)數據(ju),也可(ke)以直接從任何(he)支持Apache Iceberg的第(di)三方AI或分析(xi)工具或查詢引擎訪問該(gai)功(gong)能。
為了(le)一站式(shi)解決生成式(shi)AI全生命周期的問題,Amazon SageMaker AI將大數據分析、機器學習、模型開發和生成式AI方面的經驗融合到一個統一平臺中,統一了數據、分析和AI工作流,從而幫助消除機器學習和分析生命周期中的重復勞動。
針對大規模參數帶來的模型訓練和推理挑戰,亞馬遜云科技推出Amazon SageMaker HyperPod靈活訓練計劃和任務治理(li)功能,以優化計算資源管理。
靈活訓練計劃基于Amazon EC2容量塊,根據時間線和預算創建最佳訓練計劃,自動預留容量,設置集群,創建模型訓練作業,能夠為數據科學團隊節省數周訓練時間,最大化計算資源利用率,可節省多達40%的成本。
任務治理功能針對管理跨團隊的和項目的計算資源的挑戰,通過自動化生成式AI任務的優先級排序和管理,確保分配給最高優先級任務并按時完成,從而進一步提高開發效率并降低成本。
這兩個功能(neng)能(neng)夠大幅提高訓練和(he)推理(li)工作負載部署的靈活性和(he)對底(di)層硬件資(zi)源的使用(yong),讓底(di)層硬件資(zi)源發揮出更好(hao)效能(neng)。
此外,亞馬遜云科技宣布合作伙伴的AI應用已在Amazon SageMaker上可用。客戶無需預配或管理基礎(chu)設施,可(ke)加(jia)速模(mo)型(xing)開(kai)發生命周期,并有數據安全和隱私保障(zhang)。
接下來一年,亞馬遜云科技還(huan)將為新(xin)的Amazon SageMaker添(tian)加大量新(xin)功能,如AutoML、低(di)代(dai)碼體驗(yan)、專業化AI服(fu)務集成(cheng)、流處理(li)和搜索,以及Zero-ETL的更(geng)多服(fu)務和數據訪問(wen)。
四、生成式AI助手Amazon Q再進化,提升企業生產力
Amazon Q是在Bedrock上搭(da)建起來的一個(ge)生成式AI助手(shou)應(ying)用。即使你沒有寫(xie)過一行Python代碼,你也(ye)可以用(yong)自然語(yu)言簡單陳述(shu)業務(wu)問題,它會指導你完成構建機器學習模型(xing)的過程。
其中Amazon Q Developer是軟件開發方面的生成式AI助手,最新推出了3款全新自主Agent,能幫助開發人員生成單元測試、文檔、代碼審查。
針對從Windows、VMware進行現代化改造的情況,亞馬遜云科技提供了現代化Windows.NET應用、加速VMware工作負載和主機遷移的功能,以及首個支持IBM z/OS的主機遷移解決方案,可以大幅縮短遷移時間和成本,并顯著降低風險。
在運營環節,亞馬遜云科技通過提供Amazon Q Developer Investigate issues across your Amazon environment in a fraction of the time功能,來幫助更輕松地排查問題。
企業級(ji)生成式AI助(zhu)手Amazon Q Business可連接不同的業務系統、企業數據源,支持跨越各種數據庫與所有企業數據進行對話。Q Business為企業數據創建了一個索引,可以從Adobe、Microsoft Office、SharePoint、Gmail、Salesforce、ServiceNow等源中去索引過去一年的數據,并對所有數據保持高(gao)度安全、控制用戶(hu)權(quan)限。
最新發布的功能是將Amazon QuickSight和Amazon Q Business的數據結合,以一種視圖呈現,通過自然語言與Q系統對話,快速生成商業報告和數據分析,協助客戶做出更好的決策并提升業務效率。目前絕大多數信息都是通過商業智能系統來訪問的,已有超過10萬的客戶在使用Amazon QuickSight來滿足分析需求。
亞馬遜云科技提供了一套全新的Q Business?API,以便獨立軟件供應商訪問在自有軟件中集成Amazon Q Index。
針對一些涉及多個應用程序、審批環節和手動輸入的復雜工作流,亞馬遜云科技新發布的Amazon Q Business Automate能夠幫助創建跨團隊和應用程序的自動任務,通過使用一系列高級Agent來創建、編輯、維護工作流程。在啟動工作流后,還會有一個Q Agent持續對其進(jin)行監控,確保能夠自動調整并及時修(xiu)復(fu)。以往完成這些工作(zuo)可能需要花(hua)費數(shu)周或數(shu)月,而現(xian)在僅需幾分鐘(zhong)。
結語:從服務、工具到基礎設施,全棧升級為生成式AI創造價值托舉
正如計(ji)算機科學先驅(qu)Alan Kay曾經說(shuo)過的,最好的軟件工程師自己(ji)會(hui)(hui)構建硬件。新的云計(ji)算、生成式AI浪潮(chao)會(hui)(hui)推動在底層的持(chi)續創(chuang)新,底層創(chuang)新反之又會(hui)(hui)加速數據及(ji)AI的進一步發展。和傳統IT一樣(yang),生成式AI需要計算、網(wang)絡、存儲(chu)基礎設施的托載,而這些恰恰是(shi)亞馬(ma)遜云科(ke)技長期(qi)積累的優勢所(suo)在(zai)。
將業務和生(sheng)(sheng)成(cheng)(cheng)式(shi)AI結合需要(yao)很多工程化能(neng)力。在生(sheng)(sheng)成(cheng)(cheng)式(shi)AI發(fa)展的早期階(jie)段,亞馬遜云(yun)科技將其(qi)服務重心放在提(ti)供“最優組合”上,將技術能(neng)力分(fen)解(jie)為獨立的構建單元(yuan)(building blocks),以高性價比組件的形式(shi)提(ti)供給客戶,讓客戶可以按(an)照自己(ji)期望的任意組合去嘗試(shi)和調整,從而節省開(kai)發(fa)時(shi)間(jian),加速探(tan)索(suo)生(sheng)(sheng)成(cheng)(cheng)式(shi)AI落地。
總體來(lai)看,亞(ya)馬(ma)遜云(yun)科技通(tong)(tong)過(guo)提(ti)(ti)供豐富的自(zi)研及第三方大(da)模型貨架來(lai)滿(man)足云(yun)客戶差異化需求,通(tong)(tong)過(guo)Amazon Bedrock解決大(da)模型落地(di)(di)效率問題,通(tong)(tong)過(guo)Amazon SageMaker提(ti)(ti)高資源利(li)用(yong)和(he)數(shu)據分(fen)析的速度,通(tong)(tong)過(guo)Amazon Q讓人人都能簡便快捷(jie)地(di)(di)用(yong)上生成式(shi)AI生產工(gong)具,通(tong)(tong)過(guo)底層基礎(chu)設施(shi)的升級進一步(bu)降(jiang)本(ben)增效。
這些投入在為廣泛客戶帶(dai)來更大商(shang)業回報的(de)同時,也持續鞏固著這家云計算巨頭在生成式AI云服務市場的領導者地位和核心(xin)競爭力。