智東西(公眾號:zhidxcom)
作者 | 香草
編輯 | 李水青

智東西10月25日報道,10月24日,亞馬遜云科技在北京舉辦了生成式AI構建者大會。會上,亞馬遜云科技大中華區產品部總經理陳曉建從應用場景、工具和基礎設施、數據基座、AI原生應用構建和生成式AI服務這五個層面,解讀(du)了亞馬遜云(yun)科技(ji)(ji)全面的云(yun)原生技(ji)(ji)術棧,以(yi)及亞馬遜云(yun)科技(ji)(ji)如何助力企業降低生成(cheng)式AI應用(yong)開發門(men)檻(jian),加速實現(xian)端到端的生成(cheng)式AI應用(yong)構建。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解讀(du)亞馬遜云科(ke)技五個層(ceng)面的云原生技術(shu)棧

西門(men)子集(ji)團、金山辦公軟件以及科(ke)(ke)思創(chuang)中(zhong)(zhong)國(guo)作為(wei)亞馬遜(xun)云科(ke)(ke)技中(zhong)(zhong)國(guo)區生成式AI創(chuang)新的代表客(ke)戶,也分享了各自的創(chuang)新案例。

會后,智東西(xi)與少數(shu)媒體(ti)對陳(chen)曉建、亞(ya)馬遜云科技技術(shu)專(zhuan)家(jia)團隊總監王曉野進行了采訪。

當智東西問道,從亞馬遜(xun)云科(ke)技(ji)與企業(ye)客戶(hu)(hu)的接觸來看,目前有(you)(you)哪些行(xing)業(ye)和領域對生成式(shi)(shi)AI應(ying)(ying)用(yong)的需(xu)求量(liang)較大?生成式(shi)(shi)AI落地(di)行(xing)業(ye)主要有(you)(you)哪些挑戰?亞馬遜(xun)云科(ke)技(ji)是如何(he)幫助企業(ye)客戶(hu)(hu)應(ying)(ying)對這些挑戰的?

陳曉建稱,目(mu)前(qian)各(ge)行各(ge)業對生成式AI都有著一(yi)定(ding)需求,從亞(ya)馬遜云科(ke)技(ji)與客戶的接觸來看,有一(yi)些(xie)比(bi)較有代表(biao)性的行業。

一是數字營銷行業,易點天下借(jie)助亞(ya)馬遜云科技(ji)驅動的生成式AI幫助電(dian)商客(ke)戶將出圖時間從5天縮短至2小時,通(tong)過SaaS為出海客(ke)戶提供AI模特(te)與AI數字虛擬人等(deng)服務。

二是工業設計領域,以海(hai)爾(er)創新設(she)計(ji)(ji)中心(xin)為例(li),其基于(yu)亞馬(ma)遜云科(ke)技服務(wu)器部署(shu)了(le)大(da)量(liang)自動化設(she)計(ji)(ji)軟件,使得產品設(she)計(ji)(ji)、UI設(she)計(ji)(ji)等相關業務(wu)操作周期(qi)縮(suo)短了(le)20%。

三是游戲行業,創夢天地(di)利用(yong)亞馬遜(xun)云科技游戲(xi)AIGC專業版API,快(kuai)速(su)上線了AI繪圖頻(pin)道和多種(zhong)特色(se)風格(ge),積累(lei)了數萬(wan)名頻(pin)道內用(yong)戶(hu)使用(yong)AI生圖服務,為(wei)后續IP推(tui)廣活動(dong)打下基礎。

在落地層面,亞馬遜(xun)云科技提(ti)供(gong)包含基(ji)礎(chu)模(mo)型、數據(ju)與算(suan)力基(ji)礎(chu)設(she)施(shi)以(yi)及開發工具在內(nei)的(de)全(quan)面云原生技術棧,幫助企業實現端到端的(de)應用(yong)構建。以(yi)全(quan)托管生成(cheng)式AI服務Amazon Bedrock為例(li),由于其無服務器化,客戶無需管理基(ji)礎(chu)設(she)施(shi),只需調用(yong)API即可使(shi)用(yong)。

一、多半效益來自4類應用場景,Bedrock提供6大基礎模型

根據麥肯錫咨詢2023年6月發布的生成式AI生產力前沿技術報告,在生成式AI技術帶來的經濟效益中,大約3/4來自四類主要的職能:營銷與銷售、產(chan)品與研發(fa)、軟(ruan)件工程(cheng)和客戶(hu)運(yun)營。

陳曉建稱,典型的(de)應用場(chang)景帶給(gei)企業(ye)(ye)的(de)業(ye)(ye)務(wu)價值主要包含三(san)個方面:增(zeng)強客戶體驗、提(ti)升員工生產力與創造力、優(you)化業(ye)(ye)務(wu)流程。

圍繞不同(tong)(tong)的(de)(de)應用(yong)場景,亞馬遜云科(ke)技為企業客(ke)戶提供不同(tong)(tong)的(de)(de)工具幫(bang)助其創(chuang)新(xin)業務模式。

10月7日,亞馬遜云科技正式發布Amazon Bedrock,同時宣布接入Meta的Llama 2 13B和70B。目前,Amazon Bedrock提供來自Meta、Anthropic、Stability AI、AI21 Labs、Cohere等第三方開發商的模型,以及亞馬遜自研的Amazon Titan,共6種基礎模型。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲Amazon Bedrock提供的(de)6種(zhong)基礎模型

陳曉建(jian)稱,Amazon Bedrock是企(qi)業使(shi)用基礎模型構建(jian)和擴(kuo)展生(sheng)成式(shi)AI應用程序(xu)的(de)最(zui)簡單方法,它是一項(xiang)無(wu)(wu)服務(wu)器服務(wu),提(ti)供了(le)廣泛的(de)模型選擇、數據隱私(si),并(bing)且能夠(gou)自(zi)定義模型,無(wu)(wu)需管理任(ren)何(he)基礎設(she)施。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解讀Amazon Bedrock微(wei)調(diao)功能

然(ran)而,單獨(du)的(de)基礎模型(xing)具有(you)局限(xian)性,無法完(wan)成需(xu)要與外部系統交互并且沒有(you)最新知識來(lai)源的(de)復雜(za)任務。這些功能本身雖(sui)然(ran)很簡單,但開發人員必(bi)須經過多個步驟才(cai)能實(shi)現(xian)這些功能。

Amazon Bedrock代理(li)功能(neng)支持通過API(應用程序編程接(jie)口)安(an)全(quan)地(di)連接(jie)到公司數據(ju),自動(dong)(dong)將數據(ju)轉換為機器可(ke)讀的格式,并增加相關信息以生成最準確的回(hui)答(da)。然后,代理(li)可(ke)以自動(dong)(dong)調用API來滿足用戶的請求,無需任何手(shou)動(dong)(dong)編碼。

金山辦公的AI研發(fa)總監劉強談道(dao),今(jin)年(nian)起,WPS開始將大(da)語言模(mo)型(xing)的能力全面引入(ru)產品(pin),在構建過程中(zhong),遇到基礎(chu)模(mo)型(xing)性能有限、數(shu)據隱私與安全難以(yi)保障、高額管理成本等障礙。

作為Amazon Bedrock的第(di)一批試用用戶,金山辦公第(di)一時間與(yu)亞馬遜(xun)云(yun)科(ke)技展開(kai)了對接與(yu)測試。

Amazon Bedrock中支持的(de)領先大語(yu)言(yan)模型在多個文(wen)字處(chu)理場(chang)景(jing)中符合金山(shan)辦(ban)公(gong)的(de)需求,在數(shu)據安全層(ceng)面也給金山(shan)辦(ban)公(gong)提供了充分的(de)支持,極大地提高了金山(shan)辦(ban)公(gong)的(de)內部開發效(xiao)率。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲劉強解讀構建(jian)生(sheng)成式AI應(ying)用(yong)幾大(da)挑戰

基礎(chu)設施方面,陳曉建(jian)稱高性(xing)價比的(de)(de)基礎(chu)設施是(shi)生成(cheng)式AI應用構建(jian)的(de)(de)關鍵。

亞(ya)馬遜云(yun)科(ke)技持(chi)續對全(quan)球(qiu)基礎設施進(jin)行深度投資,為客戶提供廣泛的加速器、GPU選(xuan)擇,例如(ru)基于(yu)英傳(chuan)達最新GPU芯片H100 Tensor Core的Amazon EC2 P5實例,與上一代(dai)相(xiang)比(bi)速度快6倍,訓練成本(ben)節省(sheng)40%。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解讀亞(ya)馬遜(xun)云科技基于英偉達GPU芯片實例(li)

基(ji)于亞(ya)馬遜云科技自(zi)研的(de)機器學習推理芯片Amazon Inferentia2推出的(de)Amazon EC2 Inf2實(shi)例,與(yu)其(qi)他類似的(de)EC2實(shi)例相比(bi)(bi)性價比(bi)(bi)高40%;基(ji)于自(zi)研機器學習訓練(lian)芯片Amazon Trainium推出的(de)Amazon EC2 Trn1實(shi)例,與(yu)同類實(shi)例相比(bi)(bi)訓練(lian)成本節省達50%。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解(jie)讀亞馬遜云科技自研芯片(pian)實例

二、構建專門數據庫,DataZone實現跨組織數據共享與治理

數(shu)據(ju)是(shi)將通用的生(sheng)成(cheng)式(shi)AI轉變為了解企業(ye)業(ye)務和客戶(hu)的生(sheng)成(cheng)式(shi)AI的關鍵差(cha)異化因素。

陳(chen)曉建稱(cheng),面(mian)向生成(cheng)式AI構(gou)建強大的數據“基座”,需(xu)要一套全面(mian)的服務(wu),以便能夠(gou)存(cun)儲用于構(gou)建和微調(diao)模型(xing)的各種類型(xing)的數據;需(xu)要服務(wu)間的集(ji)成(cheng),以打破(po)數據孤島,確保能夠(gou)隨時訪(fang)問所有數據;還需(xu)要在構(gou)建生成(cheng)式AI應(ying)用程序的整個(ge)生命周期中(zhong),確保數據安全并對其進行管(guan)理。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建(jian)解讀面向生成(cheng)式AI如何構建(jian)強大的數據(ju)“基座”

在全面(mian)服務方面(mian),亞馬遜云科技針(zhen)對生成式(shi)AI領(ling)域的用戶(hu)個人(ren)信(xin)息(xi)、會話信(xin)息(xi)管理(li)(li)、私域知識庫等應用場景都提供(gong)了專(zhuan)門(men)構建的數據庫。針(zhen)對檢索增(zeng)強生成(RAG)需要處(chu)理(li)(li)的向(xiang)量數據,亞馬遜云科技推出了向(xiang)量數據庫功能。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解讀亞馬遜云(yun)科技(ji)多種數據庫

在數據(ju)集成方(fang)面,數據(ju)的(de)抽取(Extract)、轉換(huan)(Transform)、加(jia)載(zai)(Load)——簡稱(cheng)ETL,是(shi)端到端數據(ju)旅程迫切需要解決(jue)的(de)問(wen)題,亞馬遜云科技提(ti)出(chu)“Zero-ETL”的(de)愿(yuan)景(jing),通過深化服務(wu)之間的(de)集成,幫助企業執行分析(xi)和機器學習,且(qie)無需移動(dong)數據(ju)。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建(jian)解(jie)讀亞馬(ma)遜云科技深度集成數據服(fu)務

在(zai)數(shu)據(ju)(ju)治理方面,亞(ya)馬遜(xun)云科(ke)技提(ti)供Amazon DataZone數(shu)據(ju)(ju)治理服務,讓(rang)客戶能夠(gou)跨組織邊界發現、訪問、共享和(he)治理大規模數(shu)據(ju)(ju),并減少(shao)企業內部(bu)成員訪問數(shu)據(ju)(ju)和(he)使用分析工具時繁(fan)重的工作量(liang)。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解(jie)讀Amazon DataZone數據治理服務

西門(men)(men)子集團IT數(shu)(shu)據(ju)分析(xi)與AI負責人(ren)李朝明(ming)解讀了西門(men)(men)子與亞馬遜云科(ke)技在(zai)企(qi)業(ye)數(shu)(shu)據(ju)上的(de)(de)合作,通(tong)過AI與數(shu)(shu)據(ju)能力(li)的(de)(de)全(quan)面(mian)能力(li)提升來構建基于生成式AI的(de)(de)企(qi)業(ye)知識聊天機器人(ren)。

面(mian)對西(xi)門子(zi)(zi)中(zhong)國IT面(mian)對的企(qi)業內部信(xin)息(xi)分散、數據(ju)信(xin)息(xi)傳(chuan)遞能(neng)力不足、知識(shi)運(yun)營能(neng)力缺(que)乏等業務(wu)難題,亞馬遜云科技助力西(xi)門子(zi)(zi)打造了業務(wu)知識(shi)一體化解決方案“小禹(yu)”,由于根植于堅實的數據(ju)底座,“小禹(yu)”從立項到上線僅用了3個月(yue)。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲李朝明(ming)解讀西門子(zi)業(ye)務知識一體(ti)化解決(jue)方案“小禹”

三、云原生服務加速AI應用構建,編程助手CodeWhisperer將推自定義功能

生成式AI的出現(xian),給(gei)傳統(tong)云原生應(ying)用開發架構(gou)提(ti)出了(le)新的機遇與挑戰。

陳曉建在(zai)采訪(fang)中(zhong)談道,生成式AI是(shi)(shi)云原生的(de)技術,可以說(shuo),云計(ji)算是(shi)(shi)應用生成式AI最好的(de)方(fang)式。

而(er)相比之下,公(gong)有云比私有云更適合(he)面向企業(ye),能(neng)夠提(ti)供強大的算(suan)力(li)、基礎設施資源、端(duan)到端(duan)的服務等。

在應用層面,亞馬遜云(yun)科技認為,編程(cheng)將是生成式AI技術得到快速應用的領域之(zhi)一。

亞馬遜云科技提供(gong)的Amazon CodeWhisperer是一款(kuan)AI編碼伙(huo)伴(ban),可在基礎模型高級選項中使(shi)用,實時生成代(dai)碼建議,從根本上提高開發人員的生產力。

據測試,與未(wei)使用的參與者相比,使用CodeWhisperer的參與者完成(cheng)任務的速度平均快57%,成(cheng)功率高27%。

陳曉(xiao)建稱(cheng),CodeWhisperer即(ji)將推出(chu)自定義功能,允許(xu)客戶使用私有(you)代(dai)碼庫安全地定制代(dai)碼建議(yi),這些(xie)私有(you)代(dai)碼庫可涵(han)蓋內部(bu)API、數據(ju)庫、最佳實(shi)踐和架構模式等。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉(xiao)建解讀CodeWhisperer自定義功能

科思創中(zhong)國云開(kai)發(fa)運維團隊負責人俞(yu)宙談道,科思創中(zhong)國在日常(chang)開(kai)發(fa)中(zhong)有(you)兩個核心任務:項(xiang)目框架(jia)搭建和存(cun)量代碼優化。

在實(shi)踐中(zhong)過程中(zhong),重(zhong)復性、機(ji)械化的(de)范式生成、慣用算法引用和企業級API接(jie)口(kou)定制(zhi)是科(ke)(ke)思創中(zhong)國面臨的(de)主要挑戰(zhan)。在亞馬遜云科(ke)(ke)技CodeWhisperer的(de)加持下,科(ke)(ke)思創中(zhong)國的(de)日常代(dai)碼(ma)開發(fa)效(xiao)率提升50%,開源代(dai)碼(ma)應用追蹤器的(de)準確(que)性也顯著提高。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲俞宙解讀科思創中(zhong)國在日(ri)常開發中(zhong)的兩個核心任務

亞馬遜云科技還為Amazon QuickSight推出了生成(cheng)式BI(商務智能)功能,使業(ye)務分析師能夠輕松地(di)在幾秒鐘內快速編寫和微調新的視覺效果,并使用自然語言將其(qi)添加到儀表板(ban)中,還可以在QuickSight中創(chuang)建分析報告。

亞馬遜云科技生成式AI落地5步走!助西門子金山辦公科思創玩轉大模型

▲陳曉建解(jie)讀QuickSight分析報告生成功(gong)能

結語:生成式AI≠大模型,模型外的服務或成為新戰場

目(mu)前(qian),生成(cheng)式(shi)AI應(ying)用落(luo)地(di)已經從熱(re)火朝天(tian)的“百(bai)模大戰(zhan)”,步(bu)入到了少數優秀模型脫穎而出,工具(ju)鏈(lian)百(bai)花齊(qi)放,以及企業主(zhu)管認真(zhen)尋找生成(cheng)式(shi)AI落(luo)地(di)場景的新階段。開發生成(cheng)式(shi)AI應(ying)用是(shi)一個(ge)充滿挑戰(zhan)的系統(tong)工程,而不是(shi)單純的產品和服務(wu)拼(pin)接。

正如(ru)陳曉建所(suo)說,生(sheng)成式AI不僅僅是大模型(xing),整個生(sheng)成式AI應用(yong)就(jiu)像是浮在(zai)海面的冰(bing)山,露在(zai)海面上方能被大多(duo)數人看到的冰(bing)山一角就(jiu)像是基礎模型(xing),而(er)在(zai)冰(bing)川的底(di)部,同樣需要(yao)大量(liang)的基礎模型(xing)以外的服務來支撐。