
智東西(公眾號:zhidxcom)
作者 | GenAICon 2024
2024中國生成式(shi)AI大(da)會(hui)于4月18-19日在北京舉行,在大(da)會(hui)第二天的(de)主會(hui)場(chang)AI Infra專場(chang)上,Zenlayer行業拓展總(zong)監(jian)陳(chen)秀忠(zhong)以《大(da)數據、大(da)算力(li)與(yu)大(da)模型(xing)驅動下的(de)全(quan)球(qiu)廣域網(wang)挑(tiao)戰與(yu)策略》為題發表演講。
大數據、大算(suan)力(li)、大模型推動AI能力(li)涌現,正在改變當(dang)代人(ren)們(men)與世界互動的方式。要充(chong)分發(fa)揮AI的潛力(li),需要高效(xiao)、安全(quan)、可靠(kao)的全(quan)球網絡支(zhi)撐。
然而,當前全球廣域網在滿足AI應用在對數據流動、算力配備和網絡性能的需求方面,依然面臨挑戰。數據流動的高效與安全、算力資源的優化配置與協同工作,以及訓練與推理節點之間網絡性能的優化,成為當前全球廣域網亟待解決的問題。
對此,陳秀忠認為通往更高級AGI,挑戰在于更即時的交互、更廣的數據、更廣的算力。因(yin)此(ci),面向AGI的全球(qiu)邊緣云方案(an),不僅(jin)需要考慮支持(chi)實時(shi)交互的全球(qiu)網絡(luo)、數據本地存儲(chu)和(he)全球(qiu)流(liu)動,同時(shi),也要覆(fu)蓋大量的邊緣節(jie)點。
陳秀忠談道,安全合規的跨境專線是企業連接全球的第一跳。一大挑(tiao)戰在于,數據(ju)合規(gui)性讓全球數據(ju)監管力度(du)加(jia)大,一旦數據(ju)本地(di)化,企業(ye)又將何(he)去(qu)何(he)從?
以下為陳秀忠的演講實錄:
我有一(yi)個問題想和(he)大家(jia)討論:CPU和(he)GPU之(zhi)間的(de)本質區別是(shi)什么?我認為(wei)最重要的(de)一(yi)點是(shi),GPU專(zhuan)注于圖形(xing)處理。
現在(zai),我們一起快(kuai)速(su)地(di)探索AIGC或全球網絡的整體(ti)情況。以下是大致的議程:現在(zai)的情況如何(he),存在(zai)什(shen)么挑戰,我們的方案又(you)是什(shen)么?
一、AI能力為何涌現?“大”力出奇跡
今天關于AI基礎設施的主題的演講(jiang)有很多,包括網絡(luo)、數(shu)據(ju)以及模型的訓練和推理(li)等。全球邊緣網絡(luo)中主要的資源(yuan)集中在(zai)算力(li)和數(shu)據(ju)方面(mian)。
這(zhe)張畫是(shi)(shi)我(wo)孩子繪制的(de)作品,因為要(yao)參加比賽,所以需要(yao)給這(zhe)幅畫取個名字。我(wo)把這(zhe)項工(gong)作交給了ChatGPT。在(zai)此之(zhi)前,我(wo)們曾為這(zhe)個問(wen)題爭(zheng)吵不(bu)休,不(bu)知道該給這(zhe)幅畫取什么名字。為什么ChatGPT有這(zhe)樣的(de)能(neng)力?實際上,AI技術已經在(zai)學術界和工(gong)業界發展了四十多(duo)年(nian)。然而(er)我(wo)們是(shi)(shi)在(zai)過去的(de)一兩年(nian)中才(cai)覺(jue)得AI非常酷。
我們來看看這個圖。
第一,手機很多。現在(zai)全球手機數量(liang)已(yi)經高達86億部(bu)(bu)。每一部(bu)(bu)手機都(dou)在(zai)扮演著將物理世界數字化的(de)角(jiao)色,從(cong)而(er)創造(zao)了大量(liang)的(de)數據。
第二,NVIDIA很厲害。NVIDIA在GPU領域有著幾(ji)十年的深厚積累(lei),并且有個定(ding)(ding)律——每6個月(yue),GPU的能力將翻倍。這一(yi)速度是(shi)摩(mo)爾定(ding)(ding)律的3倍。
第三,大模型。這些(xie)“大”模型已經創造了(le)許多奇跡,并且(qie)它們的(de)能(neng)力(li)正在不斷涌現。
回顧過去,去年很(hen)多(duo)人開始使用ChatGPT,但是逐漸地,ChatGPT的活(huo)躍(yue)度卻在(zai)回落。此外(wai),在(zai)我與許多(duo)人溝通時,我發(fa)現(xian)人們(men)真(zhen)正敢將工作交(jiao)給ChatGPT,是因為仍然有機會(hui)進行確認。我們(men)也研(yan)究了DeepMind團隊(dui)對于(yu)AGI(通用人工智(zhi)能)的分層(ceng)。
目前,ChatGPT仍處于非常初級的階段,即L1階段。還有許多級別需要攀升,因此實現AGI的道路還非常遙遠。
剛才提到,AI涌現的三個主要的因素是大數據、大算力和大模型。現在再來思考一個問題,當AIGC變得非常出色時,當一個與真人幾乎一模一樣的虛擬人與我進行對話和互動時,接下來會發生什么?我需要與這個虛擬人進行快速的交互,這(zhe)是一個非常重要的因素。
二、通往更高級AGI,面臨三大挑戰
我們總結了幾個挑戰。
第一個挑戰是更即時的交互。如(ru)果AIGC要給人帶來(lai)非常出(chu)色的體驗(yan),那么(me)即時交互就(jiu)會成(cheng)為其中(zhong)的關鍵。當我觀看短(duan)視頻(pin)或(huo)長視頻(pin)時,這(zhe)些內(nei)容并非UGC或(huo)者PGC產(chan)生,因(yin)此(ci)是缺乏新鮮感(gan)的,就(jiu)像是經過冷凍處理的內(nei)容。
這張圖表展示了人(ren)與人(ren)之(zhi)間的(de)互(hu)動以(yi)及人(ren)與內容(rong)之(zhi)間的(de)互(hu)動。最(zui)終,所有(you)這些都指向一(yi)(yi)個(ge)共同(tong)點(dian),那就是(shi)人(ren)。只(zhi)不過(guo),這個(ge)“人(ren)”是(shi)一(yi)(yi)個(ge)機器。如果這個(ge)機器人(ren)真(zhen)的(de)能夠與人(ren)類如此相似,那么(me)這將是(shi)一(yi)(yi)種(zhong)非常好的(de)體驗,而這也(ye)就意味著即時交互(hu)在全(quan)球范圍內是(shi)通往AGI的(de)重要挑戰。
第二個挑戰是更廣的數據。盡管(guan)我們已經將目前可以(yi)獲取(qu)的(de)所(suo)有(you)數(shu)(shu)據(ju)(ju)(ju)都提(ti)供給(gei)了大(da)模型,包括所(suo)有(you)的(de)書籍、學者(zhe)發布的(de)論文以(yi)及各種各樣的(de)數(shu)(shu)據(ju)(ju)(ju),但(dan)仍然存在很(hen)多數(shu)(shu)據(ju)(ju)(ju)難以(yi)提(ti)供給(gei)大(da)模型,比如一些政(zheng)府數(shu)(shu)據(ju)(ju)(ju)和封閉平臺的(de)數(shu)(shu)據(ju)(ju)(ju)就很(hen)難被獲取(qu)。
那么,我們(men)如何才能將這些數據提供給大(da)(da)模(mo)型呢?我們(men)注意到(dao)全球(qiu)范圍(wei)(wei)內(nei)的一個最大(da)(da)難題是,各(ge)國都有自(zi)己的數據隱私保護法規(gui),因此數據在全球(qiu)范圍(wei)(wei)內(nei)的流動面臨(lin)著很大(da)(da)的挑戰。
第三個挑戰是更廣的算力。當在(zai)美國一個(ge)州進行(xing)10萬張H100訓練時,可能導致電網癱瘓。這意(yi)味著我們(men)需(xu)要盡量分散計算力,以緩(huan)解(jie)電力限制的壓力。
在推理(li)階(jie)段,我們對(dui)計算力的(de)需(xu)求更(geng)高,因為每次推理(li)都會(hui)消耗一定的(de)資源,而推理(li)與用(yong)戶請(qing)求數量直接相關(guan)。未來,無論是因為推理(li)需(xu)要更(geng)接近用(yong)戶,還是推理(li)次數增加,都需(xu)要關(guan)注(zhu)推理(li)部分的(de)計算能(neng)力。
根據這三個挑(tiao)戰,可以(yi)得出一(yi)些小的(de)結論。
首先,對于更即時的交互,需要建立全球范圍內的即時交互網絡。二是需要更廣的數據,思考如何生成和流動這些數據,以及如何解決各國對數據隱私的保護。三是需要更廣泛的計算能力,同時我們也要考慮到,推理和訓練的計算能力應盡量分開。
三、語言、地理、戰爭,全球網絡碎片化的三大挑戰
我(wo)們(men)說網(wang)絡(luo)很重要(yao),尤其是(shi)全球(qiu)范圍內的網(wang)絡(luo)至關重要(yao)。盡管我(wo)們(men)訪問外網(wang)時可能會遇到性(xing)能挑戰(zhan),但國(guo)內網(wang)絡(luo)通達性(xing)非常(chang)好(hao)。
然而,全球范圍內的網絡卻是碎片化的(de)。這是因為全球各國之間的(de)網絡(luo)互通主要依靠海底光(guang)纜,而這些海底光(guang)纜還面臨著諸(zhu)多問題,導致全球網絡(luo)出現了許多挑戰。
第一(yi)張圖展(zhan)示了(le)東南亞(ya)國家(jia)的(de)網絡情況。盡管(guan)東南亞(ya)的(de)面積和人口僅為(wei)中(zhong)國的(de)一(yi)半(ban),但卻有十幾個國家(jia),且語言也各不相(xiang)同。例如,泰國和越南這兩個毗(pi)鄰的(de)國家(jia)之間的(de)互聯通信需(xu)要(yao)70多毫秒,因為(wei)它們需(xu)要(yao)通過新(xin)加坡(po)進(jin)行中(zhong)轉(zhuan)。
第二(er)張圖展示了南(nan)美洲的(de)情(qing)況。南(nan)美洲的(de)地理(li)格局有些奇特(te),東邊是巴西,西邊是秘魯(lu),盡管它們(men)的(de)物理(li)距離很近,但(dan)由于地理(li)因素,如南(nan)北(bei)延伸的(de)山脈和亞馬(ma)遜熱(re)帶雨(yu)林的(de)存在,導(dao)致(zhi)陸(lu)地光纜無法通行(xing),必須(xu)繞過整個南(nan)美洲一圈才(cai)能實現互聯。
第三個因素是戰爭,特別是在中東市場。我們可以清楚地看到以色列到阿聯酋之間的網絡需要160毫秒,盡管它們的物理距離可能只有十幾毫秒。這三個因素共同決定了全球網絡與中國國內網絡之間存在著非常大的差異。
四、安全合規的跨境專線,中國企業走向國際市場的第一跳
現在所有客戶在海外部署關鍵應用的需求就是專線。中國企業要走向國際市場,跨境專線是非常重要的一部分。這張圖展示了中國整個跨(kua)境陸纜和海纜的布局,主要從上海、廣東、香港(gang)以及北京(jing)前往俄羅斯(si),或者(zhe)新疆。
這張(zhang)圖展(zhan)示了全球(qiu)各個國家(jia)對個人隱私的重視程度,導致許多數據無法(fa)直接離開其所(suo)在國家(jia)。
最(zui)近我(wo)和(he)一位從事汽車(che)行(xing)業(ye)的朋友聊過,他們在歐(ou)洲產生(sheng)了大(da)量數據(ju),但如果要用這些數據(ju)進行(xing)研究,他們必須親自前往歐(ou)洲進行(xing)處理。
然而,數據合規性讓全球數據監管力度加大,一旦數據本地化,企業又該如何解決?
有一(yi)(yi)(yi)個案例,同樣是一(yi)(yi)(yi)家汽車企業,他們在全球產生大(da)量數(shu)(shu)據,需要在各地進(jin)行本地存儲。因此,他要回(hui)到杭(hang)州,用一(yi)(yi)(yi)些全球加速的方案讓數(shu)(shu)據快速傳回(hui)杭(hang)州。
大(da)(da)家對(dui)時(shi)延有(you)沒有(you)概念?這(zhe)張(zhang)圖展示的(de)是以德國法蘭(lan)克福為中心,覆蓋(gai)整個歐洲的(de)互聯網時(shi)間情況,當網絡通往東歐時(shi),延遲時(shi)間急劇增加,超過了30或50毫秒。由于(yu)公有(you)云很(hen)難(nan)在每(mei)個國家都(dou)設(she)置邊緣節點(dian),因此(ci)需要大(da)(da)量的(de)邊緣節點(dian)來覆蓋(gai)這(zhe)些地(di)區(qu),比如土耳其、保加利亞等,以提高真正(zheng)即時(shi)交(jiao)互的(de)體驗。
簡而言之,我們(men)公司在全(quan)球(qiu)各地(di)(di)都設有(you)一些邊緣服務,可以幫助(zhu)用戶在當地(di)(di)獲取算力(li),東(dong)(dong)南亞(ya)、中東(dong)(dong)地(di)(di)區我們(men)都有(you)覆(fu)(fu)蓋,在東(dong)(dong)南亞(ya)的十幾個國(guo)家和(he)每個國(guo)家的首都也都有(you)當地(di)(di)節點,在南美(mei)(mei)(mei)洲和(he)非洲也有(you)完整的覆(fu)(fu)蓋。至(zhi)于歐美(mei)(mei)(mei)地(di)(di)區,這是傳統(tong)網絡覆(fu)(fu)蓋比較好的地(di)(di)方,例如美(mei)(mei)(mei)國(guo)的美(mei)(mei)(mei)東(dong)(dong)、美(mei)(mei)(mei)西地(di)(di)區都有(you)廣(guang)泛的覆(fu)(fu)蓋,歐洲的保(bao)加利亞(ya)和(he)莫(mo)斯科也有(you)覆(fu)(fu)蓋。
我們(men)公司已經服(fu)務(wu)中(zhong)國企業出(chu)海十多年了,我們(men)的logo布滿了整面墻(qiang),包括最早的游(you)戲、汽車(che)企業,以及大型(xing)公有云,都是我們(men)出(chu)海的主要客戶。
總結一下(xia),AI已經(jing)為我們做(zuo)了(le)一些(xie)事情,但(dan)要(yao)(yao)實現真(zhen)正的(de)AGI還有很長的(de)路要(yao)(yao)走。在通往真(zhen)正AGI的(de)路上,有許(xu)多(duo)挑(tiao)戰,如需要(yao)(yao)更多(duo)的(de)數據、更廣泛(fan)的(de)算力,以及全球范圍內即時交互的(de)網絡。我們公司則可以在這方面幫(bang)助大家。
以上是陳秀忠演講內容的完整整理。