今年,是AI大模型落地應用元年。企業對AI大模型寄予厚望,落地場景越來越多樣、縱深,并正在以結構性的力量對產業進行重塑。
9月6日,2024騰訊全球數字生態大會互聯網AI應用專場在深圳舉行。科創南方來到活動現場,并在會后參與對話騰訊云副總裁許華彬。
在這前一天,騰訊正式發布新一代大模型“混元Turbo”,效果在多個基準測試上對標GPT-4o,推理效率提升100%,推理成本降低50%,第三方測評居國內第一。據了解,目前騰訊內部近700個業務及場景已接入,包含騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等。
據了解,目前騰訊云AI產品已覆蓋超過400家互聯網頭部企業,累計服務超過12萬家互聯網客戶。
以混元為代表的AI大模型驅動著產業創新發展,在業務高效創新上展現出了更強勢的產品力,并且不斷給用戶帶來全新的體驗。現場介紹,值得買科技、燧原科技、趣丸、獵聘、騰訊新聞等,都在混(hun)元大模(mo)型(xing)、騰訊云的基礎上,開展了一系列互聯網AI應用實踐,要么用以提升業務效率,要么用以創造用戶新體驗。
生(sheng)成式AI成為大熱門,云有什么變化?在許華彬看來,生成式AI帶來更大規模的數據交互,更高的能耗以及不同的運維體系。
同時,面對大模型浪潮到來下企業需求的變化,許華彬告訴科創南方,AI很可能成為未來的第二增長曲線,云行業客戶需求從早期的視覺領域拓展到數字人的應用等方面,而在這一過程中,騰訊云在AI基礎設施上的能力也變得越來越成熟,以適應行業的發展需求。
AI搜索,可以說是離我們生活最近的AI應用之一了。我們每天都離不開搜索,那如果AI和搜索結合起來,會如何重塑我們的搜索使用習慣?在值得買科技首席技術官王云峰看來,人與搜索工具的使用過程,其實就是一個相關馴化的過程。早期,我們用傻瓜式提問期待搜索引擎做出全面回答,但是當時技術并不支持;如今,當AI搜索出現后,我們卻反而是用關鍵詞去向AI進行提問。
在和騰訊云副總裁許華彬、值得買科技首席技術官王云峰的對話中,我們對云+AI的發展、生成式AI在泛互聯網行業的落地趨勢等方面有了更深入的了解。
對話騰訊云副總裁許華彬:AI搜索還在早期階段,AI成為云計算第二增長點
▲騰訊云副總裁 許華彬
對話騰訊云副總裁許華彬:AI搜索還在早期階段,AI成為云計算第二增長點
▲值得買科技首席技術官 王云峰
以下為部分整理后的采訪實錄:
問題:現在Chat GPT發布一年多了,大型的云廠商也逐漸構建起了比較完善的AI產品服務體系,并且每個運營廠商有自己的特點,有的主打開放生態,有的是閉源生態,也有專注于工具層的。騰訊云走的是什么路線?為什么要走這種路線?
許華彬:作為云廠商我們側重兩個方面,第一是我們做好基礎的設施,大家知道算力是最基本的要素,包括訓練數據的存儲、網絡,這是一個基本點。第二是站在運營商的角度看,對每家模型我們本身還是比較開放的,大家看到我們的平臺,其實結合了多家的模型,除了騰訊自己的混元大模型,也有國內的各個廠商的大模型。
問題:在大模型興起之前的、傳統的云,和現在生成式AI的云,它的需求以及需要的能力有什么不同?
許華彬:傳統云業務的數據流量相對較小,而生成式AI的云業務,尤其是訓練集群,涉及多臺機器間的大規模數據交互,流量通常達到T級別以上。因此,這兩者在數據需求上存在顯著差異。此外,功耗需求也不同,生成式AI所需的H級機柜可能需要幾千瓦甚至更高的電力支持。同時,運維體系也存在區別。
其實騰訊早已在AI領域展開了實踐,在OpenAI發布ChatGPT之前,騰訊已經開發了自己的模型,雖然當時的模型可能與現在的大模型有所不同,但這一領域的探索已經持續多年。
問題:AI搜索是現在比較熱的話題,都說有搜索框的地方就有AI搜索,您怎么看待AI搜索的?
王云峰(值得買科技首席技術官):我最初的工作是在搜狗,負責搜索相關的業務。我有特別深的一個感觸——當年用戶向搜索引擎提出的問題,正是我們現在希望他們向AI提出的問題。
AI對話(hua)剛推出時,很多用戶使用它的方式其實和他們使用搜索引擎的方式很相似。如果用戶像20年前那樣使用搜索引擎——明確提出自己的問題并期待答案——我們反而會更高興。那時候,用戶會直接表達他們的問題,并希望從搜索引擎得到解答。然而,現在人們更多地依賴關鍵詞搜索。
這種變化體現了搜索引擎和用戶之間的一種“互相馴化”。早期,人們期望通過簡單提問從搜索引擎獲取答案,但技術水平有限,無法完全滿足需求。而現在,AI具備了更強的理解能力,但用戶的習慣已經被關鍵詞搜索固化了。
在我看來,云計算和AI的發展規律類似,是一個使用者和工具相互適應的過程。工具的能力會影響用戶的使用方式,反過來,用戶也會學會如何更好地使用這些工具。
AI對搜索引擎的影響尤其明顯。過去,人們通過提問尋找答案,而如今,AI不僅可以提供答案,還能結合新的檢索技術,進一步提升準確性。當然,AI在某些方面仍然存在局限性,比如數據時效性的問題,但搜索引擎的檢索技術可以很好地彌補這一點。所以,我認為,AI和搜索的結合,將為用戶帶來更加優質的體驗。
問題:現在很多公司都在做AI搜索,你們覺得可能哪些特質的公司最后跑出來成為AI時代做AI搜索的贏家?
王云峰(值得買科技首席技術官):我認為,目前AI搜索還處于早期階段,這個階段很像當年搜索引擎剛起步的時候。回想Google的早期版本,很多人覺得它的搜索效果并不好,每次更新后結果都會有所不同,規律難以把握。但隨著不斷優化,它逐漸變得越來越好。AI搜索也處在類似的發展階段。雖然搜索本身在信息獲取上有局限性,但并非所有問題都能通過信息獲取解決。
能夠在AI搜索領域脫穎而出的公司應該具備兩方面的特質。首先,這家公司需要對產品有極強的追求。就像當年搜索引擎經歷了多年的調優過程,AI搜索同樣需要不斷調整和改進。只有在產品上持續追求卓越,才能在這個領域取得成功。
其次,成功的公司必須在信息檢索方面有一定的積累。我特別強調信息檢索,因為這不僅僅是搜索技術本身的積累,還包括整體搜索體驗的積累。比如,在一些通用領域,可能傳統的搜索方式已經能夠滿足需求,但在更為專業的垂直領域,公司需要對這些領域有深入的理解,才能為用戶提供真正有用的答案。
正因為如此,我認為積累深厚的公司更容易找到合適的合作伙伴,并在AI搜索領域取得成功。畢竟,覆蓋所有領域是不現實的,但對某些領域的深刻認知和積累可以幫助他們走得更遠。
問題:因為您之前一直就是負責云業務,在這一波大模型浪潮來了之后,感覺客戶需求跟之前有什么改變,遇到的最大的挑戰是什么?
許華彬:隨著大模型浪潮的來臨,客戶需求相較以前有了顯著的變化。AI很可能成為未來的第二增長曲線,我所負責的云行業客戶圍繞AI的需求明顯增多。過去,AI需求主要集中在視覺領域,比如OCR、圖片識別、圖文識別以及語音識別和合成等應用。近年來,隨著大模型的發展,數字人的應用也變得更加廣泛和成熟,需求也從原來的腳本編寫擴展到利用語言模型驅動的應用。
騰訊云不僅在模型開發上發力,還提供了覆蓋整個數據處理鏈條的服務,包括數據清洗、數據存儲、數據庫能力、數據湖能力等工具。同時,云服務的底座基于多種異構化選擇,使得騰訊云在AIGC時代有較強的準備能力。此外,云服務在上線過程中,內容風控也是至關重要的一環。騰訊云能夠提供從前端到后端的全面云場景能力輸出,滿足客戶的多樣化需求。
數據中心時代,云服務的一個顯著優勢在于“開箱即用”。無論是整體解決方案、局部服務還是插件,客戶都可以按需下單使用,享受云服務帶來的彈性伸縮、研發便利性以及資源規模化效應。
雖然AI的應用前景廣闊,但仍然面臨許多挑戰。尤其是從去年開始,業界對大模型的預期非常高,但在實現過程中,存在不少技術上的困難。過去,大家已經關注文本和語言模型技術多年,但由于參數受限,進展相對緩慢。然而,隨著OpenAI推出ChatGPT后,市場的需求和期望變得更加復雜。
我還想起來,在2022年底或2023年初時,很多公司都在構建訓練集群,而算力設備容易發生故障,導致訓練中斷。為了應對這個問題,騰訊云花費時間優化了故障恢復的效率,從最初的30分鐘縮短到20分鐘,直到如今可以在10分鐘甚至幾分鐘內恢復訓練進度。這些持續的優化讓騰訊云在AI基礎設施上的能力變得越來越成熟,適應行業的發展需求。
問題:關于混元大模型,騰訊云最近上線了多模態的MOE模型,想問下為什么選MOE這個架構,出于什么考慮?
許華彬:選擇MOE架構并不是最近才做出的決定,早在2022年甚至更早,騰訊混元團隊就已經在使用MOE模型,并在此基礎上不斷升級。選擇MOE架構是基于多方面的考慮。
一方面,很多場景中希望模型的參數越大越好,MOE模型能夠很好地平衡參數規模與不同專家領域的知識儲備需求。其次,MOE模型在成本控制方面表現優異,特別是在全推理場景中,計算成本通常非常高,而MOE模型能夠在提供大規模參數的同時,降低推理成本。
另一方面,是在成本上。關于大模型和小模型的各種爭議一直存在,但總體來說,模型參數越大,結果往往會更好。然而,在實際應用中,還需根據不同場景靈活調整。例如,在騰訊會議中,AI總結和會議紀要等功能的使用量非常大,因此需要在效果、成本和可持續發展之間找到平衡。有時候,會通過蒸餾技術將大模型壓縮為較小的模型,以應對高成本壓力。所以我們要既考慮效果,又要考慮成本,也要考慮持續性健康的發展,最終選擇了MOE架構。