
智東西(公眾號:zhidxcom)
編輯 | Panken
智東西10月18日消息,近日,微軟AI CEO穆斯塔法·蘇萊曼(Mustafa Suleyman)接受WIRED專訪,詳細解讀了微軟Copilot愿景、AI智能體(AI Agent)的三個階段、微軟與OpenAI的關系、AI后續挑戰等焦點話題。
蘇萊曼說,微軟Copilot旨在創造一種伙伴間的持續互動體驗,不僅關乎技術,更在于提供情感支持;AI智能體分為信息處理、長期記憶、交互三大階段;微軟對OpenAI的模型進行了微調,使其(qi)不僅專注于(yu)解決數學(xue)和(he)科學(xue)問(wen)題,還能進行并列比較和(he)消費(fei)者分析(xi)。
微軟本月宣布其AI助手(shou)Copilot升級類(lei)似人類(lei)的(de)聲音、能(neng)看到用(yong)戶的(de)屏幕(mu)、擁有更好的(de)推理能(neng)力(li)。對(dui)此蘇萊曼稱,這(zhe)都是讓用(yong)戶重新(xin)愛上PC的(de)計劃的(de)一部分。
微(wei)軟全球(qiu)資深副總裁、微(wei)軟AI亞太區總裁張祺(qi)博士總結了此(ci)次(ci)訪(fang)談(tan)的啟示(shi):
“2024年諾貝爾獎的各個獎項已經全部揭曉,令人矚目的是,諾貝爾物理學獎與化學獎雙雙花落AI領域。AI技術及其應用成為今年諾獎最大的亮點。諾獎對AI相關成果及科學家的高度認可,不但有力地推動了AI技術的進一步發展和跨學科研究的深化,也預示著AI將以更快的速度推動人類社會的經濟增長和高質量發展。
AI的發展速度驚人,這在人類歷史上尚屬首次——機器學會了運用我們的語言。但AI所提供的信息能否符合人類的認知需求和價值判斷?AI能否真正理解語言背后的情感內涵?在AI與人類深度交互的背景下,如何確保數據和隱私安全?從長遠來看,哪些挑戰可能成為制約AI可持續發展的根本性因素?
在直面這些難題的同時,蘇萊曼先生對如何最大限度利用技術滿足用戶需求給出了一個清晰的路線圖。他探討了人工智能的發展、倫理問題以及未來的技術前景。這正是本次蘇萊曼先生采訪帶來的啟示 。”
以下是穆斯塔法·蘇萊曼與WIRED資深記者Will Knight的深度訪談實錄:
一、Copilot目標提供情感支持,Vision功能完全保護用戶隱私
主持人:Copilot的新愿景是什么?
穆斯塔法·蘇萊曼:我們正處于一個驚人的轉型點。AI伙伴現在能夠看到我們所見,聽到我們所聽,并使用我們溝通的同一種語言。這種新的設計理念關注的是持久性、關系和情感。我正在打造一種體驗,是關于與伙伴進行持久、持續互動。
主持人:你從Inflection AI加入微軟,該公司專注于構建支持性和同理心的AI。聽起來你把這種理念帶到了新的雇主這里。
穆斯塔法·蘇萊曼:我一直相信AI有提供支持的潛力。情感(gan)支持實(shi)際上(shang)是(shi)我19歲時(shi)開始工作的第一個項目,那時(shi)我啟動了一項電(dian)話咨詢服務。這(zhe)正是(shi)這(zhe)個技術時(shi)刻的美(mei)妙之(zhi)處(chu)——體驗與一個真(zhen)正了解你(ni)的AI伙伴互(hu)動。它會指導你(ni)、鼓勵你(ni)、支持你(ni)、教導你(ni)。我認為這(zhe)將不再讓(rang)人(ren)感(gan)覺(jue)像是(shi)在跟一臺計算機互(hu)動。
主持人:Copilot Vision是什么?這個“實驗室”功能將讓Pro用戶嘗試到什么?
穆斯塔法·蘇萊曼:Copilot Vision讓(rang)你(ni)(ni)(ni)(ni)能夠說“那(nei)邊的東西是(shi)什么(me)[在(zai)你(ni)(ni)(ni)(ni)的屏幕上]?”或“等一下,那(nei)是(shi)什么(me)?你(ni)(ni)(ni)(ni)覺得(de)那(nei)個(ge)怎么(me)樣?”在(zai)你(ni)(ni)(ni)(ni)坐在(zai)電腦(nao)前時(shi),會有很多這(zhe)樣的小(xiao)瞬間。這(zhe)個(ge)AI伙伴可以看到你(ni)(ni)(ni)(ni)所見,并實時(shi)與你(ni)(ni)(ni)(ni)討論你(ni)(ni)(ni)(ni)正在(zai)看的內(nei)容,這(zhe)是(shi)非常了(le)不起(qi)的。它在(zai)某種程度上改變了(le)你(ni)(ni)(ni)(ni)在(zai)數字生(sheng)活中(zhong)的體驗,因為(wei)你(ni)(ni)(ni)(ni)不必(bi)再費力輸入(ru)內(nei)容。
主持人:這聽起來像是Recall,那項有爭議的、現在需要選擇的Windows功能,用于記錄用戶屏幕上的內容。
穆斯塔法·蘇萊曼:保護用戶的隱私是至關重要的。目前我們不會用Copilot Vision保存任何內容,因此一旦會話結束后關閉瀏覽器,所有內容都會消失,完全刪除。但(dan)我(wo)在思考是否以及如(ru)何在未來引入(ru)這一功能,因為很多(duo)人確實希望有這樣(yang)的(de)體(ti)驗(yan)。
如果你可以說,“我(wo)前(qian)幾(ji)天(tian)在網上看(kan)到的那張圖片是什么?那個表情包(bao)是什么?”我(wo)想我(wo)們(men)總有一天(tian)得研究這(zhe)個問題。不過目前(qian),Copilot Vision工具是這(zhe)樣的。我(wo)們(men)需(xu)要隨著時間進(jin)行實(shi)驗,看(kan)看(kan)如何(he)在這(zhe)方面做更有意(yi)義的事情。
二、新功能類似于OpenAI“草莓”模型,針對消費者需求作調整
主持人:你們還推出了Think Deeper,這將使Copilot能夠處理更復雜的問題。這是基于OpenAI的o1模型,也就是Strawberry,對嗎?
穆斯塔法·蘇萊曼:是的,類似于Strawberry。我們對OpenAI的模型進行了調整,為了更符合消(xiao)費者(zhe)的需求,我們(men)讓它以(yi)一種更符合AI伙伴主題的方(fang)式運行。
主持人:有什么區別?
穆斯塔法·蘇萊曼:OpenAI的模型更專注于純數學和科學問題的解決。我們試圖讓它專注于并列比較和消費者分析等內容。當你(ni)在解(jie)決一個難題(ti)時卡住了,想要推理時,它可以(yi)真正列(lie)出一個并列(lie)比(bi)較,或者進行大規(gui)模分析。
主持人:微軟的人們已經在使用這個新版本的Copilot了嗎?
穆斯塔法·蘇萊曼:是的,大家都在使用。我們幾天前剛在公司內部全面上線。所以(yi)每個(ge)人都(dou)在使用,并且提(ti)供大量(liang)反饋(kui)。我們的反饋(kui)渠(qu)道非常繁忙,這(zhe)很有趣。
三、朝AI伙伴邁進一步,AI智能體三大階段解讀
主持人:人們會記得Clippy,微軟最后一個Windows AI助手。那里的員工有看到相似之處嗎?
穆斯塔法·蘇萊曼:我前幾天見到了比爾·蓋茨,他說,你知道嗎,你給整個AI的命名搞錯了?應該叫Clippy(回形針)。這確實顯(xian)示了蓋茨這樣的人的前瞻性。他(ta)們不(bu)僅能(neng)預(yu)見未來(lai)兩年(nian),還能(neng)預(yu)見未來(lai)二(er)十年(nian)。
主持人:新功能是否是朝著所謂的AI伙伴邁進了一步,AI伙伴可以在電腦上幫你處理有用的瑣事嗎?
穆斯塔法·蘇萊曼:是的,絕對是。
第一階(jie)段(duan)是AI處理與(yu)用戶相同(tong)的信息(xi)——看(kan)到(dao)(dao)用戶所見、聽到(dao)(dao)用戶所聽、閱讀用戶閱讀的文本。
第二(er)階段(duan)是AI具備長(chang)期、持續的記憶,隨著時間的推移建立起(qi)共(gong)同理解。
第三階段是AI通過發送指令和采取行動與第三方互(hu)動——比如購(gou)買東(dong)西、預訂東(dong)西、規劃日(ri)程。
我(wo)們(men)正在研發實驗模式(shi)中的這兩個功能。
主持人:你們有一個可以為你去購買東西的Windows AI智能體嗎?
穆斯塔法·蘇萊曼:這還有一段時間,但是的,我們已經形成了閉環,我們已經完成了交易 。這項技術的問題是,你可以讓它在50%到60%的時間里正常工作,但要讓它達到90%的可靠性還需要付出很多努力。
我(wo)已經看到了一些令人驚嘆的演示,其中它(ta)可(ke)以(yi)獨立啟動并進(jin)行購買等(deng)等(deng)。但我(wo)也(ye)見過一些事故的時候(hou),它(ta)不知(zhi)道自己在做什么。
主持人:能多告訴我一點“事故”的事嗎?它是否用蓋茨的信用卡去買了輛蘭博基尼?
穆斯塔法·蘇萊曼:如果它用的是蓋茨的信用卡,那就好笑了。但不,如我所說我們還在一步步摸索。這項技術仍然深處實驗室的困境中,還有很長的路要走,但我想進展可以按季度來計算,而不是按年。
四、AI的未來挑戰:打造可信賴技術,建立親密和個性化體驗
主持人:在實現你所描述的人工智能未來的過程中,你面臨的最大挑戰是什么?
穆斯塔法·蘇萊曼:最大的挑戰是找出如何打造可信的技術,因為這將是一種非常親密和個人的體驗。當然我們必須做好安全和隱私的部分。但我認為真正的關鍵在于設計對話,使AI伙伴能夠明確邊界,能夠說出“這是我不準備參與的事情”。
如果我們(men)能(neng)做到(dao)這一(yi)(yi)點(dian),那就是建立(li)可(ke)信體驗的(de)(de)基礎,然后我認為我們(men)可(ke)以真正(zheng)進入復雜的(de)(de)領(ling)域(yu),例如如何讓它代(dai)表你購買東西、代(dai)表你談(tan)判、代(dai)表你簽訂(ding)合同,或者為你規劃一(yi)(yi)個(ge)周六下午涉及三四個(ge)不(bu)同站點(dian)的(de)(de)日程。你會(hui)說,我相信你,Copilot,你能(neng)搞(gao)定,對(dui)嗎?這正(zheng)是我們(men)正(zheng)在(zai)努力實現的(de)(de)目(mu)標。
來(lai)源(yuan):微軟,WIRED