
智東西(公眾號:zhidxcom)
編 | 海中天
導語:PCMag記者在谷歌總部呆了一天,深入了解AI與機器學習是如何在谷歌內部滲透的。他們采訪了許多高管,谷歌的目標就是圍繞AI打造一個生態系統,將重復的人工處理變成自動流程,用AI為企業服務。
Makoto Koike是日(ri)本一名農(nong)民(min),種植黃(huang)瓜(gua)(gua)。之前他是嵌入式系(xi)統設計師,在日(ri)本汽車行業工作,2015年他回到故鄉,幫助父母(mu)種黃(huang)瓜(gua)(gua)。很快,他就(jiu)發現要給(gei)黃(huang)瓜(gua)(gua)分類(lei)很麻煩,農(nong)民(min)要根據顏色、形狀(zhuang)、尺寸、特點(比如(ru)是否多(duo)刺)給(gei)黃(huang)瓜(gua)(gua)分類(lei),工作很棘手,比種黃(huang)瓜(gua)(gua)還要費力。谷歌(ge)開發了(le)AI軟件AlphaGo,受到谷歌(ge)的啟發,Makoto Koike想將(jiang)任務變成(cheng)自動化流(liu)程。
現(xian)在(zai)企業(ye)已經(jing)開始通過各(ge)種方(fang)式將AI應用(yong)于實際,不過還沒有(you)人看(kan)到(dao)過類似的技(ji)術出現(xian)過。Koike之前從沒有(you)從事過AI技(ji)術方(fang)面的工作(zuo),有(you)了開源TensorFlow機(ji)(ji)(ji)器學(xue)習技(ji)術,他開始將黃(huang)瓜的圖片輸入系統。計(ji)算(suan)機(ji)(ji)(ji)視覺(jue)算(suan)法已經(jing)可以識別對象,深度學(xue)習可以根據黃(huang)瓜的細微差別訓練(lian)TensorFlow,Koike意識到(dao)它可以用(yong)來識別、分類蔬菜,精準度很高。然后(hou),Koike只用(yong)了TensorFlow和一臺便宜的Raspberry Pi 3計(ji)算(suan)機(ji)(ji)(ji)就(jiu)制作(zuo)出自(zi)動分類機(ji)(ji)(ji)器,今天(tian)農場(chang)還在(zai)使用(yong)這臺機(ji)(ji)(ji)器。
市場上有許多的開(kai)源算法和(he)工(gong)具,TensorFlow只(zhi)是其中(zhong)之(zhi)一(yi),企業和(he)開(kai)發(fa)者想用(yong)AI解(jie)決一(yi)些(xie)問題,TensorFlow可以為他們(men)的工(gong)作(zuo)帶來(lai)革(ge)命性(xing)影響。谷歌將這些(xie)技術和(he)應用(yong)程(cheng)序(xu)界面(API)放(fang)進自己(ji)所做的一(yi)切(qie)事情中(zhong),將機器學習植入產(chan)品(pin),從根本上重新定義了軟件的運行流程(cheng)。
最近,PCMag拜(bai)訪了(le)Googleplex(也就是(shi)谷(gu)(gu)(gu)歌(ge)總部),采訪了(le)一些(xie)高管,他們來自G Suite、谷(gu)(gu)(gu)歌(ge)云平臺(Google Cloud Platform)、機器(qi)學習先進解(jie)決方案實驗室(Machine Learning Advanced Solution Lab,ML ASL),了(le)解(jie)谷(gu)(gu)(gu)歌(ge)是(shi)如何用AI技術重塑(su)自我的。
AI無處不在
假設你的(de)一(yi)個客(ke)(ke)戶(hu)(hu)遇到了(le)問題,公司服務部門的(de)一(yi)名代理用(yong)Google My Business與客(ke)(ke)戶(hu)(hu)在網上溝通,Google My Business是(shi)一(yi)個聊天功能,目前還處在試點(dian)階段。要(yao)幫(bang)助客(ke)(ke)戶(hu)(hu)解(jie)決問題,用(yong)戶(hu)(hu)需要(yao)將一(yi)些敏感個人數據(ju)發給代理。現在假設客(ke)(ke)戶(hu)(hu)是(shi)你的(de)祖母(mu)。客(ke)(ke)戶(hu)(hu)服務代表要(yao)求(qiu)你的(de)祖母(mu)發一(yi)些數據(ju),少量的(de)數據(ju),你的(de)祖母(mu)在聊天過程中上傳一(yi)張圖(tu)片,一(yi)張社會(hui)保障(zhang)卡的(de)圖(tu)片,但是(shi)她提交的(de)信息(xi)比要(yao)求(qiu)的(de)多(duo)。
現在(zai)谷(gu)歌不是這樣做的(de),它會(hui)將(jiang)個人身份(fen)信(xin)息(xi)(PII)歸(gui)檔,帶有(you)社會(hui)保障號的(de)圖片出現之后,其它PII信(xin)息(xi)也會(hui)自動(dong)匹配。代理看不到多余的(de)信(xin)息(xi),也不會(hui)有(you)任何數據放(fang)進(jin)谷(gu)歌加(jia)密(mi)檔案。在(zai)加(jia)州谷(gu)歌山景城總部,公(gong)司(si)員工演(yan)示了Google My Business的(de)新功(gong)能,到底(di)機器學習算法是怎樣完成使命的(de)呢?谷(gu)歌揭開了神(shen)秘的(de)面紗。
谷(gu)歌(ge)云計算信任(ren)與安(an)全營(ying)銷主管Rob Sadowski解釋稱(cheng),自(zi)動編輯是通過(guo)谷(gu)歌(ge)數據損失預防(DLP) API完成(cheng)的(de)(de),它(ta)是底層技術(shu),給敏感數據分類是表(biao)面。算法還(huan)可以用同樣的(de)(de)方式處理一些(xie)數據,比(bi)如信用卡號碼,如果號碼是假的(de)(de),它(ta)可以分析(xi)模式,進行(xing)識(shi)別。谷(gu)歌(ge)想(xiang)將AI放進體(ti)驗中,讓企業、開發者(zhe)(比(bi)如Koike)有資(zi)源做(zuo)同樣的(de)(de)事(shi)情,這只是谷(gu)歌(ge)精妙(miao)策略的(de)(de)一個(ge)例(li)證(zheng)。
有(you)許多(duo)(duo)科技巨頭正在嘗試將互(hu)聯智(zhi)(zhi)能層植(zhi)入軟件,不(bu)只是谷(gu)歌(ge)這樣做,還有(you)亞馬遜和微(wei)軟,不(bu)過與它們相比谷(gu)歌(ge)的云(yun)智(zhi)(zhi)能工具和服務無(wu)(wu)疑(yi)寬泛很(hen)多(duo)(duo)。分析谷(gu)歌(ge)產品,你(ni)會(hui)發(fa)現谷(gu)歌(ge)助手、多(duo)(duo)種機(ji)器學習系統、計算(suan)機(ji)視覺API無(wu)(wu)處(chu)不(bu)在。
谷(gu)歌搜索在RankBrain AI系(xi)統使(shi)用(yong)(yong)了(le)機(ji)器學(xue)習(xi)技(ji)術,根(gen)據(ju)(ju)眾(zhong)多(duo)變(bian)量處理(li)精煉(lian)提(ti)問、重(zhong)新(xin)(xin)排序(xu)、聚合(he)數據(ju)(ju),不斷(duan)改進(jin)搜索結(jie)果(guo)。谷(gu)歌Photos用(yong)(yong)計算(suan)機(ji)視覺技(ji)術拼接照片,將(jiang)它(ta)化(hua)為回(hui)憶,將(jiang)同(tong)一(yi)個地點的多(duo)張(zhang)圖(tu)片變(bian)成全(quan)景圖(tu)。Inbox可以自(zi)動生成“智能(neng)回(hui)復(fu)(Smart Replies)”,供用(yong)(yong)戶選擇,通過將(jiang)相似類型的郵(you)(you)件捆綁,讓高度相關的郵(you)(you)件突出顯示。新(xin)(xin)的谷(gu)歌Allo聊天APP內置了(le)谷(gu)歌助手。還有更多(duo)的工具使(shi)用(yong)(yong)了(le)AI技(ji)術。
所有(you)這些APP都是在(zai)谷歌(ge)云基(ji)礎(chu)設施(shi)上(shang)運行的,谷歌(ge)在(zai)數(shu)據(ju)中心使用(yong)了機(ji)器學習(xi)技術,用(yong)它降低能耗(hao),根(gen)據(ju)負載、天氣(qi)信息調整冷卻(que)泵。Sadowski說,在(zai)谷歌(ge)的安(an)全(quan)戰(zhan)略中,機(ji)器學習(xi)也是最(zui)后的防護層,谷歌(ge)在(zai)安(an)全(quan)堆棧中用(yong)機(ji)器智力、風險評分(fen)(fen)判斷系統使用(yong)可(ke)預測分(fen)(fen)析是否存(cun)在(zai)缺陷。
Sadowski解(jie)釋(shi)稱:“谷歌開發了許多機器學(xue)習(xi)和(he)AI模(mo)型,公(gong)司從安全角(jiao)度著眼將所有(you)模(mo)型優化(hua)(hua)。與(yu)IT大多的(de)部分相(xiang)比,安全是變化(hua)(hua)比較大的(de)。3年或者4年前,有(you)些產品是安全基礎(chu)設施(shi)的(de)核心,比如防(fang)(fang)火墻、端點防(fang)(fang)護,這些技(ji)術仍(reng)然很重要,但是我(wo)們(men)想提(ti)供更(geng)深(shen)的(de)防(fang)(fang)護,讓它規模(mo)化(hua)(hua)應用,將它作為默認技(ji)術放(fang)置在多租(zu)戶(hu)基礎(chu)設施(shi)上,每天(tian)可以有(you)幾(ji)百萬活躍(yue)用戶(hu)。”
“我(wo)(wo)們從底(di)層數(shu)(shu)據中心硬件開始起步(bu),比如(ru)最新的(de)(de)Titan芯片。”Sadowski繼續(xu)說,“在此之上是應用(yong)(yong)服(fu)務、身份驗證,數(shu)(shu)據與通信完全加密(mi)。再上層是用(yong)(yong)戶身份。如(ru)何(he)才能7天24小時監(jian)控、偵測、響應事件,這是最后的(de)(de)防(fang)護(hu)層。例如(ru),如(ru)果要讓(rang)用(yong)(yong)戶通過身份認知代理遠程接入,我(wo)(wo)們就會(hui)有類(lei)似的(de)(de)技術確保安(an)全。它是一項可編(bian)程的(de)(de)DLP服(fu)務,能夠(gou)發現并防(fang)范(fan)數(shu)(shu)據泄(xie)露(lu),幫助管(guan)理數(shu)(shu)據,增強安(an)全性。我(wo)(wo)們的(de)(de)目標是讓(rang)這些功能變得(de)更容易(yi)使(shi)用(yong)(yong),變成(cheng)可消費服(fu)務,大規模(mo)推廣。”
智能G Suite
機器(qi)學習技術已經植入(ru)谷歌G Suite生產應用中。G Suite產品管理主(zhu)管Allan Livingston介紹了一些谷歌所采(cai)用的(de)方法,這些方法使得(de)G Suite更智(zhi)能、更能感(gan)知環(huan)境,甚至連用戶都意識不到(dao)。
Livingston解釋稱:“你(ni)可以想像一下,G Suite將所有(you)應(ying)(ying)用(yong)以更自(zi)然的方(fang)式整(zheng)合在(zai)一起。你(ni)從(cong)其(qi)中一個(ge)應(ying)(ying)用(yong)開始工作,以適當的方(fang)式過(guo)渡到(dao)其(qi)它應(ying)(ying)用(yong)。你(ni)在(zai)Drive中打開Gmail附(fu)件,它將你(ni)帶到(dao)Docs,完全自(zi)動。”
“我(wo)們努力(li)站(zhan)在(zai)用戶的角度思考,當中會(hui)涉及到機器學習。我(wo)們最(zui)先從Gmail智能(neng)(neng)回復(fu)開始,然后(hou)在(zai)Inbox取得了成功(gong),接下來又在(zai)Docs、Sheets、Slides中引進了Explore功(gong)能(neng)(neng)。”
Explore于去年秋天(tian)推出(chu),它將(jiang)自然語言(yan)處理技術應(ying)用于程序內生(sheng)產(chan)體(ti)驗。例如(ru),在Docs中,Explore可(ke)以根據文檔內容瞬間提供建(jian)議,還(huan)可(ke)以自動推薦相關主題和資(zi)源。在Slides中,它可(ke)以生(sheng)成設計(ji)建(jian)議,讓用戶精簡陳(chen)述格式(shi)。Livingston解(jie)釋了Explore是如(ru)何(he)用機(ji)器(qi)學(xue)習簡化數據分析(xi)、商業智(zhi)能情(qing)報(bao)的。
“許多用(yong)戶不知道數(shu)(shu)據(ju)(ju)(ju)透視(shi)表(biao)是(shi)什么(me),也不知道如何利用(yong)它將數(shu)(shu)據(ju)(ju)(ju)表(biao)視(shi)覺化。” Livingston解釋稱(cheng),“假設你(ni)(ni)(ni)要處理一名(ming)客戶的(de)銷(xiao)售數(shu)(shu)據(ju)(ju)(ju),每一行(xing)都是(shi)一件已經(jing)銷(xiao)售的(de)商(shang)品。Explore允許你(ni)(ni)(ni)用(yong)自然語言提問(wen),比如:‘黑(hei)色星期(qi)五最暢銷(xiao)的(de)是(shi)什么(me)商(shang)品?’系統會(hui)回答(da)說:‘你(ni)(ni)(ni)賣了563條褲子(zi)。’在數(shu)(shu)據(ju)(ju)(ju)分析過程(cheng)中(zhong)我們可以(yi)節(jie)省時間,因(yin)為決策是(shi)以(yi)數(shu)(shu)據(ju)(ju)(ju)作(zuo)為基(ji)礎(chu)的(de),我們用(yong)機器學習以(yi)更(geng)自然的(de)方式提高解決普通問(wen)題(ti)的(de)能(neng)力。”
Livingston還說,谷(gu)歌準備(bei)將這(zhe)種(zhong)機器(qi)學習云搜索功能提供給第三(san)方,它開始圍繞新技術建立一個生態系統。谷(gu)歌的總思路(lu)實際(ji)上與AI的實用(yong)性(xing)(xing)有關:讓(rang)人工(gong)處理實現自(zi)動(dong)化(hua)(hua),將用(yong)戶解放(fang)出來,讓(rang)他們(men)從事(shi)更有創造(zao)性(xing)(xing)的工(gong)作(zuo)。這(zhe)種(zhong)思路(lu)實際(ji)上已經(jing)成(cheng)(cheng)為(wei)大多機器(qi)學習APP的核心:讓(rang)重復(fu)性(xing)(xing)業務流(liu)程(cheng)自(zi)動(dong)化(hua)(hua),讓(rang)日常任(ren)務(包括黃瓜分類)變成(cheng)(cheng)自(zi)動(dong)化(hua)(hua)流(liu)程(cheng)。
“在商業行為中,與消費者溝通時,用戶已經使用這些自然交互模式。向云計算和移動生產力轉移改變了人們的工作方式,而機器學習技術又是其根本。”Livingston說,“因為我們在機器學習方面有優勢,因為我們的產品可以作為基礎提供服務,因為所有數據全都放在我們的云計算網絡中,所以我們占據了最佳位置,可以使用它,以規模化方式應用。”
為機器學習革命提供動力
谷(gu)(gu)歌在AI方(fang)面所做的(de)(de)一切工(gong)作(zuo)(zuo)都是以API、算法、開(kai)源工(gong)具(ju)作(zuo)(zuo)為根(gen)基的(de)(de)。谷(gu)(gu)歌TensorFlow 資源庫是GitHub平臺(tai)上最流行的(de)(de)機器學習(xi)工(gong)具(ju),許多應用(yong)程序(xu)采用(yong),比(bi)如Koike黃瓜分類(lei)程序(xu)。整套API就是谷(gu)(gu)歌云計算的(de)(de)根(gen)本,正是它為谷(gu)(gu)歌APP和服務的(de)(de)每(mei)一個AI功能提供動力。
谷(gu)(gu)歌(ge)研(yan)究與機(ji)(ji)器(qi)智(zhi)能(neng)產品經理Francisco Uribe為引擎核心工作,正是(shi)這(zhe)個核心改變了谷(gu)(gu)歌(ge)的運(yun)行模(mo)式。Uribe掌管谷(gu)(gu)歌(ge)ML ASL,它是(shi)一(yi)個實驗室,谷(gu)(gu)歌(ge)機(ji)(ji)器(qi)學習專家直(zhi)接與企業合(he)作,將AI解決(jue)方案植(zhi)入企業。通過(guo)谷(gu)(gu)歌(ge)API和云計算(suan)機(ji)(ji)器(qi)學習引擎,實驗室與企業攜手(shou)合(he)作,幫助企業在生產過(guo)程中(zhong)訓(xun)練、部(bu)署(shu)模(mo)型。
Uribe在(zai)(zai)AI領(ling)域工(gong)(gong)作(zuo)了(le)10多年(nian)。他(ta)成立了(le)BlackLocus,這是一(yi)家(jia)數據創業公司(si),為零售商開發(fa)(fa)自動(dong)比價(jia)引擎,2012年(nian)被(bei)家(jia)德寶收購。之后Uribe加入谷(gu)歌(ge),在(zai)(zai)搜索廣告團隊工(gong)(gong)作(zuo)了(le)4年(nian),用(yong)機器學習改進廣告體驗。2016年(nian),他(ta)進入ML ASL,負責開發(fa)(fa)工(gong)(gong)作(zuo),成為Launchpad Accelerator的導師(shi)。Uribe說,企業和開發(fa)(fa)者積極使用(yong)谷(gu)歌(ge)工(gong)(gong)具,他(ta)感到相當驚訝。
“我(wo)們(men)(men)(men)看到工具(ju)應用(yong)于(yu)多個領域,包(bao)括健(jian)康護理、金融、零售和農業。”Uribe解釋說,“我(wo)們(men)(men)(men)正在努力幫助(zhu)客戶增強感知能力。語音翻譯、圖(tu)像識別、視頻(pin)API、自然語言:它們(men)(men)(men)都是民主接入機器、深(shen)度學習算(suan)法的組成(cheng)部分(fen),這些算(suan)法終(zhong)于(yu)變(bian)得適用(yong)了。”
ML ASL與匯(hui)豐(feng)銀行合作(zuo)(zuo),用機(ji)器學習(xi)解決方(fang)案反(fan)制(zhi)洗錢活動,預(yu)測信用評分(fen)。ML ASL還與聯合服務汽車協會(hui)(USAA)合作(zuo)(zuo),幫它訓(xun)練機(ji)器學習(xi)工程(cheng)師,將技術應用于(yu)保險領域(yu)。eBay用谷歌(ge)工具訓(xun)練ShopBot 數字助手。Uribe解釋(shi)稱,當ML ASL與企業合作(zuo)(zuo)時,整(zheng)個過程(cheng)包(bao)含(han)4個重要部分(fen)。
“機器(qi)學(xue)習(xi)工(gong)作的要求很高(gao),你(ni)需要強(qiang)大的計算(suan)產(chan)品才能(neng)滿足要求,你(ni)還(huan)要用GCP的分布式光纖骨干網(wang)絡傳(chuan)輸數(shu)據(ju),以很高(gao)的效率從一個節點(dian)傳(chuan)輸到另(ling)一個節點(dian)。”Uribe說,“我們有云機器(qi)學(xue)習(xi)引擎(Cloud Machine Learning Engine),可以幫助(zhu)客(ke)(ke)戶訓練模型,我們利(li)用Kaggle社(she)區幫助(zhu)客(ke)(ke)戶處理數(shu)據(ju),那里(li)有800名活躍的數(shu)據(ju)科(ke)學(xue)家。最終,你(ni)還(huan)需要人才,在研發(fa)方面,我們有Brain Residency Program,這個項(xiang)目用復雜的機器(qi)學(xue)習(xi)課程(cheng)培訓工(gong)程(cheng)師(shi)。它(ta)們都是組成部分,共同(tong)幫助(zhu)客(ke)(ke)戶構建智(zhi)能(neng)應(ying)用。”
所有這些(xie)(xie)東(dong)西都放進了(le)開源社區和第三方(fang)生態系(xi)統。年初時,谷歌宣布舉辦機(ji)器學(xue)習創(chuang)業公(gong)司(si)挑戰賽,機(ji)器學(xue)習創(chuang)業公(gong)司(si)如果拿獎,最高可獲50萬美(mei)元投資。Uribe談(tan)到了(le)一些(xie)(xie)創(chuang)業應用,這些(xie)(xie)應用是Uribe在谷歌技術(shu)中看到的,未來(lai)也許會出(chu)現其它的變化。
“假設(she)你有一(yi)家(jia)客戶(hu)服務分(fen)(fen)析公司,你們用(yong)(yong)語音(yin)API轉化語音(yin)呼叫,然后分(fen)(fen)析情感,提(ti)高客服質(zhi)量。”Uribe說,“到了外國,你可(ke)以(yi)用(yong)(yong)視(shi)覺API拍一(yi)張街道(dao)標志的(de)照片,然后翻譯API就可(ke)以(yi)實時在(zai)APP中將內容翻譯出來。它不只可(ke)以(yi)提(ti)高效率(lv),還可(ke)以(yi)創造新(xin)穎、獨特的(de)用(yong)(yong)戶(hu)體驗。”
Uribe認為,因為TensorFlow等工具(ju)的存(cun)在,在市場(chang)上大(da)規模(mo)推廣機(ji)器(qi)學習技術(shu)變(bian)得更(geng)容易了。谷歌(ge)是什么?谷歌(ge)如何開發(fa)產(chan)品(pin)?現在這些(xie)技術(shu)已經成為核心,不只如此,Uribe還(huan)相信(xin)廣泛存(cun)在的機(ji)器(qi)學習技術(shu)可以優化業務、創造新(xin)的營(ying)收流、發(fa)明新(xin)型智能APP。
他還說:“我(wo)(wo)們可以(yi)(yi)將(jiang)它(ta)視為新的工(gong)業(ye)革命,這些工(gong)具可以(yi)(yi)大幅提高效(xiao)率,帶來(lai)前年未有的體驗(yan)。創業(ye)公司積極(ji)采用,我(wo)(wo)們感到驚訝。看(kan)看(kan)日(ri)本種黃(huang)瓜的農民,他用TensorFlow開(kai)發一個模型(xing),根(gen)據模樣、尺寸、紋理等(deng)標準給黃(huang)瓜分類,然(ran)后(hou)自己制作(zuo)特(te)殊(shu)硬件執(zhi)行(xing)。這是一種民主化進程,讓人驚嘆,我(wo)(wo)們現在只(zhi)是觸(chu)及表面。”