
智東西(公眾號:zhidxcom)
編譯 | 屈望苗
編輯 | 江心白
智東西4月15日(ri)消息,據(ju)外媒報道(dao),美國AI數據(ju)標(biao)簽企(qi)業Scale AI于當(dang)地時(shi)間4月13日(ri)宣布,最新一輪融資后該公司(si)估值73億美元。
Scale AI由時年(nian)19歲的Alexandr Wang在2016年(nian)創立,先后為美(mei)國自動駕駛汽(qi)車(che)公司(si)Waymo、豐田汽(qi)車(che)Toyota、美(mei)國網約(yue)車(che)公司(si)Lyft等客戶公司(si)提供用于機器學習(xi)的數據標記服務。
▲Scale AI創(chuang)始(shi)人Alexandr Wang
一、19歲小伙創立,曾簽下美國軍方大單
2016年(nian),年(nian)僅(jin)19歲的Alexandr Wang從麻省理工大學輟學,同(tong)年(nian)在完成了(le)硅(gui)谷創(chuang)業扶(fu)持公司Y Combinato的孵化(hua)項目后,和(he)22歲的Lucy Guo一同(tong)創(chuang)辦了(le)Scale AI。
Alexandr Wang出生在美國新(xin)墨西哥州,父母均是物(wu)理(li)學家。早在高(gao)中的(de)時候,Wang因在編程(cheng)比賽上的(de)出色(se)表現(xian),陸續接(jie)到科技公司(si)的(de)工(gong)作邀約,并在硅谷開啟(qi)了自己的(de)職(zhi)業(ye)生涯。
在接受(shou)采訪時,Wang回憶道,“我在硅谷工(gong)作(zuo)的這段時間(jian)里,看到人工(gong)智能領域目前存在的形形色色的問(wen)題,因而(er)了解到機器學(xue)習的重要性。”
▲Alexandr Wang(左一(yi))和Scale員工
Scale幫助企業整理和標(biao)注用來訓練AI系統的數(shu)據(ju),這個(ge)過程通常需要為數(shu)萬個(ge)示例添加標(biao)簽。
從最初為自(zi)動(dong)駕駛(shi)汽車處理圖像和(he)視頻(pin)數據,發展到如今為金融(rong)、物流(liu)企業和(he)政府提供廣(guang)泛(fan)的(de)視覺和(he)自(zi)然語言數據支持,Scale已經成為了這一領域主要的(de)公司之一。
Wang告訴美媒Fortune,該公司去年的(de)銷售額翻了一番,并且有望在12個月內實現1億美元(yuan)的(de)收(shou)入(ru)。
2020年9月,這家年輕的獨角獸企業首次和美國軍方達成合作,一舉拿下美國國防部的9100萬美元大單,協助美國(guo)軍方試驗(yan)、開發(fa)以(yi)及更(geng)新用(yong)于(yu)機器(qi)學習和AI的標注數據(ju)集。
在(zai)線(xian)支付(fu)服務(wu)商PayPal和社(she)交網站Pinterest都曾是Scale的客(ke)戶,該(gai)公(gong)司(si)還曾與豐(feng)田、通用汽(qi)車(che)等主要(yao)汽(qi)車(che)制造(zao)商合作。此外(wai),該(gai)公(gong)司(si)的員工人數也(ye)從去年的約100人增至300人。
機(ji)器學習(xi)正(zheng)在(zai)逐(zhu)漸取代傳統(tong)的軟件編程,來幫助公司將任務自動化。“數(shu)據(ju)就是新的代碼。數(shu)據(ju)是系統(tong)建(jian)設、培訓和測試(shi)的基礎(chu),也是關(guan)鍵(jian),”Wang說,“公司需要利(li)(li)用和操縱數(shu)據(ju),就像(xiang)他們過去利(li)(li)用和操縱代碼一樣。”
二、訓練AI“黑科技”,數據標簽助機器學習
創(chuang)建(jian)五年以來,Scale的(de)業(ye)務(wu)已經從簡單的(de)數據標(biao)記發展為一整套(tao)基(ji)于(yu)軟件的(de)服務(wu)。它可以幫助企業(ye)收集(ji)、注釋、管理(li)和清理(li)數據,以及建(jian)立和監控基(ji)于(yu)這些(xie)數據的(de)機器學習模型(xing)。
其中(zhong),一個名為Nucleus的軟件包(bao)可以讓客戶在(zai)數據中(zhong)快(kuai)速(su)找(zhao)到可能會降低AI算法性(xing)能的錯誤標簽(qian),并給數據添(tian)加(jia)新標簽(qian),對AI系統的弱(ruo)點(dian)進行更(geng)多訓練來改進其性(xing)能。
▲Scale Nucleus系(xi)統示意圖
“在所謂的(de)(de)90%或(huo)95%準(zhun)確率(lv)下,失(shi)敗率(lv)也并不是(shi)均勻分布的(de)(de),”特斯拉前高(gao)級機器學習工程師、如今(jin)領導Scale Nucleus團隊(dui)的(de)(de)羅素·卡普蘭(lan)(Russell Kaplan)說。
所有的AI系統(tong)都有統(tong)計偏差,即犯錯(cuo)的傾(qing)向(xiang)。這些(xie)錯(cuo)誤通(tong)常涉(she)及“邊緣情況(kuang)”,即在訓練(lian)數(shu)據中沒有充分體現的罕(han)見事件。
卡普蘭將Nucleus比作軟件(jian)調試工具,但(dan)它(ta)被用于數據,而非軟件(jian)代(dai)碼。
三、半年內估值翻一倍,形勢向好
美(mei)國時間(jian)4月13日(ri),Scale宣布已在最新一(yi)輪投(tou)資(zi)中籌(chou)集3.25億美(mei)元。此次融資(zi)使該公司自2016年成立以來籌(chou)集的風(feng)險資(zi)本總額超過6億美(mei)元。
2019年8月(yue),Scale獲得美國風投機構創始人基金(jin)(Founders Fund)的1億美元投(tou)資,憑借10億美元的(de)估(gu)值一躍成(cheng)為硅谷(gu)最(zui)年(nian)輕(qing)的(de)獨角獸企業之一。Scale?AI還陸續(xu)收到了Index Ventures、Accel、Coatue Management的(de)投資。
2020年12月,Scale在上一輪(lun)(lun)融資(zi)后(hou)估(gu)值1.55億美元,而此輪(lun)(lun)融資(zi)后(hou)其估(gu)值已經是這一數值的兩倍多。
最(zui)新一輪的投(tou)(tou)資(zi)由美國投(tou)(tou)資(zi)公司(si)(si)Dragoneer、Greenoaks Capital,以及科技投(tou)(tou)資(zi)公司(si)(si)Tiger Global領(ling)投(tou)(tou),投(tou)(tou)資(zi)管理公司(si)(si)Wellington Management和Durable Capital也參與了這輪融資(zi)。
Wang在(zai)接受采訪時透露,公(gong)司(si)目前(qian)沒有計劃上市,但(dan)“一直在(zai)關注市場(chang)”。亞馬(ma)遜前(qian)高管杰(jie)夫(fu)·威爾克(Jeff Wilke)將作為CEO特別顧問加入Scale。
結語:由機器學習衍生,數據標注自動化
隨著AI技術的(de)發展,用于機器學習的(de)數據標(biao)簽催生(sheng)了(le)一(yi)個全新的(de)行業。幫助企業對數據進行標(biao)簽的(de)公司如(ru)雨(yu)后春(chun)筍(sun)般(ban)涌現。對于想從人工智能熱潮中獲(huo)利的(de)投資(zi)者來說(shuo),數據標(biao)簽和管理(li)已(yi)經成為一(yi)種流行的(de)“掘金”方式。
舊金山初(chu)創公(gong)司(si)Labelbox運營著一個軟件平臺,幫助(zhu)企(qi)業管(guan)理數據標簽任(ren)務(wu),這家公(gong)司(si)的融(rong)資總(zong)額達到(dao)了3900萬美元(yuan)。還(huan)有特(te)拉維夫的初(chu)創公(gong)司(si)Dataloop,在2020年(nian)10月完成(cheng)了1100萬美元(yuan)融(rong)資。
AI算法(fa)大大提高了數據(ju)標(biao)注(zhu)的效率,這種算法(fa)為主、人(ren)工為輔的標(biao)注(zhu)模式指(zhi)明了未來(lai)機器學(xue)習(xi)訓練數據(ju)整理的趨勢(shi)。
來源(yuan):Fortune