
智東西(公眾號:zhidxcom)
編譯 | 陳駿達
編輯 | Panken
智東西2月10日消息,近日科(ke)技媒體Rest of the World挖出(chu)了DeepSeek團隊中多位核(he)心人才的履歷。在中國接受本科(ke)教育,海外深造,之后又(you)回流(liu)中國AI行業,是這些人才們共同的經歷。
DeepSeek團隊中的潘梓正、Junxiao Song等核心人才都有海外背景。潘梓正曾在英偉達實習,并拿到轉正offer,但他毫不猶豫的選擇了加入當時還名不見的經傳的DeepSeek,并(bing)成為DeepSeek-VL2、DeepSeek-R1和DeepSeek-R1的核心貢(gong)獻(xian)者(zhe)。
Junxiao Song則畢業(ye)于香港科技(ji)大學,加入DeepSeek后他(ta)提出了(le)新穎的強化(hua)學習算法GRPO,該算法已應(ying)用于DeepSeek-R1在內的多款(kuan)模(mo)型的訓練。他(ta)還(huan)在DeepSeek的高效訓練、模(mo)型蒸餾(liu)等(deng)工作中(zhong)扮(ban)演重要(yao)角(jiao)色。
Junxiao Song的導師感嘆,“不知何故,DeepSeek吸引了最最優秀的一批人才”。
DeepSeek憑借獨特的公司文(wen)化,讓(rang)員(yuan)工(gong)對自己從事的工(gong)作充滿熱(re)情。創(chuang)始人梁文(wen)鋒在(zai)采訪中透露,與(yu)許多中國科技企業不(bu)同,DeepSeek不(bu)鼓(gu)勵(li)內(nei)部競爭和加班,并(bing)給了員(yuan)工(gong)極大的自由(you)度,可以(yi)自行(xing)選(xuan)擇任務并(bing)使用算力(li)。
在南加(jia)州大學(xue)教授(shou)、研究中(zhong)國(guo)(guo)科技法規的Angela Zhang看來(lai):“DeepSeek凸顯(xian)了中(zhong)國(guo)(guo)AI人(ren)才庫的實(shi)力,這(zhe)得益于大量高(gao)能(neng)力、高(gao)技能(neng)的軟件工程(cheng)師的支持,我相(xiang)信這(zhe)種人(ren)才優勢將使中(zhong)國(guo)(guo)在下一(yi)階段的AI發展中(zhong)占據強(qiang)勢地位。”
一、多位DeepSeek人才擁有國內外復合背景,但不在美國公司也能取得成功
2023年,在英偉達(da)實習結束時(shi),潘(pan)梓正面臨著一(yi)個關鍵(jian)抉擇:是(shi)留在硅谷與世(shi)界頂尖的(de)芯片設計師共事,還是(shi)回國加(jia)入當時(shi)還名(ming)不見經傳(chuan)的(de)杭州創企DeepSeek?
英(ying)偉達高級研究科學家(jia)、潘(pan)(pan)梓(zi)正(zheng)(zheng)實(shi)習期間的(de)導師(shi)Zhiding Yu在X平臺(tai)上回(hui)憶,潘(pan)(pan)梓(zi)正(zheng)(zheng)幾乎沒有(you)(you)猶豫,就直接(jie)選擇(ze)了(le)DeepSeek,這件事兒給他留下了(le)極(ji)為深刻的(de)印(yin)象。Yu在推文中(zhong)進(jin)一(yi)步寫道(dao),像(xiang)潘(pan)(pan)梓(zi)正(zheng)(zheng)這樣的(de)情況(kuang)越(yue)來越(yue)普遍(bian),“我們(men)有(you)(you)許多中(zhong)國的(de)優(you)秀的(de)人才,他們(men)不是(shi)非得在美國公司才能取得成功(gong)。”
▲Zhiding Yu發(fa)文回憶他與潘梓正的交集(圖源:X平臺)
潘梓正加入(ru)DeepSeek不到(dao)2年,該公司便因發(fa)布了2款先進且成本極低的AI模型而一舉成名,這一消(xiao)息導致英偉達(da)市值蒸發(fa)了近6000億美(mei)元。
潘梓正的選擇,反映了中國AI頂尖人才中一個日益增長的趨勢:他們(men)拒絕硅谷的工作機會,轉而投身中國的AI產業。在(zai)接(jie)受(shou)Rest of World采訪時,有國(guo)內科技行業人士認為,在(zai)中(zhong)國(guo)工作生(sheng)(sheng)活(huo)成本更低、離家人也更近,此外(wai),還有機會在(zai)職(zhi)業生(sheng)(sheng)涯早期(qi)便擔(dan)任重要職(zhi)務(wu)。DeepSeek的(de)團隊中(zhong)有許多來自中(zhong)國(guo)頂(ding)尖大學(如清華大學和北(bei)京大學)的(de)年(nian)輕畢業生(sheng)(sheng)和實習生(sheng)(sheng)。
在(zai)中(zhong)國(guo)的AI行業中(zhong),DeepSeek是一個特例(li),因為它完全由創始人(ren)梁文鋒的交易公司幻方量化(High-Flyer)資助。盡管美國(guo)禁(jin)止(zhi)中(zhong)國(guo)獲(huo)取(qu)先進芯(xin)片,但DeepSeek背后這些年輕(qing)、熱情的科技工作者(zhe)仍在(zai)努力追趕硅谷的科技巨(ju)頭(tou)。
根據芝加哥智庫MacroPolo發布的2023年全球人工智能人才報告,全球近一半的頂尖人工智能研究人員在中國完成了本科學業。中國的大學、國家支持的實驗室以及美國科技巨頭的在華研究機構(如位于北京的微軟亞洲研究院)幫助培養了大量本土研究人(ren)員。
例如,DeepSeek最新R1模型的(de)核心(xin)貢獻者Junxiao Song在(zai)浙江大學(xue)(xue)(xue)學(xue)(xue)(xue)習自動化,隨后于2015年在(zai)香港科技大學(xue)(xue)(xue)獲得(de)電子與計算機工程博(bo)士學(xue)(xue)(xue)位,他的(de)博(bo)士生導(dao)師Daniel Palomar告訴Rest of World,Junxiao Song堅持不懈(xie),且“非(fei)常(chang)注(zhu)重數學(xue)(xue)(xue)”。
▲Daniel Palomar與Junxiao Song的(de)合影(圖源:領英)
當Palomar在領英上發帖感嘆Junxiao Song在DeepSeek的成就時,另一位前(qian)學生評(ping)論說,Junxiao Song曾被稱為“大(da)師”。Palomar說:“不知何故,DeepSeek吸引了最最優秀的一批人才”。
▲Junxiao Song在實(shi)驗室的外號(hao)是“大師(shi)”(圖源:領(ling)英)
二、高薪自由不賽馬,DeepSeek用硬實力解決算力短缺
有不少美國科技公司雇傭中國實習生從事AI開發工作,這些實習生要么遠程工作,要么在硅谷辦公室工作。一位在美國企業工作的中國AI研究員稱:“中國學生工作非常扎實。”
但當企(qi)業向這些實習生提供全職(zhi)工作機會時,許多(duo)人(ren)會選擇(ze)回到中(zhong)(zhong)國(guo),許多(duo)中(zhong)(zhong)國(guo)學生對(dui)(dui)在美國(guo)全職(zhi)工作并(bing)不(bu)那么感興趣。近年來,對(dui)(dui)反移(yi)民政策的擔憂也阻止(zhi)了(le)一些中(zhong)(zhong)國(guo)工程師移(yi)居美國(guo)。
早期(qi)的(de)中(zhong)國頂尖科技人(ren)才(cai)更(geng)傾向(xiang)于(yu)硅谷的(de)工(gong)作,因為(wei)那里薪水(shui)更(geng)高,并且有(you)機會與(yu)世(shi)界頂級創(chuang)新者共事,但(dan)越來(lai)越多(duo)的(de)年輕AI工(gong)程師選擇留在國內。隨著中(zhong)國AI產業的(de)發展,他(ta)們也有(you)了更(geng)多(duo)的(de)機會,可以加入巨頭企業或是大量的(de)明星創(chuang)企。
DeepSeek吸引人才的方式十分獨特。根據36氪最近的報道,DeepSeek支付的薪酬甚至要高于字節跳動。與許多中國科技公司不同,DeepSeek不鼓勵內部競爭,也不讓工程師長時間工作。梁文(wen)鋒在2024年7月接受(shou)暗(an)涌采訪時稱,他讓員(yuan)工自(zi)由選擇任務并自(zi)由使用計算資(zi)源(yuan)。
梁文鋒認為(wei),DeepSeek正在解(jie)決最困(kun)難的(de)問題,所以他們對(dui)頂尖人才很有(you)吸引力。
在同(tong)一(yi)采訪中,梁文鋒稱,開源研究(jiu)讓(rang)員(yuan)(yuan)工更有自豪感,并提升了(le)公司(si)的(de)(de)聲譽。過去幾周,一(yi)些DeepSeek的(de)(de)研究(jiu)人員(yuan)(yuan)在X平臺上獲(huo)得(de)了(le)數萬粉絲,他(ta)們(men)討(tao)論研究(jiu)方法并分(fen)享他(ta)們(men)的(de)(de)興(xing)奮之情(qing)。
當DeepSeek-R1登上大模(mo)型競技場(開啟(qi)(qi)風格控制)榜首時,DeepSeek員工Deli Chan發文感嘆:“難以置信的(de)結果,感覺像夢一樣——我(wo)(wo)們(men)的(de)R1模(mo)型現在位居世界第一(并開啟(qi)(qi)了風格控制)。我(wo)(wo)的(de)激(ji)動之情難以言(yan)表(biao),我(wo)(wo)只(zhi)知道我(wo)(wo)們(men)一直在努(nu)力,讓開源通(tong)用人工智(zhi)能成為每個人的(de)現實(shi)。
當DeepSeek登頂(ding)App Store后,他在(zai)X平臺(tai)感嘆(tan)道(dao):“這一(yi)刻(ke)對我(wo)來說絕對是非凡(fan)的。”
瓦薩(sa)學院教(jiao)授、研究中(zhong)國高科技(ji)產業(ye)演變的(de)Yu Zhou告(gao)訴Rest of World,DeepSeek年輕研究人(ren)員的(de)熱情讓她想起了2000年代(dai)初在(zai)(zai)北(bei)京(jing)的(de)第一批互聯網初創公(gong)司(si)。當時,中(zhong)國頂尖大學的(de)畢業(ye)生受到谷歌和(he)微軟等公(gong)司(si)的(de)啟發(fa),最終在(zai)(zai)國內用(yong)更少的(de)資金和(he)更少的(de)頂尖工程師創建了一個科技(ji)產業(ye)。Yu Zhou稱:“美國認為中(zhong)國試圖(tu)取代(dai)美國,但事(shi)實是(shi)年輕人(ren)受到了OpenAI等新技(ji)術發(fa)展的(de)啟發(fa)。”
她認為,如今中國的AI企業家別無選擇,只能直面英偉達芯片短缺的問題,“當沒有資源時,你唯一擁有的就是你的智慧。”
結語:AI人才的流向正在發生變化
曾幾何(he)時,“去硅谷深造,進大廠鍍金”是科(ke)(ke)技精英的(de)(de)(de)黃(huang)金路徑,國內崗位常被視為職業(ye)規劃的(de)(de)(de)次優解。去年,在(zai)MacroPolo發布的(de)(de)(de)全球頂尖(jian)AI人才(cai)流向數據中(zhong),雖然(ran)其中(zhong)47%的(de)(de)(de)人才(cai)本(ben)科(ke)(ke)畢業(ye)于(yu)中(zhong)國大學(xue),但最(zui)終(zhong)僅有13%的(de)(de)(de)人最(zui)終(zhong)選擇(ze)留在(zai)中(zhong)國工作(zuo)。我國似乎成為了全球,尤其是美國AI產(chan)業(ye)的(de)(de)(de)人才(cai)“蓄(xu)水池”。
然而,隨著中(zhong)國AI實力的迅速崛起,美國在吸(xi)引AI人(ren)才上的優勢(shi)已經日漸縮小。或許會有更多類似DeepSeek這樣的本土團隊打造出令世(shi)界(jie)驚嘆的成(cheng)果。中(zhong)國AI人(ren)才池(chi),正悄然進行從(cong)“蓄水池(chi)”到(dao)“反應堆(dui)”的質變升級(ji)。
來(lai)源:Rest of the World