Meta 的超級智能實驗室 Superintelligence 才剛剛拉開大幕,資金、算力應(yīng)有盡有,CEO 小扎更是親自下場喊口號,勢必要讓「人人都有超級智能」。
可偏偏就在這個時候,Meta 研究科學(xué)家 Rishabh Agarwal 剛剛發(fā)推官宣——他要走人了。
來品品他的離職宣言:
「這是我在 @AIatMeta 的最后一周。是否繼續(xù)加入新的 Superintelligence TBD 實驗室對我來說是一個艱難的決定,尤其是在那樣的人才與算力高度集中的環(huán)境下。但在 Google Brain、DeepMind 和 Meta 度過了 7.5 年之后,我還是感受到一種驅(qū)動力——去承擔(dān)一種不同類型的風(fēng)險?!?/p>
聽到這里是不是覺得,噢,這就是常規(guī)離職套話?別急,他還補了一刀:
「Mark 和 Alexandr Wang 提出的加入 Superintelligence 團隊的愿景極具吸引力。但最終我選擇遵循 Mark 本人的建議:『在一個變化如此之快的世界里,你能冒的最大風(fēng)險就是不冒任何風(fēng)險?!弧?/p>
笑死,沒想到原本扎克伯格掏心掏肺的毒雞湯,直接成了 Rishabh 遞辭職信的理由。
而為了贏得 AI 競賽,最近的 Meta 的招聘節(jié)奏也是異常激進(jìn)。
小扎向不少頂級研究員開出了高達(dá)九位數(shù)美元的薪酬,甚至親自通過電子郵件和 WhatsApp 等方式從 OpenAI、Google 等公司招募人才,開出的總薪酬有時能達(dá)到 1 億美元。
截至 8 月中旬,Meta 已成功從 OpenAI 挖走超 20 人,從 Google 挖走至少 13 人,3 名來自蘋果 ,3 名來自 xAI,2 名來自 Anthropic,總計新員工超過 50 名。
然而,最近有傳言稱,Meta 在持續(xù)數(shù)月大舉招攬了超過 50 名 AI 研究員和工程師后,已于上周開始凍結(jié)其 AI 部門的人員招聘,并全面縮減 AI 部門規(guī)模,重組 AI 團隊。
Meta AI 業(yè)務(wù)將被重組為研究、訓(xùn)練(TBD Lab 待確定實驗室)、產(chǎn)品和基礎(chǔ)設(shè)施四個核心團隊 ,大部分團隊負(fù)責(zé)人都將直接向Wang匯報。此前負(fù)責(zé) Llama 大模型的 AGI 基金會團隊也在此次重組中被正式解散。
或許 Rishabh 也受到了重組風(fēng)波影響。
不過,Rishabh 在 Meta 的時候可不是混日子的。根據(jù)他的描述,在短短幾個月里,他就和團隊折騰出了不少成果,比如推動了在「思考型」模型在后訓(xùn)練方面的進(jìn)展。
具體包括:
- 通過 RL 擴展,將一個 80 億參數(shù)的稠密模型推到了接近 Deepseek-R1 的性能。
- 在中期訓(xùn)練中使用合成數(shù)據(jù),以便更好地啟動 RL。
- 開發(fā)了更優(yōu)的 on-policy 蒸餾方法。
細(xì)看 Rishabh 的履歷,在 AI 圈也算上實力派選手。
他本科畢業(yè)于印度理工學(xué)院孟買分校,主修計算機科學(xué)與工程。隨后他在加拿大魁北克人工智能研究所 Mila 攻讀博士,論文方向是深度強化學(xué)習(xí)的突破性探索,師從 Aaron Courville 和 Marc Bellemare。
Google Scholar 顯示,他參與并發(fā)表了一系列有影響力的研究論文,包括 Gemini 1.5 與 Gemma 2 ,引用量分別超過 2500 和 1200 次;2021 年的《Deep Reinforcement Learning at the Edge of the Statistical Precipice》和《Neural Additive Models》也都有較高影響力。
整體來看,他的學(xué)術(shù)引用總數(shù)已超過 1 萬次,h-index 為 34,i10-index 為 41。研究領(lǐng)域也覆蓋得很全面——多模態(tài)理解、開放語言模型、可解釋性神經(jīng)網(wǎng)絡(luò),還有離線強化學(xué)習(xí),基本上把當(dāng)下最熱門的幾個方向都摸了個遍。
工作經(jīng)歷方面,他目前在麥吉爾大學(xué)擔(dān)任兼職教授,自 2024 年 9 月起任職至今,在加入 Meta 之前,他在 2023 年至 2025 年期間任職于 Google DeepMind,擔(dān)任研究科學(xué)家,研究內(nèi)容聚焦于強化學(xué)習(xí)、自我改進(jìn)與大語言模型的蒸餾。
此外,他在 Google Brain 工作了 5 年,擔(dān)任高級研究科學(xué)家,從事深度強化學(xué)習(xí)研究,并在 NeurIPS 2021 上獲得過最佳論文獎,再往前,他在 2018 年初曾在 Waymo 實習(xí)。
對于 Rishabh 來說,離職宣言里的那句「去承擔(dān)一種不同類型的風(fēng)險」,或許是真心話。
憑借在 Google、Meta 等公司手里攢下的履歷和影響力,已經(jīng)足夠支撐他轉(zhuǎn)身去追求更自由的研究或者更大的舞臺。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.