新智元報道
編輯:Aeneas KingHZ
【新智元導(dǎo)讀】曾被譽為「歐洲OpenAI」的Mistral AI,陷入「抄襲」丑聞!在分手小作文中,前員工爆料核心技術(shù)是蒸餾DeepSeek,卻誤導(dǎo)外界稱為自主RL成果。
Mistal套殼DeepSeek,被當場抓現(xiàn)行了?
幾天前就有人在X上爆料:Mistral的新模型是直接蒸餾自DeepSeek,而且基準測試結(jié)果還被歪曲了。
這個被視為歐洲版OpenAI「全村希望」的公司,地位就如同中國的DeepSeek一般,如今居然塌房了?
這實在是太魔幻了。
更為勁爆的是,這個重磅大瓜還是從一篇Mistral女員工的「分手小作文」里曝出來的。
原話是這樣的——
你早知道Mistral做事不講道德:把DeepSeek蒸餾后當成自己的模型,使用OpenAI的數(shù)據(jù),對外卻誤導(dǎo)稱是RL在發(fā)揮作用,但它實際上只是DS3的產(chǎn)物,還歪曲基準測試結(jié)果。
你不僅明知這些,還積極參與其中。當我指出這些問題時,你沒有承擔任何責任,反而選擇無視我、對我冷處理。
情感糾紛小作文
曝出套殼大瓜
也就是說,這位Mistral離職的女員工,不僅在小作文中曝光了自己和前男友、Mistral同事的感情糾葛,還爆出Mistral套殼DeepSeek的丑聞。
這個消息一曝光,立馬在全網(wǎng)引起了軒然大波。
DeepMind研究員Susan Zhang轉(zhuǎn)發(fā)并評論,直接點名Mistral AI的不道德行為。
在「小作文」里,這位Mistral前員工痛訴自己如何接連遭遇上司排擠、伴侶出軌、求職無望,還要靠抗抑郁藥物試圖讓情感生活重回正軌。
關(guān)鍵節(jié)點在2025年4月初, Mistral把她解雇了,原因在于工作分歧:
她明確反對通過蒸餾DeepSeek來誤導(dǎo)用戶。
這加劇了她對Mistral高層的不滿——而她的伴侶又和高層關(guān)系密切。
在職業(yè)前途未卜、經(jīng)濟壓力加劇、感情關(guān)系又充滿不確定的三重打擊下,她開始崩潰。
這讓DeepMind研究科學(xué)家Andreas Kirsch非常同情。
Mistral的「秘方」竟是DeepSeek,這一事實讓人無語。
火眼金睛博主
早發(fā)現(xiàn)Mistral蒸餾DeepSeek
其實早在今年6月,就有一位火眼金睛的AI行內(nèi)人發(fā)現(xiàn),Mistral Small 3.2寫的東西,它怎么這么像DeepSeek呢!
這位名為Sam Paech的行內(nèi)人,同時還是EQ-Bench基準的維護者,可謂十分有眼光。
為了比較Mistral-small-3.2和DeepSeek-v3之間的相似性,這位博主在模型的創(chuàng)意寫作輸出中,提取了跟人類基線相比最過度呈現(xiàn)的單詞和n-gram詞組。
通過對這些詞/n-gram中的前幾百個數(shù)據(jù)特征進行層次聚類,生成了一張如下的相似性圖。
肉眼可見,Mistral-small-3.2和DeepSeek-v3在譜系圖中的位置非常接近,從而表明它們的特征是極其相似的。
這個過程中,他使用了一個生物信息學(xué)工具,基于slop特征譜的相似性,推斷出了譜系樹。
Susan Zhang對此直接表示,Mistral這身皮被扒下來,原來是DeepSeek??!
甚至還有人發(fā)現(xiàn),連Gemini Pro 2.5都和DeepSeek-R1之間有非常相似的感覺。
比如DeepSeek-R1非常擅長在對話中保持角色的一致性,而Gemini Pro 2.5也是如此,簡直驚人的相似。
蒸餾不是錯
HuggingFace聯(lián)合創(chuàng)始人兼首席執(zhí)行官表示,蒸餾開源模型有錯嗎?
畢竟,開源的意義之一就是讓大家「自由使用」源代碼,所以DeepSeek并不會禁止蒸餾。
而且蒸餾大模型也不簡單,DeepSeek蒸餾自己的R1模型就不太成功。Paech本人也表示,其實蒸餾也不算什么大錯,現(xiàn)在很多模型都是這么干的。
技術(shù)上,蒸餾是通過讓小模型模仿大模型的輸出結(jié)果來實現(xiàn)的。
大模型會把自己的「經(jīng)驗」(比如語言模式、寫作風格)以一種簡單的方式傳給小模型。小模型通過大量練習(xí),逐漸學(xué)會了類似的表現(xiàn),但用更少的計算資源。
這種方法在AI領(lǐng)域很流行,因為這項技術(shù)很實用,比如能讓大模型跑在手機或其他低性能設(shè)備上。
蒸餾本身不是錯,編造謊言才是問題的實質(zhì)!
說到頭來,Mistral的問題不在于蒸餾DeepSeek,而在于把模型的進步歸功于自家的RL方法,甚至蓄意改變基準測試。
沒有清楚標注模型是蒸餾的,缺乏透明度,才是最關(guān)鍵的問題。
Mistral好像不止一次這么干,博士生Regi Kusumaatmadjia就發(fā)現(xiàn)Mistral的OCR功能與Mineru的OCR出奇的相似。
Mistral過去的高光時刻
想當初,Mistral可是深夜發(fā)一條磁力鏈接,就能讓整個開源圈震撼的存在。
在今年2月,才成立一年多的Mistral AI已經(jīng)估值62億美金,成為法國的驕傲,歐洲的驕傲。
歐洲的開發(fā)者們一度歡呼:恭喜Mistral AI,讓歐洲在AI競賽中終于有了一席之地。
Mistral AI的超級應(yīng)用助手Le Chat,還一度登頂法國免費APP的榜首。
馬克龍一直以來也積極支持Mistral,稱其為:「法國人工智能產(chǎn)業(yè)的皇冠上瑰寶」。
2023年,這三位來自谷歌DeepMind、Meta的前員工希望打造一家遵循歐洲模式的AI公司——開源、高效、注重隱私。
隨后,他們就用自己的方式,顛覆了硅谷的傳統(tǒng)。
在當時,當OpenAI斥資超1億美金訓(xùn)練GPT-4時,Mistral僅用2200萬美元就打造出了最具競爭力的AI模型。
甚至馬克龍還信誓旦旦表示,法國未來幾年將投資1090億歐元用于建設(shè)AI,盡最大努力為包括Mistral在內(nèi)的公司創(chuàng)造空間。
在成立僅僅七個月的時間里,Mistral就在兩個主要「權(quán)重級別」上發(fā)布了SOTA開源大語言模型(mistral-7b 和 mixtral)。
Mistral在底層架構(gòu)持續(xù)取得突破(如sparse mixture-of-experts,稀疏專家混合架構(gòu))。
這對一家初創(chuàng)公司而言,成就非凡。
剛剛,他們還推出了Mistral Medium 3.1,表示整體性能提升巨大。
不過,這次推文底下質(zhì)疑聲不斷。
誰都沒想到,當初承載了多少人希望的Mistral,如今竟發(fā)展到了這一步。
參考資料:
https://x.com/ns123abc/status/1955044877110071480
https://x.com/gmmvg/status/1955002717698658719
https://x.com/paulopacitti/status/1955003793927524717
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.