文|鄧詠儀
編輯|蘇建勛
如果說關(guān)于DeepSeek的討論已經(jīng)過于泛濫,開源也許是當(dāng)下依然值得討論的主題。
長期以來,在國內(nèi)談起“開源”,都會無可避免地陷入一種尷尬的語境。
它當(dāng)然是理想主義的。“開源”背后的自由、開放特性,被普遍認為是互聯(lián)網(wǎng)精神的外化——源代碼向公眾開放共享,且允許在遵循特定許可證條款的前提下,對軟件進行自由使用、修改和二次分發(fā)。
最知名的開源項目“Linux”是操作系統(tǒng)的內(nèi)核,催生了數(shù)以千萬計的開源軟件,這是互聯(lián)網(wǎng)世界的根基。
但它的背后經(jīng)常跟著一個問題:為什么要開源?怎么考慮開源之后的商業(yè)化?哪怕到DeepSeek爆火的現(xiàn)在,也很難有人給出完美的答案。
開源中國董事長馬越,是最有立場談國內(nèi)開源歷史的人之一,他在這條路上走了18年。
2008年,馬越從硅谷回國創(chuàng)業(yè),先是成立了“恒拓開源”——用開源軟件幫助企業(yè)擺脫數(shù)據(jù)庫、ERP等大型軟件的束縛。
但很快他就發(fā)現(xiàn),這種方案很難擺脫To B項目制的重投入,還很容易做成外包公司。
隨后,馬越選擇收購“開源中國”這個社區(qū),開始了一段曲折的創(chuàng)業(yè)路——“開源中國”經(jīng)歷過數(shù)度轉(zhuǎn)型,從開源社區(qū),拓展到代碼托管、代碼工具鏈,在探索商業(yè)化期間,經(jīng)歷了從母公司剝離獨立發(fā)展,2019年被百度戰(zhàn)略控股,最后,又在中美競爭、國產(chǎn)替代浪潮中決定重新獨立發(fā)展,謀求上市。
做開源社區(qū)需要大量的資源、資金投入,在開源中國最艱難的時候,馬越背負的個人債務(wù)最高達1.8億元。
1972年出生的馬越,有著一種老大哥式的坦率。他絕沒有賣苦的意思,但你很容易從他的敘述中,體會到經(jīng)歷這些坎坷過后的幽默——他表示,在中國做To B就是“城市包圍農(nóng)村”,企業(yè)軟件就是管理者智慧的固化。當(dāng)中國的企業(yè)發(fā)展階段還在初期,“你很難要求大家還沒吃飽喝足的情況下,去做開源。”
但這些時刻都已經(jīng)過去了。開源中國也已經(jīng)摸索出一條更適合自己的、中國式的開源道路。
現(xiàn)在,開源中國已經(jīng)成為全球第二大的代碼托管平臺,匯聚了超過1800萬開發(fā)者。其自主研發(fā)的DevOps工具鏈已在金融、軍工等關(guān)鍵領(lǐng)域,達到80%的市場滲透率。2024年,開源中國的營收已超過2億元。
《智能涌現(xiàn)》獲悉,「開源中國」近期正式完成數(shù)億元C輪融資,由北京信息產(chǎn)業(yè)發(fā)展投資基金(北京信產(chǎn)基金)領(lǐng)投,深報一本股權(quán)投資基金(深報一本)及北京上河動量私募股權(quán)基金(上河動量)跟投。
至此,開源中國已累計獲得超16億元戰(zhàn)略投資。
△開源中國董事長馬越 圖源:開源中國
馬越認為,哪怕在全球范圍內(nèi),開源也不是件容易的事情。他以GitHub舉例:從2008年成立開始直到被微軟收購,在2022年ChatGPT爆發(fā)后推出Copilot,才算是正式證明了商業(yè)化潛力。
“開源是強者和富人的游戲?!彼f,上一代人都成長在物質(zhì)更短缺的年代——商業(yè)社會也是如此,企業(yè)要先賺夠了錢,才有余??紤]是否開源,做一些人人為我、我為人人的好事?!俺燥柫孙?,才能有力氣談開源。”
這就不難理解,即使DeepSeek的爆火為全中國都打了一記強心針,馬越的觀點依然是冷靜的。他認為,DeepSeek很難根本性改變國內(nèi)軟件生態(tài)的問題,這是一個時代的局限。
而想要在開源路線上有所成就,這要求新一代的開發(fā)者,從Day 1就開始出海,像DeepSeek一樣去全球市場中競爭。
如果說DeepSeek改變了什么,更多的都是文化和價值觀層面的事情?!笆昵按蠹移毡椴焕斫忾_源,覺得開源是一群草根做的事,現(xiàn)在全社會都能認識到,開源等于創(chuàng)新?!瘪R越說。
以下為《智能涌現(xiàn)》與開源中國董事長馬越的對話,經(jīng)編輯:
DeepSeek不是國運級產(chǎn)品,年輕人才是
《智能涌現(xiàn)》:開源中國現(xiàn)在是第二大代碼托管平臺,國內(nèi)最大的開源社區(qū)。DeepSeek的熱潮,對你們的直觀影響,是從什么時候開始的?
馬越:就是他在App Store登頂那會兒。先是V3,然后是R1發(fā)布,一下子就火起來了。我們春節(jié)一直在加班,讓DeepSeek首先能在中國生產(chǎn)的GPU上運行,這需要大量工作,我們是第一個在沐曦芯片上部署的。
我們都在調(diào)侃,春節(jié)就兩件事:DeepSeek、哪吒。DeepSeek就是開源圈出了個哪吒。
《智能涌現(xiàn)》:現(xiàn)在已經(jīng)形成了一種論調(diào):DeepSeek是一個國運級的產(chǎn)品。但最近你的公開表達里,似乎對這一點不太認同。
馬越:首先,大模型這個事情,你離不開英偉達吧?其次,你離不開Transformer架構(gòu);第三,你采用了蒸餾的思路,這些都不是國內(nèi)原創(chuàng)的。
DeepSeek本質(zhì)上是在現(xiàn)有路線上走得最好,實現(xiàn)了彎道超車,這是值得尊敬的。
但是DeepSeek能夠不依靠外部資金支持,也不做任何PR,靠技術(shù)就能做到全球頂尖——以梁文鋒為代表的年輕人崛起,這才是國運級的現(xiàn)象。
《智能涌現(xiàn)》:那什么才算國運級的產(chǎn)品?
馬越:完全原創(chuàng)的技術(shù)創(chuàng)新。誰說Transformer就是算法的終局?如果有人用非Transformer方案做出比DeepSeek強十倍的成果,那才是真正的突破,那是人類級的進步。
《智能涌現(xiàn)》:DeepSeek給開源生態(tài)最大的啟示會是什么?
馬越:讓全社會認識到:開源等于創(chuàng)新。
DeepSeek最令人唏噓的是,在國內(nèi)兩年都默默無聞,也不如打廣告的很多大模型公司,直到2024年開始,才因為技術(shù),因為開源,被美國人超級關(guān)注——雖然一部分人特別支持,一部分人極力貶低,這種關(guān)注反而倒逼著國內(nèi)形成了一種愛國情懷。
《智能涌現(xiàn)》:以前大家不相信這個觀點嗎?
馬越:以前很多人認為開源就是一幫草根、烏合之眾,很難和大廠這種正規(guī)軍相比。
其實二十年前我就在說這些話:開源約等于創(chuàng)新能力,創(chuàng)新能力和國力是映射關(guān)系。正是因為我們有錢了、富足了,才會有DeepSeek這樣的企業(yè)出現(xiàn)。
以前沒人聽,現(xiàn)在有人聽了。
第二點很重要,就是要對年輕人保持敬畏。不只是尊重,而是要怕年輕人,信任年輕人。每一代人都有自己的時代使命,也有時代局限性。
《智能涌現(xiàn)》:這群年輕人,或者新一代開源貢獻者,為什么能成長起來?
馬越:這種質(zhì)變是建立在之前充分的量變基礎(chǔ)上的。
這十年要感謝走在前面的互聯(lián)網(wǎng)大廠,事實上國內(nèi)的主要開源力量集中在這些有實力的企業(yè)上。包括百度、阿里、騰訊等組織的開源項目,還有華為的鴻蒙、歐拉等等。他們都是領(lǐng)著工資的員工,在搞這些開源工作,不是純粹基于興趣。
《智能涌現(xiàn)》:DeepSeek證明一件最關(guān)鍵的事:通過底層技術(shù)突破,就能吸引大量用戶,以及贏得尊重。
馬越:現(xiàn)在我們國家最應(yīng)該做兩件事:一是牽頭一起開發(fā)中國的CUDA;二是讓所有國產(chǎn)GPU都能快速支持這些模型。
說到生態(tài),生態(tài)就是要有更多的人參與,而且大家都有高度共識?,F(xiàn)在最大的問題不是芯片卡脖子,而是CUDA這個生態(tài)的制約。中國完全可以開發(fā)一套類似CUDA的系統(tǒng),就像我們有自己的GPU一樣。
開源是富人和強者的游戲
《智能涌現(xiàn)》:DeepSeek爆火之后,找你討論的人多嗎?大家最關(guān)心什么話題?
馬越:有人問我,DeepSeek會不會給中國To B市場帶來新生機?不可能那么快。
IT外包的人天價格,20年來的漲幅還不如按摩師。現(xiàn)在外包人天均價一千就算高的了,還有五六百的。你去按摩,現(xiàn)在一小時都要一兩百塊錢。十年前,IT的外包時薪就比不上按摩了,現(xiàn)在差距更大,那是因為按摩價格漲得快。
中國軟件沒人愿意花錢,這是行業(yè)發(fā)展還不行的核心原因。要等這一代年輕人變成決策者,好時代才會來。
《智能涌現(xiàn)》:本質(zhì)還是因為國內(nèi)企業(yè)發(fā)展階段還比較早。
馬越:開源本質(zhì)上是強者和富人的游戲。正是因為我們吃飽喝足了,才會有DeepSeek這樣的企業(yè)出現(xiàn)。上一代互聯(lián)網(wǎng)用戶普遍不愿意為軟件和知識付費,騰訊會議掉線了就重連,也不愿意買會員。
但這一代年輕人生活富足,你們會改變這個局面。
《智能涌現(xiàn)》:DeepSeek會給上一代To B創(chuàng)業(yè)者帶來什么啟示嗎?
馬越:我覺得他們給創(chuàng)業(yè)者帶來兩個重要的啟示。第一是要對錢保持敬畏。創(chuàng)業(yè)的目的就是為了掙錢,談理想和情懷沒意義。
DeepSeek不太需要考慮商業(yè)化的問題,是因為幻方已經(jīng)解決了這個事情。
上一代的軟件創(chuàng)業(yè)者有個致命問題,一心想著燒錢,通過標準化產(chǎn)品打市場,這不是中國市場的運行邏輯,中國最有錢的金主都是大型企業(yè),在中國想要賺錢,不做定制化是不現(xiàn)實的。
中國軟件行業(yè)是城市包圍農(nóng)村,而美國是農(nóng)村包圍城市,腰部企業(yè)數(shù)量很多。
《智能涌現(xiàn)》:DeepSeek會改變大家對商業(yè)化的看法嗎?開源怎么考慮商業(yè)化,是這個領(lǐng)域的“天問”。
馬越:如果要開源做創(chuàng)業(yè)項目,技術(shù)必須得硬邦邦。就是和DeepSeek一樣,Day 1就出海,否則在中國太難賺錢了,時代還不夠成熟。
大家總是會舉例,比如紅帽那套模式也能商業(yè)化,但是想用這種方式在中國做一個上市公司,還不是這個時代的事。
《智能涌現(xiàn)》:你們自己也經(jīng)歷了很長一段商業(yè)化探索的時期,是從什么時候想明白要怎么做的?
馬越:2020年是個重要轉(zhuǎn)折點。我們那年決定從百度獨立出來,重新謀求IPO。那段時間因為美國開始在很多尖端技術(shù)上斷供,我們想抓住這個機會,真正成為一個獨立的開源平臺。
想要做真正的本土開源平臺,必須要是徹底中立的第三方,這是選擇重新獨立發(fā)展的核心原因。
《智能涌現(xiàn)》:想明白之后,都做了什么?
馬越:我們現(xiàn)在從社區(qū)發(fā)展出了三大產(chǎn)品線。
開源中國社區(qū)(OSChina)現(xiàn)在已經(jīng)完全進化成一個AI教育平臺。我們是中國最大的開源社區(qū),有1000多萬用戶。現(xiàn)在我們24人的團隊能創(chuàng)造約5000萬收入,還有凈利潤,這在社區(qū)團隊中很少見。
第二塊是代碼托管和研發(fā)效能平臺Gitee,現(xiàn)在平臺有3600萬個代碼倉庫,服務(wù)36萬家企業(yè)。主要提供代碼托管私有化倉庫服務(wù),確保很多中小團隊的代碼安全,客單每年3000塊左右。
從2020年到現(xiàn)在,我們已經(jīng)能夠提供DevOps 全生命周期國產(chǎn)替代方案,在滿足開發(fā)者需求的同時,也建立起一個自主創(chuàng)新、安全可信的本土開源軟件工具與生態(tài)。
第三塊是AI大模型平臺“模力方舟”,模型體驗、推理訓(xùn)練到應(yīng)用部署等等服務(wù),都會提供。
《智能涌現(xiàn)》:為什么會從社區(qū)拓展到后來的DevOps,以及AI大模型基座?
馬越:一個開源公司想要成功,靠社區(qū)是不夠的,我們需要找一個閉環(huán)的商業(yè)模式,像GitHub那條路——社區(qū)、代碼托管是沒法達到這個目標的。GitHub也是在大模型浪潮來了之后,推出Copilot,才把營收做起來。
以后沒有凈利潤的公司很難在國內(nèi)上市,所以我一直強調(diào)看毛利率和人效,這兩個指標高了,自然會有凈利潤。
《智能涌現(xiàn)》:你們現(xiàn)在的主要收入,來自哪里?
馬越:我們主要收入來自100家左右的銀行、券商、軍工、制造業(yè)客戶,都走大型私有部署形式。中小客戶主要靠SaaS服務(wù)。
2024年我們?nèi)珖唵纬^2億,是一個突破。前年過1億,2024年翻了一倍,還實現(xiàn)了盈虧平衡,這很不容易。
《智能涌現(xiàn)》:主要模式靠服務(wù)大型企業(yè)的話,怎么避免走到項目制的老路?
馬越:我們的產(chǎn)品做得很復(fù)雜,是因為中國的大型企業(yè)的場景復(fù)雜。我們的流程引擎、角色引擎、交互界面、流水線都是可定制的,還能做各種插件,就是為了保證靈活性。
我們會幫客戶做定制化配置,但是不做二次開發(fā)。我們現(xiàn)在330多人,這塊業(yè)務(wù)占200多人,但定制化去做開發(fā)和交付的不到10%。
第二是我們自己堅決不賣算力,只做第三方,比如給云廠商導(dǎo)流。
我們現(xiàn)在的路線很清晰:前端社區(qū)承載大流量,做開發(fā)者工具賣給企業(yè),先To C,再To B,也算是一種產(chǎn)品驅(qū)動增長(Product-Driven Growth)的模式。
一起發(fā)展,比單打獨斗強
《智能涌現(xiàn)》:是否選擇開源,企業(yè)的考量到底是什么?
馬越:現(xiàn)在大模型不開源很難。蘋果為什么到今天iOS都不開源?因為硬件生態(tài)已經(jīng)形成壟斷。如果沒有類似這樣的護城河,你不開源,憑什么在市場立足?
就像我十幾年來一直說的,開源是創(chuàng)新的最佳方法論,也是市場競爭的方法論,是反強權(quán)的方法論。你做得好,我們就開源來和你競爭。當(dāng)年有Unix和Windows,就有Linux;有iOS,后來就有Android,都一樣。
《智能涌現(xiàn)》:你做過很多并購,DeepSeek的成功會改變投資人對開源項目的看法嗎?開源項目的出路會變得寬嗎?
馬越:這也是我想問所有投資人和創(chuàng)業(yè)者的問題:投資的目的是啥?到底你希望怎么賺錢?
上市、被收購、分紅都是一種退出方式。但現(xiàn)在在國內(nèi),要么IPO,要么死掉,這很殘酷。
中國的開源生態(tài)很分散,現(xiàn)在很多創(chuàng)業(yè)者缺乏一種共識,就是一起發(fā)展比單打獨斗強。很多人把創(chuàng)業(yè)當(dāng)作獲取情緒價值的方式,就想當(dāng)老大,寧可公司死也不愿意賣給別人。覺得賣了就是投降,這坎兒過不去。
如果放不下自己的ego,最終就會害了自己,也害了客戶和投資人。
《智能涌現(xiàn)》:DeepSeek大獲成功之后,你怎么評估現(xiàn)在我們所處的AI發(fā)展階段?
馬越:如果類比互聯(lián)網(wǎng)那個時代,我們還是在大時代的開端狀態(tài),類似當(dāng)年的撥號上網(wǎng)階段。我從1997年開始上網(wǎng),下載一張照片要四五天,網(wǎng)速只有28K。但即便如此,我們也覺得很神奇。
現(xiàn)在就像出海探索新大陸,所以創(chuàng)業(yè)者只要帶著干糧上了船,不淹死,就一定有收獲。
《智能涌現(xiàn)》:DeepSeek會怎么改變現(xiàn)在國內(nèi)的創(chuàng)業(yè)格局?你覺得更利好大廠還是創(chuàng)業(yè)公司?
馬越:很難說,可能還是大廠比較有優(yōu)勢。
首先,DeepSeek不是一個創(chuàng)業(yè)公司,人家不用外部資金就能買一萬張卡,某種程度上也算個小大廠了。
我覺得DeepSeek給創(chuàng)業(yè)者帶來兩個重要的啟示。第一是要對錢保持敬畏。創(chuàng)業(yè)的目的就是為了掙錢,談理想和情懷沒意義。
初創(chuàng)公司除非在算法、技術(shù)底層有突破,否則在工程層面,很難跟大廠拼數(shù)據(jù),拼流量,這是最終商業(yè)化的兩個要素。
《智能涌現(xiàn)》:現(xiàn)在的大模型初創(chuàng)的轉(zhuǎn)向都很明顯,方向聚焦,專心做底層技術(shù)。
馬越:這就是開源的可怕之處。
我前年就說,預(yù)訓(xùn)練是大廠的游戲,創(chuàng)業(yè)公司應(yīng)該做垂直領(lǐng)域的訓(xùn)練,把更多精力放在推理上,燒錢的事情本來就不該做。
歷史上都有很多例子,當(dāng)年開源領(lǐng)域有很多做容器的公司,比如Docker剛出來時只是各種容器運行時技術(shù)中的一種。結(jié)果K8s生態(tài)起來之后,任何容器技術(shù)只要實現(xiàn)K8s兼容性,就可以融入云原生技術(shù)棧,這種強大的生態(tài)整合能力最終使其它技術(shù)方案逐漸邊緣化,相當(dāng)于前邊都白做了。
所以我給大家的建議,包括我們自己的策略,就是產(chǎn)品功能要緊跟隨,但要輕投入,商業(yè)模式要做輕一點。
《智能涌現(xiàn)》:對開源中國來說,未來的目標會是什么?
馬越:開源中國這十幾年,積累了用戶流量護城河,客戶品牌美譽度,現(xiàn)在是通過信創(chuàng)找到了快速增長的收入模式。
我們在這輪融資之后,也會開始尋求進一步上市,希望成為A股人工智能開源第一股。
歡迎交流
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.