智東西
作者 王涵
編輯 漠影
智東西8月28日報道,最近網(wǎng)上有一個詞特別火,叫“邪修”。
通俗來講就是“不走尋常路”,跳出傳統(tǒng)方法或步驟,卻能簡單高效地達成目的。
那科研能不能“邪修”呢?
前幾天,一個還在讀材料研究生的朋友跟我聊天,提到他們實驗室里的新生都在“邪修做實驗”。
具體說來就是,用AI幫忙總結(jié)文獻,把實驗結(jié)果輸給AI讓其幫忙做數(shù)據(jù)分析,還能讓AI根據(jù)分析結(jié)果生成下一步實驗改進方法,得到的結(jié)果又快又好。
現(xiàn)在帶動他們整個實驗室都在用AI,當然老師也知道這個情況,但基本屬于默許狀態(tài),還曾感嘆真是生錯了時代。
究竟是什么AI這么好用?他給我甩來一個鏈接,還說你試試就知道了。我點開一看,這是一個科學(xué)多模態(tài)大模型,叫做『書生』Intern-S1。
為了驗證它的能力,我特意翻出了此前所做實驗的相關(guān)圖表,拍照發(fā)給Intern-S1,并問它:這副材料表征圖可以顯示出鈣鈦礦LED薄膜的哪一特性?右圖和左圖在這一特性上有什么不同?
Intern-S1在很短的時間內(nèi)就判斷出該幅圖片是原子力顯微鏡(AFM)的三維形貌圖,并且對該圖進行了詳細的解讀,列出了對比表格。此外,Intern-S1還生成了對該實驗品的未來改進方向,可以給科研人員拓寬實驗改進思路。
值得一提的是,在精準識別化學(xué)分子結(jié)構(gòu)并進一步給出科研建議方面,Intern-S1表現(xiàn)比Grok還出色。
我給了Intern-S1一張圖,并提問:這個分子式含有Cs、Pb和Br三種元素,根據(jù)此分子結(jié)構(gòu)圖,寫出該化學(xué)物質(zhì)的分子式,并介紹其有什么樣的化學(xué)性質(zhì),目前有哪方面的應(yīng)用?
作為對比,我也讓Grok回答了一下這個問題:
可以看到,Grok只是中規(guī)中矩地回答問題,并沒有做更多的延展,但Intern-S1還特別生成該化合物研究領(lǐng)域目前所遇到的挑戰(zhàn),以及未來改進方向,站在了一個科研人的角度思考問題,預(yù)判了我的下一步動作。
除了科研外,我也順帶看了一下它在藝術(shù)領(lǐng)域的表現(xiàn)。我把梵高的畫作《星空》發(fā)給Intern-S1,讓它從科學(xué)的邏輯和知識體系進行理性賞析:
當然也還可以這么用,比如給理工直男解釋防曬霜和隔離液、粉底液的區(qū)別:
再比如,我還能讓Intern-S1給我看食品配料表,判斷其是否適合減脂期食用:
對于我的提問,Intern-S1在分鐘內(nèi)就給出了準確答案,相對于教科書和學(xué)術(shù)論文語言的晦澀,Intern-S1的回答簡潔明了、通俗易懂,并且在其他模型還在專注于如何精準地回答問題時,Intern-S1已經(jīng)可以用科研人的思維進一步思考了,在科學(xué)專業(yè)知識這方面,確實能打。
Intern-S1的輕量化版本Intern-S1-mini也在前幾天問世了,mini版本只有8B參數(shù)但同樣兼具通用能力與專業(yè)科學(xué)能力,且更加適合快速部署和二次開發(fā)。
目前,Intern-S1和Intern-S1-mini都已經(jīng)開源,Hugging Face上顯示Intern-S1的下載量有5萬多,Intern-S1-mini的下載量也有1000多,非常受歡迎,感興趣的可以去試一試:
體驗頁面:
https://chat.intern-ai.org.cn/
GitHub:
https://github.com/InternLM/Intern-S1
HuggingFace:
https://huggingface.co/internlm
ModelScope:
https://modelscope.cn/models/Shanghai_AI_Laboratory
當然,科學(xué)大模型不算是一個新鮮事物。在近幾年,同類型的、專注于科學(xué)的大模型也層出不窮。上海AI實驗室的這一成果為什么能實現(xiàn)這樣的差異化?
帶著這樣的疑問,我深扒了Intern-S1背后的技術(shù)路線和應(yīng)用成果,并與上海AI實驗室的青年領(lǐng)軍科學(xué)家陳愷進行了一場深度訪談,最終我得到了答案。
一、AlphaFold破解50年蛋白質(zhì)難題,AI+Science進入快車道
要講科學(xué)大模型,最繞不開的就是AI for Science這個話題,這就不得不提到2024年的諾貝爾化學(xué)獎。
2024年,諾貝爾化學(xué)獎公布將其一半頒給計算蛋白質(zhì)設(shè)計方面的研究者David Baker,另一半則授予了共同開發(fā)了AlphaFold的谷歌DeepMind CEO德米斯·哈薩比斯(Demis Hassabis)和John Jumper。
AlphaFold,特別是其在2020年發(fā)布的AlphaFold2版本,利用深度學(xué)習(xí)和人工智能技術(shù),以前所未有的準確性和速度預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)。這使得原本需要數(shù)月甚至數(shù)年才能完成的蛋白質(zhì)結(jié)構(gòu)解析工作,現(xiàn)在可以在幾小時甚至幾分鐘內(nèi)完成,并且準確度可以媲美甚至在某些情況下超越傳統(tǒng)方法。
AI可以通過分析數(shù)百萬個已知的蛋白質(zhì)結(jié)構(gòu)和序列數(shù)據(jù)庫進行訓(xùn)練,從而能夠從僅有的氨基酸序列推斷出蛋白質(zhì)的折疊方式。
其實在此之前,AI for Science就已經(jīng)引起學(xué)術(shù)和行業(yè)的關(guān)注。2019-2023年間,全球AI for Science論文發(fā)表年均增長率為27.2%,各學(xué)科領(lǐng)域論文發(fā)表均呈現(xiàn)逐年遞增趨勢,其中生命科學(xué)、物理學(xué)和化學(xué)等領(lǐng)域發(fā)表的人工智能應(yīng)用論文數(shù)量最多。
中美兩國是當前AI for Science研究大國,近5年間,中國論文發(fā)表超過10萬篇,居全球第一。
但24年諾貝爾化學(xué)獎的公布,再次證明了人工智能技術(shù)在推動科學(xué)進步方面所扮演的關(guān)鍵角色,尤其是通過像AlphaFold這樣的突破性應(yīng)用,不僅加快了科學(xué)研究的步伐,還拓寬了我們對生命科學(xué)、物理學(xué)和化學(xué)等領(lǐng)域內(nèi)復(fù)雜問題的理解。
隨著全球范圍內(nèi)AI for Science的熱度持續(xù)升溫,越來越多的研究者和機構(gòu)開始探索如何利用人工智能來解決更多基礎(chǔ)科學(xué)難題。
在這一背景下,『書生』科學(xué)多模態(tài)大模型Intern-S1應(yīng)運而生。
值得關(guān)注的是,在開源策略層面,上海AI實驗室比谷歌DeepMind更“豪爽”。
Intern-S1發(fā)布即開源。除了基礎(chǔ)模型外,上海AI實驗室還一口氣開源了大模型研發(fā)與應(yīng)用所需的全鏈路工具體系,并已構(gòu)建擁有數(shù)十萬活躍開發(fā)者的開源社區(qū)。
谷歌DeepMind AlphaFold3從發(fā)布到開放相隔長達半年,且僅為部分開放:模型權(quán)重需申請獲取,商業(yè)用途受限。
二、主打多模態(tài)和通專融合,化學(xué)、材料、地球科學(xué)全面超越Grok-4
相較于同類科學(xué)大模型,Intern-S1有2個突出的特別之處,那就是多模態(tài)和“通專融合”。
據(jù)了解,在綜合多模態(tài)通用能力評估中,Intern-S1的得分和國內(nèi)外一流模型不相上下,能同時較好地理解文本和圖像內(nèi)容。該評估為多項通用任務(wù)評測基準均分,這樣的結(jié)果說明它在不同場景任務(wù)中,既有穩(wěn)定的表現(xiàn),也能適應(yīng)復(fù)雜情況。
而在由多個領(lǐng)域?qū)I(yè)評測集組成的科學(xué)能力測試里,Intern-S1的表現(xiàn)超過了Grok 4等最新的閉源模型。這些評測涉及物理、化學(xué)、材料、生物等領(lǐng)域的復(fù)雜專業(yè)任務(wù),進一步證實了Intern-S1在科研場景中具備較強的邏輯性和準確性。
Intern-S1是怎么在多模態(tài)領(lǐng)域答出這樣的高分答卷的?
陳愷告訴智東西,原來,Intern-S1新增了動態(tài)Tokenizer和時序信號編碼器,實現(xiàn)了支持多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù)處理的功能,所以才能夠?qū)崿F(xiàn)材料科學(xué)與生物制藥、天文巡天、天體碰撞、地震臺網(wǎng)記錄的地震波形等多類科學(xué)模態(tài)進行深度融合。
此外,Intern-S1通過架構(gòu)上的創(chuàng)新,對科學(xué)模態(tài)數(shù)據(jù)的理解和處理效率有了明顯提高。比如,它對化學(xué)分子式的壓縮率比DeepSeek-R1要高出70%以上。在一系列基于科學(xué)模態(tài)的專業(yè)任務(wù)中,Intern-S1不僅用的算力更少,表現(xiàn)也更出色。
之前市場中的科學(xué)大模型,或者說專業(yè)領(lǐng)域的行業(yè)大模型,通常都會強調(diào)自己過硬的專業(yè)能力,而在Intern-S1發(fā)布會上,“通專融合”這個詞出現(xiàn)頻率很高。
當被問到上海AI實驗室專注走“通專融合”技術(shù)路線的原因時,陳愷解釋稱:“通專融合的技術(shù)路線,能讓模型在通用能力保持的同時做到專業(yè)能力精進,把垂類能力構(gòu)建成本大幅降低。”
智東西了解到,一方面,Intern-S1會借助大量通用科學(xué)數(shù)據(jù)來拓寬自身的知識范圍;另一方面,它還會訓(xùn)練多個專業(yè)模型,生成那些容易理解、邏輯清晰的科學(xué)數(shù)據(jù),并且通過為特定領(lǐng)域定制的專業(yè)驗證智能體來把控這些數(shù)據(jù)的質(zhì)量。
這種閉環(huán)的運作方式不斷為其基座模型提供支持,讓Intern-S1既能擁有強大的通用推理能力,又具備多項專業(yè)能力,從而實現(xiàn)了“一個模型就能解決多項專業(yè)任務(wù)”這一科學(xué)智能領(lǐng)域的突破。
跳出技術(shù)角度,陳愷特別補充,科學(xué)領(lǐng)域的前沿突破,往往需要不同專業(yè)能力的交叉融合遷移,通專融合能更好促進未來科學(xué)發(fā)現(xiàn)。
陳愷還介紹,Intern-S1的研發(fā)團隊在訓(xùn)練系統(tǒng)和算法兩方面一起下功夫搞創(chuàng)新,成功讓大型多模態(tài)MoE(混合專家)模型在FP8精度下,能高效又穩(wěn)定地進行強化學(xué)習(xí)訓(xùn)練,而且訓(xùn)練成本比最近公開的其他MoE模型低了10倍。
從系統(tǒng)層面來看,Intern-S1用了訓(xùn)推分離的RL方案,靠自己研發(fā)的推理引擎來進行FP8精度的大規(guī)模異步推理,效率很高;還通過數(shù)據(jù)并行均衡策略,減輕了長思維鏈解碼時出現(xiàn)的長尾問題。訓(xùn)練的時候用了分塊式FP8訓(xùn)練,效率提升不少,這套訓(xùn)練系統(tǒng)之后也會開源。
再看算法方面,基于Intern·Bootcamp搭建的大規(guī)模多任務(wù)交互環(huán)境,研發(fā)團隊提出了“Mixture of Rewards”混合獎勵學(xué)習(xí)算法,能把多種獎勵和反饋信號融合到一起,聽起來有點像“因材施教”。
比如在容易驗證的任務(wù)上,就用RLVR模式來訓(xùn)練,通過規(guī)則、驗證器或者交互環(huán)境來提供獎勵信號;而像對話、寫作這類不好驗證的任務(wù),就用獎勵模型給出的獎勵信號來一起訓(xùn)練。
三、能查科研數(shù)據(jù),還能聯(lián)機實驗設(shè)備,科學(xué)發(fā)現(xiàn)平臺同步推出
在落地應(yīng)用上,智東西發(fā)現(xiàn),以Intern-S1為底座的『書生』科學(xué)發(fā)現(xiàn)平臺Intern-Discovery也同步推出了。
Intern-Discovery以Intern-S1為核心,整合了專業(yè)智能體、海量科研數(shù)據(jù)及實驗設(shè)備,可以給全球研究者提供從假設(shè)到驗證的一站式科研支撐,目前平臺已開放全球試用申請。
陳愷向智東西透露,實驗室非常歡迎與各大高校和研究所等機構(gòu)進行深度合作。
根據(jù)公開信息,在Intern-Discovery的基礎(chǔ)上,上海AI實驗室聯(lián)合臨港實驗室、上海交通大學(xué)、復(fù)旦大學(xué)、MIT等研究機構(gòu),共同參與構(gòu)建了多智能體虛擬疾病學(xué)家系統(tǒng)“元生”(OriGene)。
在治療癌癥上,OriGene的作用非常大。目前,其僅用了兩個月就已在肝細胞癌和全球第三大癌癥的結(jié)直腸癌治療上分別提出兩個新靶點GPR160和ARG2,并已在臨床樣本、類器官和人源化動物實驗中得到驗證。
結(jié)語:Intern-S1展現(xiàn)AI賦能科學(xué)新圖景
隨著技術(shù)的持續(xù)迭代,科研人員與AI工具的協(xié)同將進一步深化。通用大模型與專用模型的優(yōu)勢互補,可能在更多科學(xué)領(lǐng)域發(fā)揮作用。
Intern-S1所采用的“通專融合”技術(shù)路徑,為平衡模型的通用性與專業(yè)性提供了一種實踐方案,AI技術(shù)與科學(xué)研究的結(jié)合不斷拓展著科研手段的邊界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.