智東西
作者 王涵
編輯 漠影
智東西8月28日?qǐng)?bào)道,最近網(wǎng)上有一個(gè)詞特別火,叫“邪修”。
通俗來(lái)講就是“不走尋常路”,跳出傳統(tǒng)方法或步驟,卻能簡(jiǎn)單高效地達(dá)成目的。
那科研能不能“邪修”呢?
前幾天,一個(gè)還在讀材料研究生的朋友跟我聊天,提到他們實(shí)驗(yàn)室里的新生都在“邪修做實(shí)驗(yàn)”。
具體說(shuō)來(lái)就是,用AI幫忙總結(jié)文獻(xiàn),把實(shí)驗(yàn)結(jié)果輸給AI讓其幫忙做數(shù)據(jù)分析,還能讓AI根據(jù)分析結(jié)果生成下一步實(shí)驗(yàn)改進(jìn)方法,得到的結(jié)果又快又好。
現(xiàn)在帶動(dòng)他們整個(gè)實(shí)驗(yàn)室都在用AI,當(dāng)然老師也知道這個(gè)情況,但基本屬于默許狀態(tài),還曾感嘆真是生錯(cuò)了時(shí)代。
究竟是什么AI這么好用?他給我甩來(lái)一個(gè)鏈接,還說(shuō)你試試就知道了。我點(diǎn)開(kāi)一看,這是一個(gè)科學(xué)多模態(tài)大模型,叫做『書生』Intern-S1。
為了驗(yàn)證它的能力,我特意翻出了此前所做實(shí)驗(yàn)的相關(guān)圖表,拍照發(fā)給Intern-S1,并問(wèn)它:這副材料表征圖可以顯示出鈣鈦礦LED薄膜的哪一特性?右圖和左圖在這一特性上有什么不同?
Intern-S1在很短的時(shí)間內(nèi)就判斷出該幅圖片是原子力顯微鏡(AFM)的三維形貌圖,并且對(duì)該圖進(jìn)行了詳細(xì)的解讀,列出了對(duì)比表格。此外,Intern-S1還生成了對(duì)該實(shí)驗(yàn)品的未來(lái)改進(jìn)方向,可以給科研人員拓寬實(shí)驗(yàn)改進(jìn)思路。
值得一提的是,在精準(zhǔn)識(shí)別化學(xué)分子結(jié)構(gòu)并進(jìn)一步給出科研建議方面,Intern-S1表現(xiàn)比Grok還出色。
我給了Intern-S1一張圖,并提問(wèn):這個(gè)分子式含有Cs、Pb和Br三種元素,根據(jù)此分子結(jié)構(gòu)圖,寫出該化學(xué)物質(zhì)的分子式,并介紹其有什么樣的化學(xué)性質(zhì),目前有哪方面的應(yīng)用?
作為對(duì)比,我也讓Grok回答了一下這個(gè)問(wèn)題:
可以看到,Grok只是中規(guī)中矩地回答問(wèn)題,并沒(méi)有做更多的延展,但I(xiàn)ntern-S1還特別生成該化合物研究領(lǐng)域目前所遇到的挑戰(zhàn),以及未來(lái)改進(jìn)方向,站在了一個(gè)科研人的角度思考問(wèn)題,預(yù)判了我的下一步動(dòng)作。
除了科研外,我也順帶看了一下它在藝術(shù)領(lǐng)域的表現(xiàn)。我把梵高的畫作《星空》發(fā)給Intern-S1,讓它從科學(xué)的邏輯和知識(shí)體系進(jìn)行理性賞析:
當(dāng)然也還可以這么用,比如給理工直男解釋防曬霜和隔離液、粉底液的區(qū)別:
再比如,我還能讓Intern-S1給我看食品配料表,判斷其是否適合減脂期食用:
對(duì)于我的提問(wèn),Intern-S1在分鐘內(nèi)就給出了準(zhǔn)確答案,相對(duì)于教科書和學(xué)術(shù)論文語(yǔ)言的晦澀,Intern-S1的回答簡(jiǎn)潔明了、通俗易懂,并且在其他模型還在專注于如何精準(zhǔn)地回答問(wèn)題時(shí),Intern-S1已經(jīng)可以用科研人的思維進(jìn)一步思考了,在科學(xué)專業(yè)知識(shí)這方面,確實(shí)能打。
Intern-S1的輕量化版本Intern-S1-mini也在前幾天問(wèn)世了,mini版本只有8B參數(shù)但同樣兼具通用能力與專業(yè)科學(xué)能力,且更加適合快速部署和二次開(kāi)發(fā)。
目前,Intern-S1和Intern-S1-mini都已經(jīng)開(kāi)源,Hugging Face上顯示Intern-S1的下載量有5萬(wàn)多,Intern-S1-mini的下載量也有1000多,非常受歡迎,感興趣的可以去試一試:
體驗(yàn)頁(yè)面:
https://chat.intern-ai.org.cn/
GitHub:
https://github.com/InternLM/Intern-S1
HuggingFace:
https://huggingface.co/internlm
ModelScope:
https://modelscope.cn/models/Shanghai_AI_Laboratory
當(dāng)然,科學(xué)大模型不算是一個(gè)新鮮事物。在近幾年,同類型的、專注于科學(xué)的大模型也層出不窮。上海AI實(shí)驗(yàn)室的這一成果為什么能實(shí)現(xiàn)這樣的差異化?
帶著這樣的疑問(wèn),我深扒了Intern-S1背后的技術(shù)路線和應(yīng)用成果,并與上海AI實(shí)驗(yàn)室的青年領(lǐng)軍科學(xué)家陳愷進(jìn)行了一場(chǎng)深度訪談,最終我得到了答案。
一、AlphaFold破解50年蛋白質(zhì)難題,AI+Science進(jìn)入快車道
要講科學(xué)大模型,最繞不開(kāi)的就是AI for Science這個(gè)話題,這就不得不提到2024年的諾貝爾化學(xué)獎(jiǎng)。
2024年,諾貝爾化學(xué)獎(jiǎng)公布將其一半頒給計(jì)算蛋白質(zhì)設(shè)計(jì)方面的研究者David Baker,另一半則授予了共同開(kāi)發(fā)了AlphaFold的谷歌DeepMind CEO德米斯·哈薩比斯(Demis Hassabis)和John Jumper。
AlphaFold,特別是其在2020年發(fā)布的AlphaFold2版本,利用深度學(xué)習(xí)和人工智能技術(shù),以前所未有的準(zhǔn)確性和速度預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)。這使得原本需要數(shù)月甚至數(shù)年才能完成的蛋白質(zhì)結(jié)構(gòu)解析工作,現(xiàn)在可以在幾小時(shí)甚至幾分鐘內(nèi)完成,并且準(zhǔn)確度可以媲美甚至在某些情況下超越傳統(tǒng)方法。
AI可以通過(guò)分析數(shù)百萬(wàn)個(gè)已知的蛋白質(zhì)結(jié)構(gòu)和序列數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練,從而能夠從僅有的氨基酸序列推斷出蛋白質(zhì)的折疊方式。
其實(shí)在此之前,AI for Science就已經(jīng)引起學(xué)術(shù)和行業(yè)的關(guān)注。2019-2023年間,全球AI for Science論文發(fā)表年均增長(zhǎng)率為27.2%,各學(xué)科領(lǐng)域論文發(fā)表均呈現(xiàn)逐年遞增趨勢(shì),其中生命科學(xué)、物理學(xué)和化學(xué)等領(lǐng)域發(fā)表的人工智能應(yīng)用論文數(shù)量最多。
中美兩國(guó)是當(dāng)前AI for Science研究大國(guó),近5年間,中國(guó)論文發(fā)表超過(guò)10萬(wàn)篇,居全球第一。
但24年諾貝爾化學(xué)獎(jiǎng)的公布,再次證明了人工智能技術(shù)在推動(dòng)科學(xué)進(jìn)步方面所扮演的關(guān)鍵角色,尤其是通過(guò)像AlphaFold這樣的突破性應(yīng)用,不僅加快了科學(xué)研究的步伐,還拓寬了我們對(duì)生命科學(xué)、物理學(xué)和化學(xué)等領(lǐng)域內(nèi)復(fù)雜問(wèn)題的理解。
隨著全球范圍內(nèi)AI for Science的熱度持續(xù)升溫,越來(lái)越多的研究者和機(jī)構(gòu)開(kāi)始探索如何利用人工智能來(lái)解決更多基礎(chǔ)科學(xué)難題。
在這一背景下,『書生』科學(xué)多模態(tài)大模型Intern-S1應(yīng)運(yùn)而生。
值得關(guān)注的是,在開(kāi)源策略層面,上海AI實(shí)驗(yàn)室比谷歌DeepMind更“豪爽”。
Intern-S1發(fā)布即開(kāi)源。除了基礎(chǔ)模型外,上海AI實(shí)驗(yàn)室還一口氣開(kāi)源了大模型研發(fā)與應(yīng)用所需的全鏈路工具體系,并已構(gòu)建擁有數(shù)十萬(wàn)活躍開(kāi)發(fā)者的開(kāi)源社區(qū)。
谷歌DeepMind AlphaFold3從發(fā)布到開(kāi)放相隔長(zhǎng)達(dá)半年,且僅為部分開(kāi)放:模型權(quán)重需申請(qǐng)獲取,商業(yè)用途受限。
二、主打多模態(tài)和通專融合,化學(xué)、材料、地球科學(xué)全面超越Grok-4
相較于同類科學(xué)大模型,Intern-S1有2個(gè)突出的特別之處,那就是多模態(tài)和“通專融合”。
據(jù)了解,在綜合多模態(tài)通用能力評(píng)估中,Intern-S1的得分和國(guó)內(nèi)外一流模型不相上下,能同時(shí)較好地理解文本和圖像內(nèi)容。該評(píng)估為多項(xiàng)通用任務(wù)評(píng)測(cè)基準(zhǔn)均分,這樣的結(jié)果說(shuō)明它在不同場(chǎng)景任務(wù)中,既有穩(wěn)定的表現(xiàn),也能適應(yīng)復(fù)雜情況。
而在由多個(gè)領(lǐng)域?qū)I(yè)評(píng)測(cè)集組成的科學(xué)能力測(cè)試?yán)铮琁ntern-S1的表現(xiàn)超過(guò)了Grok 4等最新的閉源模型。這些評(píng)測(cè)涉及物理、化學(xué)、材料、生物等領(lǐng)域的復(fù)雜專業(yè)任務(wù),進(jìn)一步證實(shí)了Intern-S1在科研場(chǎng)景中具備較強(qiáng)的邏輯性和準(zhǔn)確性。
Intern-S1是怎么在多模態(tài)領(lǐng)域答出這樣的高分答卷的?
陳愷告訴智東西,原來(lái),Intern-S1新增了動(dòng)態(tài)Tokenizer和時(shí)序信號(hào)編碼器,實(shí)現(xiàn)了支持多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù)處理的功能,所以才能夠?qū)崿F(xiàn)材料科學(xué)與生物制藥、天文巡天、天體碰撞、地震臺(tái)網(wǎng)記錄的地震波形等多類科學(xué)模態(tài)進(jìn)行深度融合。
此外,Intern-S1通過(guò)架構(gòu)上的創(chuàng)新,對(duì)科學(xué)模態(tài)數(shù)據(jù)的理解和處理效率有了明顯提高。比如,它對(duì)化學(xué)分子式的壓縮率比DeepSeek-R1要高出70%以上。在一系列基于科學(xué)模態(tài)的專業(yè)任務(wù)中,Intern-S1不僅用的算力更少,表現(xiàn)也更出色。
之前市場(chǎng)中的科學(xué)大模型,或者說(shuō)專業(yè)領(lǐng)域的行業(yè)大模型,通常都會(huì)強(qiáng)調(diào)自己過(guò)硬的專業(yè)能力,而在Intern-S1發(fā)布會(huì)上,“通專融合”這個(gè)詞出現(xiàn)頻率很高。
當(dāng)被問(wèn)到上海AI實(shí)驗(yàn)室專注走“通專融合”技術(shù)路線的原因時(shí),陳愷解釋稱:“通專融合的技術(shù)路線,能讓模型在通用能力保持的同時(shí)做到專業(yè)能力精進(jìn),把垂類能力構(gòu)建成本大幅降低。”
智東西了解到,一方面,Intern-S1會(huì)借助大量通用科學(xué)數(shù)據(jù)來(lái)拓寬自身的知識(shí)范圍;另一方面,它還會(huì)訓(xùn)練多個(gè)專業(yè)模型,生成那些容易理解、邏輯清晰的科學(xué)數(shù)據(jù),并且通過(guò)為特定領(lǐng)域定制的專業(yè)驗(yàn)證智能體來(lái)把控這些數(shù)據(jù)的質(zhì)量。
這種閉環(huán)的運(yùn)作方式不斷為其基座模型提供支持,讓Intern-S1既能擁有強(qiáng)大的通用推理能力,又具備多項(xiàng)專業(yè)能力,從而實(shí)現(xiàn)了“一個(gè)模型就能解決多項(xiàng)專業(yè)任務(wù)”這一科學(xué)智能領(lǐng)域的突破。
跳出技術(shù)角度,陳愷特別補(bǔ)充,科學(xué)領(lǐng)域的前沿突破,往往需要不同專業(yè)能力的交叉融合遷移,通專融合能更好促進(jìn)未來(lái)科學(xué)發(fā)現(xiàn)。
陳愷還介紹,Intern-S1的研發(fā)團(tuán)隊(duì)在訓(xùn)練系統(tǒng)和算法兩方面一起下功夫搞創(chuàng)新,成功讓大型多模態(tài)MoE(混合專家)模型在FP8精度下,能高效又穩(wěn)定地進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,而且訓(xùn)練成本比最近公開(kāi)的其他MoE模型低了10倍。
從系統(tǒng)層面來(lái)看,Intern-S1用了訓(xùn)推分離的RL方案,靠自己研發(fā)的推理引擎來(lái)進(jìn)行FP8精度的大規(guī)模異步推理,效率很高;還通過(guò)數(shù)據(jù)并行均衡策略,減輕了長(zhǎng)思維鏈解碼時(shí)出現(xiàn)的長(zhǎng)尾問(wèn)題。訓(xùn)練的時(shí)候用了分塊式FP8訓(xùn)練,效率提升不少,這套訓(xùn)練系統(tǒng)之后也會(huì)開(kāi)源。
再看算法方面,基于Intern·Bootcamp搭建的大規(guī)模多任務(wù)交互環(huán)境,研發(fā)團(tuán)隊(duì)提出了“Mixture of Rewards”混合獎(jiǎng)勵(lì)學(xué)習(xí)算法,能把多種獎(jiǎng)勵(lì)和反饋信號(hào)融合到一起,聽(tīng)起來(lái)有點(diǎn)像“因材施教”。
比如在容易驗(yàn)證的任務(wù)上,就用RLVR模式來(lái)訓(xùn)練,通過(guò)規(guī)則、驗(yàn)證器或者交互環(huán)境來(lái)提供獎(jiǎng)勵(lì)信號(hào);而像對(duì)話、寫作這類不好驗(yàn)證的任務(wù),就用獎(jiǎng)勵(lì)模型給出的獎(jiǎng)勵(lì)信號(hào)來(lái)一起訓(xùn)練。
三、能查科研數(shù)據(jù),還能聯(lián)機(jī)實(shí)驗(yàn)設(shè)備,科學(xué)發(fā)現(xiàn)平臺(tái)同步推出
在落地應(yīng)用上,智東西發(fā)現(xiàn),以Intern-S1為底座的『書生』科學(xué)發(fā)現(xiàn)平臺(tái)Intern-Discovery也同步推出了。
Intern-Discovery以Intern-S1為核心,整合了專業(yè)智能體、海量科研數(shù)據(jù)及實(shí)驗(yàn)設(shè)備,可以給全球研究者提供從假設(shè)到驗(yàn)證的一站式科研支撐,目前平臺(tái)已開(kāi)放全球試用申請(qǐng)。
陳愷向智東西透露,實(shí)驗(yàn)室非常歡迎與各大高校和研究所等機(jī)構(gòu)進(jìn)行深度合作。
根據(jù)公開(kāi)信息,在Intern-Discovery的基礎(chǔ)上,上海AI實(shí)驗(yàn)室聯(lián)合臨港實(shí)驗(yàn)室、上海交通大學(xué)、復(fù)旦大學(xué)、MIT等研究機(jī)構(gòu),共同參與構(gòu)建了多智能體虛擬疾病學(xué)家系統(tǒng)“元生”(OriGene)。
在治療癌癥上,OriGene的作用非常大。目前,其僅用了兩個(gè)月就已在肝細(xì)胞癌和全球第三大癌癥的結(jié)直腸癌治療上分別提出兩個(gè)新靶點(diǎn)GPR160和ARG2,并已在臨床樣本、類器官和人源化動(dòng)物實(shí)驗(yàn)中得到驗(yàn)證。
結(jié)語(yǔ):Intern-S1展現(xiàn)AI賦能科學(xué)新圖景
隨著技術(shù)的持續(xù)迭代,科研人員與AI工具的協(xié)同將進(jìn)一步深化。通用大模型與專用模型的優(yōu)勢(shì)互補(bǔ),可能在更多科學(xué)領(lǐng)域發(fā)揮作用。
Intern-S1所采用的“通專融合”技術(shù)路徑,為平衡模型的通用性與專業(yè)性提供了一種實(shí)踐方案,AI技術(shù)與科學(xué)研究的結(jié)合不斷拓展著科研手段的邊界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.