在釘釘10周年發(fā)布會上,壹生檢康CEO王強宇宣布,其自主研發(fā)的豆蔻婦科大模型(doukou.ai),在國家婦產(chǎn)科衛(wèi)生高級職稱(正高)筆試考試中成績超過GPT-5的52.59分,取得了64.94分的成績。這一結(jié)果不僅彰顯了國產(chǎn)醫(yī)療人工智能在專業(yè)化賽道上的快速進步,也展示了垂直行業(yè)大模型更高的實際應(yīng)用價值,為人工智能賦能醫(yī)療臨床實踐提供了新的樣本。
專業(yè)考試驗證垂直行業(yè)大模型性能
本次測評嚴(yán)格采用國家衛(wèi)健委指定的人衛(wèi)版《婦產(chǎn)科高級職稱考試全真模擬卷》,考試范圍覆蓋臨床婦產(chǎn)科學(xué)、婦科腫瘤、圍產(chǎn)期醫(yī)學(xué)、生殖內(nèi)分泌、計劃生育等12個核心學(xué)科,題型包含多選題(占比40%)和案例分析題(占比60%)兩大題型。其中,案例分析題要求模型根據(jù)患者主訴、檢查報告等多源信息,解決臨床診斷、鑒別診斷、治療方案等問題,全面考察臨床決策能力,需要全部正確才能得分,評判標(biāo)準(zhǔn)高于人類實際考試標(biāo)準(zhǔn)。
在相同的測試環(huán)境下測評結(jié)果顯示,豆蔻婦科大模型在整體得分上領(lǐng)先GPT-5分,不僅在知識覆蓋度上更契合中國婦產(chǎn)科的臨床體系,還在病例解析和診療路徑推薦等應(yīng)用場景中展現(xiàn)出更強的專業(yè)性與實用性。
豆蔻大模型由壹生檢康(杭州)生命科技有限公司研發(fā)。壹生檢康創(chuàng)始人、CEO王強宇表示,“測評聚焦于中國婦產(chǎn)科體系的理論知識和高標(biāo)準(zhǔn)臨床決策,豆蔻婦科大模型的優(yōu)勢建立在其高度本土化和垂直化的訓(xùn)練之上。而在通用知識、多模態(tài)能力、邏輯推理的廣度上,通用大模型依然擁有其不可替代的優(yōu)勢,兩者是互補而非簡單的取代關(guān)系。在具體行業(yè)的深度應(yīng)用上,垂直大模型擁有比通用大模型更高的實用價值”
王強宇認(rèn)為,垂直行業(yè)大模型的核心優(yōu)勢體現(xiàn)在三個方面:第一,行業(yè) know-how,垂直模型深度結(jié)合行業(yè)知識體系與專家經(jīng)驗,能精準(zhǔn)匹配專業(yè)領(lǐng)域的邏輯與流程,垂直模型更懂行業(yè)。第二,高質(zhì)量數(shù)據(jù),相比通用語料,垂直模型能夠利用規(guī)范化、標(biāo)準(zhǔn)化、權(quán)威化的高質(zhì)量數(shù)據(jù),從而在可靠性與準(zhǔn)確性上更有保障。第三,快速迭代,專業(yè)團隊可根據(jù)臨床反饋以及最新指南不斷更新迭代,形成“專家—數(shù)據(jù)—模型”的閉環(huán),提升更新速度與實用價值?!岸罐⒋竽P驼且揽可罡麐D產(chǎn)科的專業(yè)know-how、結(jié)合高質(zhì)量的臨床數(shù)據(jù)訓(xùn)練,并通過與醫(yī)生群體的互動迭代來取得比GPT-5更強的專業(yè)性能”。
據(jù)了解,豆蔻婦科大模型基于釘釘企業(yè)專屬AI平臺研發(fā)迭代。釘釘企業(yè)專屬AI平臺及大模型訓(xùn)練服務(wù)體系,為豆蔻大模型訓(xùn)練提供了從數(shù)據(jù)治理、高效訓(xùn)練到靈活部署的完整端到端工具鏈和服務(wù)支持。壹生檢康團隊將豆蔻婦科大模型訓(xùn)練平臺轉(zhuǎn)移到釘釘企業(yè)專屬AI平臺后,在數(shù)據(jù)處理、算力增加、模型優(yōu)化等環(huán)節(jié)進行了多方位調(diào)整。通過釘釘企業(yè) AI 專屬平臺的分布式訓(xùn)練、多Lora部署等加速優(yōu)化手段,將單次訓(xùn)練時長從26小時縮短至7小時,降幅高達 73%?!?strong>釘釘提供的不僅僅是資源,更是方法論,釘釘行業(yè)專屬模型團隊在訓(xùn)練過程中提供的快速響應(yīng)和專家級指導(dǎo),大大提升了訓(xùn)練效率,助力豆蔻模型快速迭代升級!豆蔻產(chǎn)品負(fù)責(zé)人陳宇表示
豆蔻充實國產(chǎn)大模型生態(tài)
隨著國家對數(shù)據(jù)安全、醫(yī)療合規(guī)和自主可控的高度重視,國產(chǎn)醫(yī)療大模型在專業(yè)領(lǐng)域的突破具有更加深遠(yuǎn)的戰(zhàn)略意義。醫(yī)療作為關(guān)乎民生的重點行業(yè),更需要在人工智能底層能力上實現(xiàn)自主可控。豆蔻的成績說明,中國不僅可以在大模型賽道中發(fā)展通用型產(chǎn)品,更可以通過行業(yè)化、專業(yè)化的路線,形成差異化競爭力。這也意味著,在醫(yī)療、教育、金融、制造等對專業(yè)性要求極高的行業(yè)中,國產(chǎn)垂直大模型將成為重要力量。
專家指出,中國擁有龐大的醫(yī)療體系和豐富的臨床數(shù)據(jù)資源,這是構(gòu)建本土化垂直行業(yè)大模型的獨特優(yōu)勢。隨著產(chǎn)業(yè)鏈逐漸完善、政策支持不斷強化,未來中國將有望形成一個通用大模型與垂直大模型并存、協(xié)同發(fā)展的生態(tài)格局,在全球人工智能產(chǎn)業(yè)中占據(jù)更重要的地位。
王強宇說,“人工智能不會取代醫(yī)生,但能夠成為醫(yī)生的重要助手。通過與釘釘合作,我們探索并驗證了一條高效構(gòu)建企業(yè)專屬大模型的成功路徑,并愿意將此經(jīng)驗分享給醫(yī)療行業(yè),愿有更多的企業(yè)擁用自己的專屬大模型,大家一起在 “AI + 醫(yī)療” 的創(chuàng)新實踐中走出一條具有本土特色的發(fā)展道路”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.