成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI診斷準(zhǔn)確率超醫(yī)生20%,芝大揭示AI輔助臨床診斷的瓶頸與潛力

0
分享至

當(dāng) AI 系統(tǒng)在醫(yī)學(xué)診斷上的表現(xiàn)超過人類專家時,人機協(xié)作一定會帶來更好的結(jié)果嗎?來自美國芝加哥大學(xué)的一項研究給出了意外的答案。

這項研究專門針對前列腺癌磁共振成像(MRI,Magnetic Resonance Imaging)診斷進行了深入的人機協(xié)作實驗。之所以選擇這個難題,該論文第一作者、芝加哥大學(xué)陳詫姹博士對 DeepTech 解釋道:“前列腺癌 MRI 診斷是一個真實存在且難度較高的問題。許多以往的 AI 醫(yī)療研究所選擇的領(lǐng)域,醫(yī)生診斷的準(zhǔn)確率可能已高達 90% 以上,但前列腺 MRI 診斷即使對經(jīng)驗豐富的放射科醫(yī)生也極具挑戰(zhàn)性?!?/strong>


圖丨陳詫姹(來源:陳詫姹)

也就是說,在一個比較難的問題上,AI 可能給人帶來的幫助更大,因為 AI 會比人更好,而且人也有更多的進步空間。

研究團隊訓(xùn)練了一個基于 nnU-Net 架構(gòu)的 AI 模型,使用包含 1411 個病例的 PI-CAI 公開數(shù)據(jù)集。這個模型在測試集上的 AUROC(Area Under the Receiver Operating Characteristic curve,接受者操作特征曲線下面積)分別達到 0.730 和 0.790,明顯超過了參與研究的 8 名放射科醫(yī)生的平均水平(這些醫(yī)生來自美國和歐洲,年齡在 29 到 52 歲之間,大多具有豐富的前列腺 MRI 診斷經(jīng)驗)。

實驗?zāi)M了兩種可能的臨床 AI 部署場景。第一種是在醫(yī)生獨立診斷后,再提供 AI 的建議作為參考;第二種則是直接將 AI 的建議前置提供給醫(yī)生。


圖丨實驗流程概覽(來源:arXiv)

第一階段實驗中,8 名放射科醫(yī)生需要對 75 個病例進行三步診斷:先獨立診斷,然后查看 AI 預(yù)測,最后做出最終判斷。30 天后的第二階段實驗里,醫(yī)生們首先會看到詳細的個人表現(xiàn)反饋,包括第一階段的各項診斷指標(biāo),然后在 AI 預(yù)測直接展示的情況下診斷 100 個新病例。


(來源:arXiv)

研究結(jié)果首先證實了 AI 輔助的直接價值,但也揭示了一個更深層次的協(xié)作瓶頸。在第一組實驗中,放射科醫(yī)生獨立診斷的平均準(zhǔn)確率為 63.2%,獲得 AI 輔助后,他們的平均準(zhǔn)確率提升至 66.2%。然而,這一“人+AI”的協(xié)作表現(xiàn),仍未能超越 AI 模型本身 69.3% 的獨立診斷準(zhǔn)確率。

原因何在?陳詫姹觀察到:雖然醫(yī)生會更加依賴 AI 的決策,但他們不知道在哪種情況下該相信 AI 的建議。醫(yī)生并不能分辨出哪些情況下 AI 是對的,哪些情況下 AI 是錯的,所以即使他們總體上更信任 AI,最終的準(zhǔn)確率提升還是有限。

研究顯示,在第一階段研究中,當(dāng)醫(yī)生的初步診斷與 AI 出現(xiàn)分歧時(平均 22.6 個病例),醫(yī)生只在 4.6 個案例中選擇改變自己的判斷,改變率僅為 20.4%。且在這些存在分歧的病例中,醫(yī)生自己的準(zhǔn)確率只有 44.4%,遠低于總體水平。這說明醫(yī)生往往在最需要 AI 幫助的時候,反而更堅持自己的判斷。

第二階段實驗中,性能反饋和直接展示 AI 建議確實提高了醫(yī)生對 AI 的采納率,從第一階段的 75.5% 上升到 78.4%,但這種提升并沒有帶來診斷表現(xiàn)的顯著改善??磥?,簡單地告訴醫(yī)生數(shù)據(jù)還不夠,無法根本改變他們的決策習(xí)慣。


(來源:arXiv)

既然個體層面的協(xié)作存在局限,研究團隊便將目光轉(zhuǎn)向了群體決策,探索實現(xiàn)“互補性能”(Complementary Performance)的可能性,即人機團隊的表現(xiàn)超越任何一方單獨表現(xiàn)的理想狀態(tài)。他們將 8 位醫(yī)生在 AI 輔助下做出的診斷結(jié)果進行整合,通過“多數(shù)票決”(majority vote)的方式形成一個集體的最終決策。

這一策略的效果十分顯著。數(shù)據(jù)顯示,這個“人+AI”群體的平均診斷準(zhǔn)確率達到了 73.3%,不僅顯著優(yōu)于人類專家的獨立表現(xiàn)(63.2%),也首次超越了 AI 模型的獨立表現(xiàn)(69.3%)。


(來源:arXiv)

“這個結(jié)果的意義在于,”陳詫姹強調(diào),“它說明在這個問題上,人類和 AI 確實是可以互補的。只有他們能互補,你最后才能看到一個比任何一方單獨表現(xiàn)都更好的結(jié)果?!?/strong>

這一發(fā)現(xiàn)表明,雖然讓單個醫(yī)生完美地駕馭 AI 存在困難,但通過群體智慧的機制,人類的經(jīng)驗、直覺與 AI 強大的數(shù)據(jù)分析能力確實可以實現(xiàn)互補,從而達到最佳診斷效果。這為未來 AI 在臨床中的應(yīng)用模式提供了新的思路:或許重點不應(yīng)僅僅是為單個醫(yī)生提供一個“超級工具”,而是構(gòu)建一個人與 AI 深度融合的“協(xié)作團隊”。

對于如何更好地實現(xiàn)這種互補,陳詫姹認為,未來的方向包括持續(xù)優(yōu)化 AI 模型本身,使其更加精準(zhǔn)。同時,更重要的是要增進醫(yī)生對 AI 的 理解?!澳阋嬖V他們 AI 模型能做到什么樣,有哪些病歷是 AI 模型特別擅長的,然后哪些病歷 AI 模型可能沒有那么好?!蓖ㄟ^給予醫(yī)生關(guān)于 AI 模型能力邊界的清晰認知和數(shù)據(jù)反饋,能幫助他們建立更合理、更有效的信任。


圖丨相關(guān)論文(來源:arXiv)

相關(guān)論文相關(guān)以《領(lǐng)域?qū)<夷芊袂‘?dāng)?shù)匾蕾?AI?一項關(guān)于 AI 輔助前列腺癌 MRI 診斷的案例研究》(Can Domain Experts Rely on AI Appropriately? A Case Study on AI-Assisted Prostate Cancer MRI Diagnosis)為題發(fā)表于會議 ACM Conference on Fairness, Accountability, and Transparency [1]。芝加哥大學(xué)陳詫姹博士是第一作者,芝加哥大學(xué)譚宸浩教授擔(dān)任通訊作者。

參考資料:

1.https://arxiv.org/pdf/2502.03482v1

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
許家印兩大金主:山東國資逃出生天,深圳國資接最后一棒

許家印兩大金主:山東國資逃出生天,深圳國資接最后一棒

深水財經(jīng)社
2025-09-01 15:08:54
網(wǎng)絡(luò)空間部隊首次亮相九三閱兵,網(wǎng)絡(luò)安全從業(yè)者沸騰了

網(wǎng)絡(luò)空間部隊首次亮相九三閱兵,網(wǎng)絡(luò)安全從業(yè)者沸騰了

南方都市報
2025-09-03 17:34:06
到底是一場怎樣的大閱兵,能讓資深軍迷秒變軍盲?

到底是一場怎樣的大閱兵,能讓資深軍迷秒變軍盲?

大又元
2025-09-03 16:44:08
這個方隊走來,各國領(lǐng)導(dǎo)人起立致敬!

這個方隊走來,各國領(lǐng)導(dǎo)人起立致敬!

零時差工作室
2025-09-03 14:40:42
小米推出米家無刷電鉆 2 新品:1700 RPM 轉(zhuǎn)速,眾籌價 279 元

小米推出米家無刷電鉆 2 新品:1700 RPM 轉(zhuǎn)速,眾籌價 279 元

IT之家
2025-09-03 13:44:18
陳根:為什么全球最能吃苦的中國人,活得卻最焦慮?

陳根:為什么全球最能吃苦的中國人,活得卻最焦慮?

陳根談科技
2025-09-01 14:25:29
美防長發(fā)來請求,中方按下不表,特朗普得不到想要的,得先做件事

美防長發(fā)來請求,中方按下不表,特朗普得不到想要的,得先做件事

歷史求知所
2025-09-02 22:55:03
好消息!新加坡飛長春航線開通了!

好消息!新加坡飛長春航線開通了!

新加坡眼
2025-09-02 22:32:49
抗戰(zhàn)勝利80周年大閱兵民兵方陣,有兩名女生來自無錫地區(qū)

抗戰(zhàn)勝利80周年大閱兵民兵方陣,有兩名女生來自無錫地區(qū)

揚子晚報
2025-09-03 15:21:33
怒噴領(lǐng)導(dǎo)的女護士不敢辭職了!目前疑被簽約的兩方拋棄,欲哭無淚

怒噴領(lǐng)導(dǎo)的女護士不敢辭職了!目前疑被簽約的兩方拋棄,欲哭無淚

火山詩話
2025-09-03 07:33:59
93大閱兵年齡最小的受閱隊員曝光!今年才17歲,2024年參加的高考

93大閱兵年齡最小的受閱隊員曝光!今年才17歲,2024年參加的高考

談史論天地
2025-09-03 12:53:08
臺灣省明星轉(zhuǎn)發(fā)九三閱兵!吳慷仁稱要銘記歷史,吳奇隆愿和平永駐

臺灣省明星轉(zhuǎn)發(fā)九三閱兵!吳慷仁稱要銘記歷史,吳奇隆愿和平永駐

萌神木木
2025-09-03 11:15:50
中俄蒙一錘定音,普京等了整整十年,終于在北京得償所愿?

中俄蒙一錘定音,普京等了整整十年,終于在北京得償所愿?

小鬼頭體育
2025-09-03 13:31:33
砸39億!上海打造一座“鋼鐵巨浪”

砸39億!上海打造一座“鋼鐵巨浪”

GA環(huán)球建筑
2025-09-02 23:49:18
巴薩是參加歐冠的豪門中引援投入最少的球隊之一,卻要為冠軍而戰(zhàn)

巴薩是參加歐冠的豪門中引援投入最少的球隊之一,卻要為冠軍而戰(zhàn)

星耀國際足壇
2025-09-03 23:47:30
1945年日本戰(zhàn)敗,蔣介石放過岡村寧次,為何卻非殺酒井隆不可?

1945年日本戰(zhàn)敗,蔣介石放過岡村寧次,為何卻非殺酒井隆不可?

朝夕說史
2025-09-03 09:52:38
中國精英為何怕中國贏?沈逸:一旦中國科技追上,那張綠卡就貶值

中國精英為何怕中國贏?沈逸:一旦中國科技追上,那張綠卡就貶值

洲洲影視娛評
2025-09-03 22:23:03
31歲陳夢受邀觀禮閱兵式!她僅用一句話,讓整個體壇“沉默”了

31歲陳夢受邀觀禮閱兵式!她僅用一句話,讓整個體壇“沉默”了

史書無明
2025-09-03 23:14:48
近70%果粉準(zhǔn)備換 iPhone17!

近70%果粉準(zhǔn)備換 iPhone17!

果粉之家
2025-09-02 12:25:18
清朝正一品官的官員待遇有多優(yōu)厚,看完絕對讓你大吃一驚!

清朝正一品官的官員待遇有多優(yōu)厚,看完絕對讓你大吃一驚!

顧秋韻
2025-09-02 14:44:13
2025-09-04 00:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15595文章數(shù) 514043關(guān)注度
往期回顧 全部

科技要聞

疑似理想i9諜照首曝!尾部或采用全新造型

頭條要聞

普京和金正恩北京長談兩個半小時

頭條要聞

普京和金正恩北京長談兩個半小時

體育要聞

排面!德國大使館盛贊樊振東:世界級巨星

娛樂要聞

劉尚嫻 最幸運的事 就是嫁給初戀丈夫

財經(jīng)要聞

A股,2015與2025

汽車要聞

一天一個樣 方程豹鈦3玩轉(zhuǎn)“面部重組”

態(tài)度原創(chuàng)

教育
本地
親子
健康
公開課

教育要聞

家里有考軍校的必看!|高考未發(fā)揮好,如何穩(wěn)住軍校夢?

本地新聞

換個城市過夏天 | “中式美學(xué)”打開夏日濰坊

親子要聞

老一輩說“帶娃輕松”,差的不是體力是時代!

內(nèi)分泌科專家破解身高八大謠言

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版