成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

機(jī)器學(xué)習(xí)臨床預(yù)測(cè)模型構(gòu)建的一般流程

0
分享至

本文內(nèi)容整理自醫(yī)咖會(huì)《機(jī)器學(xué)習(xí)在醫(yī)學(xué)研究中的應(yīng)用案例實(shí)戰(zhàn)教學(xué)》專欄,小咖針對(duì)其中的機(jī)器學(xué)習(xí)建模流程相關(guān)內(nèi)容進(jìn)行了整理,可點(diǎn)擊左下角“閱讀原文”查看完整視頻。

選題和研究思路的確定

推薦以下五個(gè)維度來獲取選題靈感:臨床實(shí)踐、同行交流、文獻(xiàn)閱讀、理論支撐、基金指南(政策導(dǎo)向),也可以從研究設(shè)計(jì),也就是PI(E)COS的五個(gè)角度幫助尋找創(chuàng)新性的選題。


圖. PI(E)COS

研究設(shè)計(jì)和數(shù)據(jù)采集

當(dāng)前臨床預(yù)測(cè)模型的建模分為兩大類:

診斷模型:預(yù)測(cè)當(dāng)前患某病的風(fēng)險(xiǎn),往往用橫斷面研究和病例對(duì)照研究;

預(yù)后模型:預(yù)測(cè)未來一段時(shí)間內(nèi)發(fā)生特定預(yù)后事件的風(fēng)險(xiǎn),往往用隊(duì)列研究和回顧性、前瞻性研究。

數(shù)據(jù)采集有五種方法:

A.自行設(shè)計(jì)問卷,開展調(diào)查,收集數(shù)據(jù);

B.查閱病案,批量查找和導(dǎo)出數(shù)據(jù);

C. 其他信息系統(tǒng)測(cè)量的數(shù)據(jù),如ICU監(jiān)護(hù)儀,可穿戴設(shè)備等

D. 申請(qǐng)臨床公開數(shù)據(jù)庫、大型專病隊(duì)列,數(shù)據(jù)競(jìng)賽網(wǎng)站公開數(shù)據(jù)集。


圖.各領(lǐng)域的國內(nèi)外數(shù)據(jù)庫


數(shù)據(jù)預(yù)處理

拿到數(shù)據(jù)后需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,一般需要進(jìn)行變量轉(zhuǎn)換、缺失值處理和異常值檢測(cè)。推薦大家收集原始數(shù)據(jù)時(shí)盡量收集連續(xù)型數(shù)據(jù),可以靈活轉(zhuǎn)化為多分類和二分類變量。

模型訓(xùn)練和變量選擇

預(yù)處理之后,需要進(jìn)行變量篩選,比較常規(guī)的篩選方法有:單因素篩選、多因素逐步回歸、LASSO回歸、其他機(jī)器學(xué)習(xí)算法(如隨機(jī)森林的變量重要性排序)。

機(jī)器學(xué)習(xí)較傳統(tǒng)回歸的一個(gè)不同之處是需要做超參數(shù)的調(diào)優(yōu),如隨機(jī)森林有兩個(gè)超參數(shù), ntree(要建立多少樹模型進(jìn)行預(yù)測(cè))和mtry(一個(gè)樹模型從變量值中隨機(jī)抽取幾個(gè)變量來建立決策樹),而調(diào)優(yōu)后需要使用調(diào)優(yōu)指標(biāo)評(píng)估,選取最優(yōu)的超參數(shù),比如分類模型可以使用AUC和分類準(zhǔn)確率。


圖.超參數(shù)的調(diào)優(yōu)

模型評(píng)價(jià)、驗(yàn)證和比較

模型評(píng)價(jià)、驗(yàn)證和比較指標(biāo)包括:

區(qū)分度:AUC和ROC曲線,也可以包括靈敏度、特異度、分類正確率等指標(biāo);

校準(zhǔn)度:Brier評(píng)分和校準(zhǔn)曲線;

臨床實(shí)用性:DCA曲線。


圖例.模型評(píng)價(jià)、驗(yàn)證和比較指標(biāo)

模型可視化報(bào)告

可以考慮多種方式進(jìn)行模型的呈現(xiàn):

A.OR/HR/B或森林圖


圖例.Logistic回歸模型的森林圖

B.評(píng)分表(根據(jù)OR/HR/β進(jìn)行打分,四舍五入取整數(shù),或者X5\X10翻倍)

C.列線圖(也是一種更直觀的評(píng)分表)


圖例.列線圖

D.網(wǎng)頁計(jì)算器(便于在線應(yīng)用)


圖例. 網(wǎng)頁計(jì)算器

E.決策樹等(也非常直觀)


圖例.決策樹

還有一些集成模型,比如隨機(jī)森林不可能將每一棵樹的決策過程都呈現(xiàn)出來,一般會(huì)對(duì)樹的結(jié)果進(jìn)行整合,根據(jù)變量重要性進(jìn)行排序(左圖)。對(duì)于黑箱模型這類無法解釋的模型,支持向量機(jī)比較抽象,可以采取一些新的可解釋的技術(shù),如SHAP、LIME等,右圖利用LIME進(jìn)行解釋,第一行為平均風(fēng)險(xiǎn),下面為變量特異性取值時(shí)的風(fēng)險(xiǎn)。


圖.隨機(jī)森林變量重要性排序(左)和LIME解釋黑箱模型(右)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
留給河南地產(chǎn)一哥的時(shí)間,不多了

留給河南地產(chǎn)一哥的時(shí)間,不多了

道格財(cái)經(jīng)觀
2025-08-30 20:18:14
上海夫妻冷戰(zhàn)十年分房睡,妻子突然病逝,丈夫整理房間發(fā)現(xiàn)這個(gè)

上海夫妻冷戰(zhàn)十年分房睡,妻子突然病逝,丈夫整理房間發(fā)現(xiàn)這個(gè)

飛云如水
2025-08-17 22:33:09
部級(jí)大佬被抓時(shí)攜女人叛逃海外,躲藏十年,傳言死于澳大利亞街頭

部級(jí)大佬被抓時(shí)攜女人叛逃海外,躲藏十年,傳言死于澳大利亞街頭

阿胡
2024-06-24 13:38:46
左軍,任上被查

左軍,任上被查

觀察者網(wǎng)
2025-08-30 21:13:24
多家銀行宣布下調(diào)人民幣存款利率幾近為0,意味著什么!

多家銀行宣布下調(diào)人民幣存款利率幾近為0,意味著什么!

詩意世界
2025-08-30 12:47:48
李心月曝黃曉明楊穎離婚原因,女方婚內(nèi)出軌鄧某,車內(nèi)運(yùn)動(dòng)被發(fā)現(xiàn)

李心月曝黃曉明楊穎離婚原因,女方婚內(nèi)出軌鄧某,車內(nèi)運(yùn)動(dòng)被發(fā)現(xiàn)

花哥扒娛樂
2025-06-18 20:49:59
網(wǎng)友稱住星級(jí)酒店全裸睡覺被開房門 酒店:維修師誤入已處理

網(wǎng)友稱住星級(jí)酒店全裸睡覺被開房門 酒店:維修師誤入已處理

紅星新聞
2025-08-30 20:00:25
深圳教師降薪,碩博生報(bào)考人數(shù)就銳減,這對(duì)普通教師心理傷害很大

深圳教師降薪,碩博生報(bào)考人數(shù)就銳減,這對(duì)普通教師心理傷害很大

郭愛華追問教育
2025-08-30 06:20:52
比亞迪歷史性突破!

比亞迪歷史性突破!

新浪財(cái)經(jīng)
2025-08-30 09:35:11
人心不足蛇吞象!人民日?qǐng)?bào)點(diǎn)名,揭開全紅嬋真實(shí)處境,誤會(huì)太深

人心不足蛇吞象!人民日?qǐng)?bào)點(diǎn)名,揭開全紅嬋真實(shí)處境,誤會(huì)太深

張鴘喜歡軟軟糯糯
2025-08-07 05:58:03
世錦賽男單半決賽:石宇奇13-21賴浩俊,大比分0-1落后

世錦賽男單半決賽:石宇奇13-21賴浩俊,大比分0-1落后

懂球帝
2025-08-31 00:33:33
深圳將新增1個(gè)口岸!未來15分鐘直達(dá)香港!

深圳將新增1個(gè)口岸!未來15分鐘直達(dá)香港!

深圳本地寶
2025-08-30 22:11:28
老虎滅絕的后果有多嚴(yán)重?新疆慘痛的教訓(xùn)讓人至今難忘

老虎滅絕的后果有多嚴(yán)重?新疆慘痛的教訓(xùn)讓人至今難忘

半解智士
2025-07-25 23:02:35
22萬買了雷軍的小米SU7,再開朋友的特斯拉,發(fā)現(xiàn)不是一個(gè)檔次

22萬買了雷軍的小米SU7,再開朋友的特斯拉,發(fā)現(xiàn)不是一個(gè)檔次

176翠翠
2025-08-29 10:53:43
山東大漢加盟廣東男籃簽約三年

山東大漢加盟廣東男籃簽約三年

王発吃吃喝喝
2025-08-30 18:39:06
看莫文蔚演唱會(huì)“衣不蔽體”,恍然大悟,郭德綱那句話啥意思?

看莫文蔚演唱會(huì)“衣不蔽體”,恍然大悟,郭德綱那句話啥意思?

策略剖析
2025-07-22 12:35:07
史記:八蜜凜列傳

史記:八蜜凜列傳

一代文嚎
2025-08-28 15:10:39
6年前,河南省兩位考生以不到550分的成績(jī)撿漏進(jìn)北大,現(xiàn)狀還不錯(cuò)

6年前,河南省兩位考生以不到550分的成績(jī)撿漏進(jìn)北大,現(xiàn)狀還不錯(cuò)

愛論歷史
2025-08-30 23:48:22
心理學(xué)上有個(gè)詞叫:莫索爾法則(搞好人際關(guān)系最好的方法,不是請(qǐng)客吃飯,而是堅(jiān)持 “莫索爾法則”)

心理學(xué)上有個(gè)詞叫:莫索爾法則(搞好人際關(guān)系最好的方法,不是請(qǐng)客吃飯,而是堅(jiān)持 “莫索爾法則”)

德魯克博雅管理
2025-07-30 17:06:21
林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

娛樂領(lǐng)航家
2025-08-29 21:00:03
2025-08-31 03:39:00
醫(yī)咖會(huì)
醫(yī)咖會(huì)
生動(dòng)有趣的形式傳遞醫(yī)學(xué)新進(jìn)展
2553文章數(shù) 10905關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

吳京風(fēng)波拉出多位明星

財(cái)經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

全國靜態(tài)品鑒開啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

教育
本地
藝術(shù)
公開課
軍事航空

教育要聞

看到一個(gè)初中女生寫的長(zhǎng)帖,我才知道有的父母錯(cuò)得有多離譜

本地新聞

換個(gè)城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國務(wù)院批準(zhǔn)對(duì)烏新軍售

無障礙瀏覽 進(jìn)入關(guān)懷版