四大頂級期刊中BMJ于2025年7月發(fā)表了一篇題為“Dealing with continuous variables and modelling non-linear associations in healthcare data: practical guide.”文章,對在醫(yī)學(xué)研究中如何更加合理處理連續(xù)性變量和非線性關(guān)聯(lián)進行了詳細的討論。
在上一篇推文中,我們討論了處理連續(xù)變量時簡單分類和假設(shè)線性關(guān)系的弊端,并通過一個案例研究展示了這些方法的不足。詳見:
在這篇文章中,我們將深入探討兩種主流的非線性建模方法:限制立方樣條(RCS)和分?jǐn)?shù)多項式(FP),并比較它們的優(yōu)缺點。
限制立方樣條(RCS)
限制立方樣條是一種靈活的建模方法,通過將連續(xù)變量分成多個區(qū)間,并在每個區(qū)間內(nèi)擬合多項式函數(shù),從而捕捉非線性關(guān)系。
其主要特點包括:
局部擬合:在每個區(qū)間內(nèi)擬合多項式函數(shù),能夠捕捉變量在不同區(qū)間內(nèi)的變化。
連續(xù)性:通過在節(jié)點(knots)處平滑連接,確保整體函數(shù)的連續(xù)性。
穩(wěn)健性:在數(shù)據(jù)點較少的尾端強制線性,減少異常值的影響。
靈活性:可以根據(jù)樣本量和研究目標(biāo)選擇合適的節(jié)點數(shù)量,通常3-5個節(jié)點較為常見。
RCS 的主要缺點是模型復(fù)雜度較高,解釋系數(shù)較為困難。不過,通過圖形化展示,可以直觀地理解變量之間的關(guān)系。
分?jǐn)?shù)多項式(FP)
分?jǐn)?shù)多項式通過在一組預(yù)定義的冪次中選擇最佳擬合,允許變量的冪次不是整數(shù)。其主要特點包括:
全局?jǐn)M合:在整個數(shù)據(jù)范圍內(nèi)擬合多項式函數(shù),適合捕捉全局趨勢。
簡潔性:模型表達式簡潔,系數(shù)易于解釋,適合寫入論文。
靈活性:通過選擇不同的冪次,可以擬合多種非線性關(guān)系。
計算效率:通常比 RCS 更快,適合大規(guī)模數(shù)據(jù)集。
FP 的主要缺點是對尾端數(shù)據(jù)敏感,可能導(dǎo)致整體形狀的扭曲。
兩種方法的比較
擬合效果:在大多數(shù)情況下,RCS 和 FP 的擬合效果相似。RCS 在處理尾端數(shù)據(jù)時更為穩(wěn)健,而 FP 在表達和解釋上更為簡潔。
適用場景:如果研究目標(biāo)是預(yù)測,且樣本量較大, RCS 是更好的選擇;如果目標(biāo)是解釋,且需要簡潔的表達式, FP 可能更適合。
軟件支持與代碼實現(xiàn)
R和 Stata 均提供了豐富的函數(shù)來實現(xiàn)非線性建模方法。以下是一些常用的包和函數(shù):
R:
{rms}:提供 rcs() 和 lsp() 函數(shù),支持限制立方樣條和線性樣條。
{mfp}:提供 fp() 函數(shù),支持分?jǐn)?shù)多項式。
{splines}:提供 bs() 和 ns() 函數(shù),支持 B 樣條和自然樣條。
Stata:
mkspline:支持線性和限制立方樣條。
fp :支持分?jǐn)?shù)多項式。
實際應(yīng)用中的注意事項
樣本量:在樣本量較小時,非線性建模可能會導(dǎo)致過擬合。建議在建模前進行樣本量計算,確保有足夠的數(shù)據(jù)支持復(fù)雜的模型。
變量選擇:在多變量模型中,建議使用逐步回歸或 LASSO 等方法選擇重要的變量,避免過度擬合。
模型驗證:使用交叉驗證或自助法( bootstrapping )驗證模型的穩(wěn)定性和預(yù)測能力。
結(jié)果解釋:通過圖形化展示和表格形式呈現(xiàn)結(jié)果,確保研究結(jié)果的可解釋性和可重復(fù)性。
總結(jié)
限制立方樣條(RCS)和分?jǐn)?shù)多項式(FP)都是強大的非線性建模工具。選擇哪種方法取決于研究的具體目標(biāo)、樣本量和軟件支持。在實際應(yīng)用中,建議通過圖形化展示來解釋模型結(jié)果,確保研究的準(zhǔn)確性和可靠性。無論選擇哪種方法,都應(yīng)避免簡單分類和假設(shè)線性關(guān)系,以充分利用連續(xù)變量的信息。
參考文獻:BMJ. 2025 Jul 16;390:e082440. doi: 10.1136/bmj-2024-082440.
醫(yī)咖會9周年
驚喜第一彈來啦!
醫(yī)咖會基礎(chǔ)會員全面大升級,趕快去領(lǐng)取一年基礎(chǔ)會員!
基礎(chǔ)會員權(quán)益:28張基礎(chǔ)課程券,基礎(chǔ)課程均可兌換!醫(yī)咖會SCI-AI工具,科研內(nèi)容訓(xùn)練,回復(fù)更專業(yè)!
點擊“閱讀原文”/應(yīng)用商店搜索/掃碼下載醫(yī)咖會APP,登錄后,彈窗領(lǐng)取基礎(chǔ)會員!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.