亚洲国产精品久久久天堂不卡海量,无码内射成人免费喷射,亚洲精品无码AV中文字幕,亚洲婷婷月色婷婷五月

語言 ?
中文EN

開發(fā)和驗證可解釋的機器學(xué)習(xí)模型,用于預(yù)測感染性胰腺壞死患者的死亡率

發(fā)布時間:  2025-02-26 10:33:44



2025年1月22日,Caihong Ning等人在《EClinicalMedicine》雜志上發(fā)表了一篇題為《Development and validation of an explainable machine learning model for mortality prediction among patients with infected pancreatic necrosis》的文章。該文獻旨在開發(fā)并驗證一種可解釋的機器學(xué)習(xí)模型,用于預(yù)測感染性胰腺壞死(IPN)患者的90天死亡率,以輔助臨床決策。



一、研究背景



IPN是急性胰腺炎(AP)最危險的并發(fā)癥之一,盡管近年來重癥監(jiān)護和微創(chuàng)技術(shù)的進步降低了IPN死亡率,但其死亡率仍維持在15%-20%以上。傳統(tǒng)預(yù)測工具(主要依賴線性假設(shè)),難以捕捉復(fù)雜臨床特征間的非線性關(guān)聯(lián),且現(xiàn)有研究多為回顧性、單中心設(shè)計,樣本量小且缺乏外部驗證。機器學(xué)習(xí)因其在復(fù)雜模式識別和預(yù)后預(yù)測中的優(yōu)勢,逐漸被應(yīng)用于胰腺炎研究,但針對IPN死亡率預(yù)測的機器學(xué)習(xí)模型仍較少,且缺乏可解釋性和臨床部署。本研究填補了這一空白,首次系統(tǒng)比較了10種生存分析模型,并通過SHAP方法揭示了關(guān)鍵預(yù)測因子的閾值效應(yīng)和交互作用,為臨床決策提供了透明化的依據(jù)。






二、數(shù)據(jù)來源



研究數(shù)據(jù)來源于中國兩家三級醫(yī)院的IPN患者隊列:

模型開發(fā)隊列:2011年1月至2023年1月前瞻性納入中南大學(xué)湘雅醫(yī)院的364例IPN患者,排除慢性胰腺炎、慢性器官功能障礙、妊娠及數(shù)據(jù)不完整者后,最終納入344例,其中90天死亡率為24.1%。

外部驗證隊列:2018年1月至2023年1月回顧性收集中南大學(xué)湘雅三醫(yī)院的157例IPN患者,經(jīng)相同排除標(biāo)準(zhǔn)篩選后,最終納入132例,死亡率為31.8%。







三、研究方法



納入了10種生存分析機器學(xué)習(xí)模型用于預(yù)測IPN患者的死亡預(yù)測:Cox比例風(fēng)險模型(coxph)、彈性網(wǎng)絡(luò)廣義線性模型(glmnet)、遞歸分割與回歸樹(rpart)、隨機生存森林(RSF)、梯度提升機(gbm)、支持向量機(svm)、極限梯度提升(xgboost)、深度生存模型(deepsurv)、深度學(xué)習(xí)生存分析模型(deephit)、Cox時間模型(coxtime),為了在一致條件下對多個機器學(xué)習(xí)模型進行公正和客觀的評估,設(shè)計了一個涉及嵌套重采樣、自動超參數(shù)調(diào)整和隨機搜索技術(shù)的基準(zhǔn)測試,最終根據(jù)C指數(shù)和Brier分數(shù)選擇性能最優(yōu)的RSF模型(C指數(shù)=0.865)。在特征選擇方面,為了簡化模型以增強適用性,采用逐步前向選擇方法根據(jù)上述選擇的模型選擇最佳特征子集。從區(qū)分度、校準(zhǔn)度和臨床實用性方面評估了最終模型的性能。使用C指數(shù)和時間依賴性曲線下面積(AUR)測量識別能力,通過校準(zhǔn)曲線和綜合Brier評分評估校準(zhǔn)能力,還使用決策曲線分析(DCA)評估了臨床效用。研究引入了SHAP算法,通過總結(jié)圖和依賴圖揭示了關(guān)鍵預(yù)測因子并調(diào)查與結(jié)果之間的關(guān)系,此外,SHAP交互圖用于識別兩個特征之間潛在的交互效應(yīng)。為了促進模型的可訪問性和可用性,開發(fā)了兩個公開可用的Shiny應(yīng)用程序,從而實現(xiàn)了個體化生存預(yù)測和個性化解釋。(圖1)。














四、結(jié)果



1.基線特征:

研究人群的臨床特征見表1。模型開發(fā)隊列中有344例患者,外部驗證隊列中有132例患者,其中死亡患者分別為83例(24.1%)和42例(31.8%)。在模型開發(fā)隊列中,73.0%為男性,27.0%為女性。該隊列的中位年齡為48(37-55)歲。驗證隊列的危重急性胰腺炎和多器官衰竭(MOF)發(fā)生率顯著升高,器官衰竭的中位持續(xù)時間更長,APACHE II評分較高(P < 0.05)。衍生隊列與驗證隊列在性別、年齡、病因等基線特征上無顯著差異,但驗證隊列中危重急性胰腺炎(62.9% vs. 52%)和多器官衰竭(47.7% vs. 34.3%)比例更高,且APACHE II評分中位數(shù)更高(9 vs. 8),提示驗證隊列患者病情更重。(表1)


2.模型選擇和構(gòu)建

經(jīng)過基準(zhǔn)測試,RSF算法實現(xiàn)了最好的預(yù)測性能,平均C指數(shù)最高為0.865(0.066),最低平均Brier評分為0.147(0.121),優(yōu)于其他模型(C指數(shù)范圍為0.698至0.863,Brier評分范圍為0.151至0.353)(圖2)。實現(xiàn)最佳C指數(shù)的最終模型由10個特征構(gòu)建,包括年齡、吸煙或飲酒、APACHE II評分、器官衰竭數(shù)量、器官衰竭持續(xù)時間、血流感染、胰腺CRE感染、從發(fā)病到首次干預(yù)的時間、手術(shù)入路和出血。此外,還開發(fā)了具有所有功能的RSF模型以用于模型解釋。這兩種RSF模型,無論是利用最佳特征還是所有特征,都經(jīng)歷了超參數(shù)優(yōu)化。(圖2)


3.模型驗證

在衍生隊列中,C指數(shù)為0.863(95%CI:0.854-0.875),有1000次Bootstrap重新采樣(圖3A),表明區(qū)分能力良好。同時,使用校準(zhǔn)圖來評估30天、60天和90天總生存率的預(yù)測準(zhǔn)確性,揭示了與理想曲線的對應(yīng)關(guān)系(圖3B)。綜合Brier評分為0.153(95%CI:0.143-0.163),Bootstrap重新采樣1000次,進一步證實了該模型的高可靠性。此外,DCA肯定了RSF模型作為啟動醫(yī)療干預(yù)工具的值得贊揚的臨床適用性(圖3C)。在外部驗證隊列中,用于評估RSF模型的時間依賴性AUR曲線、校準(zhǔn)圖和DCA曲線如圖3D-F所示,C指數(shù)為0.857(95%CI:0.850-0.865),Brier評分為0.084(95%CI:0.076-0.092)。(圖3)


4.模型解釋與部署

SHAP方法用于通過生成候選特征對個體預(yù)測的重要性排名來解釋模型的可解釋性。如圖4所示,前9個最重要的預(yù)后特征導(dǎo)致死亡可能性高的因素包括器官衰竭數(shù)量、APACHE II評分、器官衰竭持續(xù)時間、血流感染、從發(fā)病到首次干預(yù)的時間、BISAP評分、嚴重程度分類、年齡和出血。(圖4)


此外,SHAP依賴圖用于解釋關(guān)鍵預(yù)測因子與結(jié)果的關(guān)系。從主效應(yīng)圖和總效應(yīng)圖(圖5)來看,MOF、陽性血流感染、BISAP評分≥3、重癥急性胰腺炎和出血與死亡風(fēng)險增加相關(guān)。APACHE II評分、器官衰竭持續(xù)時間、從發(fā)病到首次干預(yù)的時間和死亡風(fēng)險之間存在潛在的非線性關(guān)系和重要閾值。具體來說,當(dāng)APACHE II評分低于10時,死亡風(fēng)險不會增加,當(dāng)10至20時,死亡風(fēng)險略有增加,當(dāng)大于20時,死亡風(fēng)險顯著增加。此外,當(dāng)器官衰竭的持續(xù)時間超過約21天時,死亡風(fēng)險要高得多,當(dāng)從發(fā)病到首次干預(yù)的時間超過約30天時,死亡風(fēng)險要低得多。(圖5)


從交互SHAP值的熱圖(圖6)中,器官衰竭的數(shù)量、器官衰竭的持續(xù)時間、從發(fā)病到首次干預(yù)的時間、血流感染、BISAP評分、APACHEII評分和嚴重程度分類之間存在強烈的交互作用。具有高相互作用SHAP值和臨床顯著性(圖6和7)。例如,如圖7A所示,負相互作用(SHAP相互作用值<0,表明預(yù)后較好)介于年齡< 50歲和多器官功能衰竭之間,然而,這種模式在年齡≥50歲和MOF之間是相反的。積極的相互作用效應(yīng)表明,年齡≥50歲和MOF的患者將比兩個變量的附加預(yù)后效應(yīng)預(yù)期的更差。(圖6、7)



最后,我們將最終的RSF模型實施到一個基于Web的交互式Shiny應(yīng)用程序中,該應(yīng)用程序為個體提供生存預(yù)測和解釋。此外,它還提供了模型的全局解釋。鑒于收集APACHE II評分所需的所有變量可能具有挑戰(zhàn)性,并且可能限制模型的臨床適用性,開發(fā)了一個替代的在線模型,沒有APACHE II評分系統(tǒng)。





五、總結(jié)



成功開發(fā)并驗證了一個可解釋的機器學(xué)習(xí)模型,能夠準(zhǔn)確預(yù)測IPN患者的90天死亡率,這表明其在指導(dǎo)臨床管理和改善患者預(yù)后方面具有卓越的潛力。







上一篇:妊娠期母體長鏈多不飽和脂肪酸與新生兒身體組成有關(guān)?

下一篇:02.24-03.02 臨床預(yù)測模型研究頂刊快報



郵編:400000
聯(lián)系電話:13651835632
電子郵件:zhoubaihao910@126.com
地址:重慶市沙坪壩區(qū)龍湖光年4號樓
Copyright ? 2022 重慶嘉舟生物科技有限公司 All Rights Reserved 渝ICP備2022013225號