發(fā)布時間: 2025-01-02 14:27:40
今天給大家?guī)淼奈恼率前l(fā)表在BioDataMin上的“Integrating transcriptomics and proteomics to analyze the immune microenvironment of cytomegalovirus associated ulcerative colitis and identify relevant biomarkers”。本研究的復雜之處在于有多個分組,在多個分組的情況下反復使用差異表達分析、WGCNA以及機器學習等來篩選生物標志物,最后構建疾病的診斷模型,雖然是普通的生信套路,但是也為具有多個分組的實驗提供了參考。
題目:整合轉(zhuǎn)錄組學和蛋白質(zhì)組學分析巨細胞病毒相關潰瘍性結(jié)腸炎的免疫微環(huán)境并識別相關生物標志物
雜志:BioData Min
影響因子:IF=4.0
發(fā)表時間:2024.08.27
主要結(jié)果
1、CMV+IBD患者的免疫微環(huán)境與其他IBD患者不同
作者使用xCell算法評估了四個級別免疫細胞的豐度:CMV+UCvs.CMV-UC、CMV+UCvs.CMV+N、CMV-UCvs.CMV-N和CMV+Nvs.CMV-N。在CMV+UCvs.CMV-UC組中,發(fā)現(xiàn)CD8+T細胞、CD8+Tem、軟骨細胞、HSC、角質(zhì)形成細胞、肌細胞、神經(jīng)元、中性粒細胞、血小板和皮脂細胞的豐度異常(圖1A)。在CMV+UCvs.CMV+N組中,觀察到脂肪細胞、CD4+Tem、GMP、神經(jīng)元、中性粒細胞、血小板和Tgd細胞的水平異常(圖1B)。在CMV-UCvs.CMV-N組中發(fā)現(xiàn)星形膠質(zhì)細胞、CD8+T細胞、ly內(nèi)皮細胞、系膜細胞、mv內(nèi)皮細胞、NKT、pDC和Tregs的水平異常(圖1C-D)。
2、識別CMV+UC特異性免疫微環(huán)境相關分子模塊
隨后對這四組進行了轉(zhuǎn)錄和蛋白質(zhì)水平的差異分析,篩選差異表達基因(圖2A-B)以及通過GO和KEGG富集確定差異表達基因的功能。除此之外,還對四組中的異常免疫細胞、差異表達基因(DEG)和差異表達蛋白(DEP)進行了綜合分析,以確定CMV+UC患者特有的免疫細胞和生物標志物(圖2C-E)。接下來,使用WGCNA來識別CMV+UC患者特有的DEG和DEP的共表達模塊及其與免疫細胞的關聯(lián)(圖2F-G)。
3、構建免疫細胞相關分子調(diào)控網(wǎng)絡
進一步整合了同一異常免疫細胞內(nèi)的基因共表達模塊和蛋白質(zhì)共表達模塊,確定了潛在的調(diào)控關系。分析表明,CD4+Tem細胞僅與MEbrown(P)模塊相關;CD8+Tem細胞僅與MEyellow(P)模塊相關等(圖3A)。
進一步細化后,確定了四種潛在的調(diào)控關系:(I)MEgrey和MEgrey(P):與軟骨細胞相關(圖3B);(II)MEgreen、MEblue和MEyellow(P):與中性粒細胞和Tgd細胞相關(圖3C);(III)MEgreen、MEred、MEturquoise和MEturquoise(P):與神經(jīng)元、中性粒細胞和血小板相關(圖3D);(IV)MEgrey和MEblue(P):與軟骨細胞相關(圖3E)。
隨后,構建了不同調(diào)控關系的基因共表達模塊和蛋白質(zhì)共表達模塊之間的共表達調(diào)控網(wǎng)絡。只有絕對相關系數(shù)大于0.5且p值小于0.05的調(diào)控關系才被認為是顯著的。這些調(diào)控網(wǎng)絡可能反映了異常的免疫微環(huán)境受到多種因素的影響(圖3B-E)。
4、使用機器學習算法識別CMV+UC的潛在診斷生物標志物
為了確定CMV+UC的早期診斷生物標志物,采用了五個層次的三種不同的機器學習算法:上面提到的四個調(diào)節(jié)網(wǎng)絡和與異常免疫細胞相關的所有模塊。
考慮到所有模塊,隨機森林算法確定了25個具有分類功效的基因/蛋白質(zhì)(圖4M),SVM-RFE算法選擇了132個相關基因/蛋白質(zhì)(圖4N),LASSO算法確定了7個基因/蛋白質(zhì)(圖4O)
5、構建CMV+UC診斷模型
進一步整合了三種機器學習算法的結(jié)果。在所有模塊中,我們鑒定出55種在三種算法中均能持續(xù)表現(xiàn)出有效分類的分子(圖5A)。
隨后,整合了這些分子,得到了20個候選生物標志物,它們在不同水平上表現(xiàn)出穩(wěn)定的分類性能。使用最優(yōu)子集回歸,構建了CMV+UC的診斷模型。分析顯示,8個生物標志物模型實現(xiàn)了最大的R2和調(diào)整后的R2值,貝葉斯信息準則(BIC)最低(圖5B)。這些結(jié)果表明,8個生物標志物模型(表1)在診斷CMV+UC方面表現(xiàn)最佳(圖5C)。
上一篇:社會隔離與心絞痛風險的因果關聯(lián)研究:基于孟德爾隨機化的證據(jù)