大家好,今天跟大家分享的是2021年7月份發(fā)表在Frontiers in Cell and Developmental Biology (IF: 6.684)上的一篇關(guān)于衰老相關(guān)基因預(yù)后模型的文章。該文章利用衰老相關(guān)基因在肺腺癌中構(gòu)建了LASSO Cox預(yù)后模型,是一篇經(jīng)典的預(yù)后模型文章,思路清晰,可以借鑒該思路用于自己的分析中。讓我來(lái)為大家梳理下這篇文章的思路。
An Aging-Related Gene Signature-Based Model for Risk Stratification and Prognosis Prediction in Lung Adenocarcinoma
基于衰老相關(guān)基因signature的肺腺癌風(fēng)險(xiǎn)分層和預(yù)后模型
1. 基于衰老相關(guān)基因識(shí)別與預(yù)后相關(guān)的signature
作者首先利用單因素Cox回歸在TCGA-LUAD與GSE31210數(shù)據(jù)集中分別識(shí)別出58個(gè)和79個(gè)與整體生存(OS)有關(guān)的衰老相關(guān)基因,其中交集為19個(gè)(圖1A)。接著作者使用LASSO回歸對(duì)19個(gè)衰老相關(guān)基因進(jìn)行篩選, 9個(gè)基因納入到后續(xù)的多因素Cox分析(圖1BC),最終構(gòu)建出了一個(gè)包含6個(gè)基因的預(yù)后風(fēng)險(xiǎn)模型(圖1D)。

圖1.識(shí)別衰老相關(guān)的預(yù)后signature
2. 預(yù)后風(fēng)險(xiǎn)模型中基因的分析
在這里作者分析了風(fēng)險(xiǎn)模型中6個(gè)基因的表達(dá)(圖2A),相關(guān)蛋白質(zhì)水平(圖2BC),突變的情況(圖D),以及與臨床特征(包括年齡、性別、腫瘤分期)的相關(guān)性(圖3)。

圖2. 預(yù)后風(fēng)險(xiǎn)模型中基因的表達(dá),蛋白質(zhì)水平以及突變情況

圖3. 預(yù)后風(fēng)險(xiǎn)模型中基因與臨床特征的相關(guān)性
3. 高低風(fēng)險(xiǎn)組所關(guān)聯(lián)的生物學(xué)過(guò)程及免疫浸潤(rùn)
接著作者在TCGA-LUAD數(shù)據(jù)集中,使用GSEA分析了高低風(fēng)險(xiǎn)組間差異基因所關(guān)聯(lián)的通路(圖4)。此外作者檢驗(yàn)了風(fēng)險(xiǎn)得分和腫瘤免疫之間的關(guān)系。圖5A展示了訓(xùn)練集中低風(fēng)險(xiǎn)組和高危組的免疫細(xì)胞類(lèi)型百分比。比較分析發(fā)現(xiàn)低風(fēng)險(xiǎn)患者表現(xiàn)出更高水平的naive B細(xì)胞,高風(fēng)險(xiǎn)組患者CD4記憶T細(xì)胞等水平升高(圖5B)。同時(shí)還分析了免疫細(xì)胞類(lèi)型之間的相關(guān)性(圖5C)。

圖4. 高低風(fēng)險(xiǎn)組間的功能差異

圖5. 風(fēng)險(xiǎn)得分和腫瘤免疫之間的關(guān)系
4. 風(fēng)險(xiǎn)模型在訓(xùn)練集中的預(yù)后效能
作者將風(fēng)險(xiǎn)得分從低到高進(jìn)行排序,并根據(jù)中值將樣本分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組(圖6A)。圖6B顯示了每個(gè)個(gè)體的生存狀態(tài)和隨訪(fǎng)時(shí)間,圖6C展示了風(fēng)險(xiǎn)模型中基因的表達(dá)。生存分析顯示在高低風(fēng)險(xiǎn)組間存在著明顯的生存差異(圖6D)。同時(shí)來(lái)評(píng)估風(fēng)險(xiǎn)模型來(lái)預(yù)測(cè)不同生存年限的能力(圖6E)。此外Cox回歸分析,表明風(fēng)險(xiǎn)模型得分是一個(gè)獨(dú)立的預(yù)后因子(圖6FG)。進(jìn)一步,作者進(jìn)行了亞組分析,在控制了年齡、性別和臨床分期后,模型仍有著較好的預(yù)后能力(圖7)。

圖6. 風(fēng)險(xiǎn)模型在訓(xùn)練集中的預(yù)后效能

圖7. 預(yù)后模型的亞組分析
5. 風(fēng)險(xiǎn)模型在驗(yàn)證集中的預(yù)后效能
在驗(yàn)證集中,根據(jù)中位風(fēng)險(xiǎn)得分將患者分為高低風(fēng)險(xiǎn)兩組(圖8A),模型內(nèi)基因的表達(dá)如圖8B。基于OS和RFS分別進(jìn)行了預(yù)后效能評(píng)估(圖8C-H)。結(jié)果表明預(yù)后模型展現(xiàn)出好的預(yù)后效能,高低風(fēng)險(xiǎn)組間存在明顯的生存差異(圖8EF),也有著較佳的預(yù)測(cè)1,3,5年生存的能力(圖8GH)。

圖8. 風(fēng)險(xiǎn)模型在驗(yàn)證集中的預(yù)后效能
6. 構(gòu)建列線(xiàn)圖
基于衰老相關(guān)signature、年齡、分級(jí)和性別建立預(yù)測(cè)列線(xiàn)圖模型,該列線(xiàn)圖直觀地顯示了預(yù)測(cè)1、3和5年生存的概率(圖9A)。在1年、3年和5年的時(shí)間內(nèi)使用ROC曲線(xiàn)分析來(lái)評(píng)價(jià)列線(xiàn)圖。在訓(xùn)練集中模型預(yù)測(cè)1、3、5年總體生存的AUC分別為0.754、0.73、0.42(圖9B)。在測(cè)試集中模型預(yù)測(cè)1、3、5年總體生存的AUC值分別為0.923、0.752、0.42(圖9C)。為了進(jìn)一步評(píng)價(jià)預(yù)后列線(xiàn)圖的預(yù)測(cè)性能和臨床用途,作者進(jìn)行了校正曲線(xiàn)和決策曲線(xiàn)分析。在訓(xùn)練集和測(cè)試集中,列線(xiàn)圖的校準(zhǔn)曲線(xiàn)顯示實(shí)際與預(yù)測(cè)概率之間的一致性很好(圖10AB)。此外,決策曲線(xiàn)表明與TNM分期系統(tǒng)相比,聯(lián)合列線(xiàn)圖模型的預(yù)測(cè)凈收益較高(圖10CD)。

圖9. 構(gòu)建列線(xiàn)圖

圖10. 列線(xiàn)圖評(píng)估
本篇文章的內(nèi)容就是這些。讓我為大家梳理下思路:首先作者使用單因素Cox回歸,LASSO回歸和多因素Cox回歸構(gòu)建了衰老基因相關(guān)的預(yù)后模型,接著對(duì)模型內(nèi)基因進(jìn)行了一系列分析,包括表達(dá),相關(guān)蛋白水平,突變以及與臨床因素的關(guān)系,然后分析高低風(fēng)險(xiǎn)兩組間的差異,最后在獨(dú)立驗(yàn)證集中驗(yàn)證與評(píng)估該模型。此外作者還針對(duì)于該預(yù)后signature構(gòu)建了一個(gè)列線(xiàn)圖,并多角度評(píng)估了該列線(xiàn)圖的效果。本文思路簡(jiǎn)單清晰,是一個(gè)常規(guī)的預(yù)后模型文章,小伙伴們可以基于其他的基因集合,在不同的癌癥類(lèi)型中來(lái)嘗試這個(gè)思路的效果,做自己的分析。快來(lái)動(dòng)手嘗試一下吧,最后祝大家科研順利!