今天給大家分享一篇2022年2月24日發表在Genome Medicine(IF:11.117)上,結合突變和免疫治療數據構建泛癌預后模型的文章,如果覺得純生信工作過于單薄的小伙伴可以來看一下,整合公共數據是如何發到10分+的。
A mutation-based gene set predicts survival benefit after immunotherapy across multiple cancers and reveals the immune response landscape
基于突變的基因組預測多種癌癥免疫治療后的生存獲益,并揭示免疫反應圖譜
一.文章背景
免疫檢查點抑制劑療法(ICI)徹底改變了許多癌癥的治療。然而受益于ICI治療的人群有限,在臨床上有指示作用的標志物(如TMB)并不能有效預測患者對于ICI 的治療反應。因此,有必要篩選預測標志物對患者分層,預測ICI 的治療效果,提高患者的生存效益。今天小編就和大家分享一篇基于突變數據、跨癌癥類型預測ICI治療效果的文章。
二、數據及方法
數據來源:作者收集了cBioPortal數據庫中Samstein MSK-IMPACT (n=1661)的突變和免疫治療數據作為訓練集,從8個已發表的工作中(PMID: 31792460、PMID: 29443960、PMID: 30150660、PMID: 29301960、PMID: 29033130、PMID: 26997480、PMID: 26359337、PMID: 25409260)收集數據作為驗證集。并使用TCGA中突變、拷貝數、mRNA表達數據針對預測模型鑒定的亞組進行分析。
2、PSM加權算法:為了平衡MSK-IMPACT 數據集中突變和野生型之間潛在混雜因素,在此研究中作者使用PSM加權算法處理數據,先使用邏輯回歸分析計算傾向得分,令突變基因組和野生型基因組之間加權傾向得分的標準差小于10%;再使用多因素COX回歸篩選生存相關基因,使用permutation test隨機100次確定統計學意義。
3、基于突變基因集篩選預測基因:使用PSM分析,LASSO懲罰COX回歸分析,最后使用多因素COX回歸構建風險評分模型。根據X-tile 3.6.1軟件確定最佳臨界值,將患者分為低風險和高風險評分組。
4、免疫分析:使用CIBERSORT評估免疫細胞浸潤水平。TIL 分數、白細胞分數和淋巴細胞分數從Thorsson、Saltz等人的研究中獲得。從 Danaher 等人的TCGA 泛癌研究中提取免疫浸潤評分。從 He 等人獲得29個經典免疫特征,ssGSEA來量化每個樣本中29個免疫特征的富集水平。使用ABSOLUTE計算腫瘤間異質性。
5、其他分析:CYT被定義為GZMA和PRF1表達的幾何平均值。“MutationalPatterns” 包進行NMF分析,通過余弦相似性將突變剖面與COSMIC特征進行比較。GISTIC 2.0處理拷貝數數據,使用clusterProfiler包進行富集分析,使用Kaplan-Meier方法比較生存差異,C-index表示預測準確性,Wilcoxon檢驗對兩組進行比較進行統計分析。
三、結果
1、基于突變鑒定用于預測免疫治療結果的的基因集及驗證
作者篩選了468個腫瘤抑制基因、癌基因以及被認為可用于靶向治療并獲得美國 FDA 授權的通路基因作為候選基因進行篩選。先使用PSM算法篩選出98個候選基因,然后使用LASSO懲罰COX回歸模型,隨機1000次篩選出現超過990次的基因為預后相關基因,共得到11個預后相關基因,量化每位患者的風險得分,使用X-tile軟件生成最佳臨界值。作者發現患者的低風險組的OS比高風險組要長(圖1B),且各亞組無論年齡、藥物類型或者癌癥類型如何,低風險組的OS都要比高風險組的要長(圖1C-E)。
2、驗證用于預測免疫治療結果的突變基因集
KM生存曲線顯示,驗證集與訓練集相同的趨勢(圖1F)。作者還比較了基于突變基因集的性能和訓練隊列中現有的基于突變的ICI響應特征(如UV、APOBEC和DNA損傷響應通路等),使用C-index指數進行量化,發現基于突變基因集的C-index指數是最大的。作者還和TP53、B2M等基因的性能作比較,發現基于突變基因集的性能是最好的。這篇文章中指出低風險組的ICI治療有顯著的DCB(圖1G),低風險組的患者更可能對ICI治療有反應(圖1-H),并在驗證集中取得進一步證實(圖1I和J)。

3、基于突變的基因組是免疫治療后預后的一個獨立預測因素
COX回歸分析顯示,無論是在訓練集還是驗證集基于突變的基因集與OS相關,且均為獨立的預測因素(圖2A和B)。為了確定哪個因素具有最佳預測性能,使用 C-index來比較訓練和驗證隊列中基于突變的基因集與 TMB 和藥物類型之間的性能,結果表明基于突變的基因組能更準確的預測預后(圖2C),驗證集展示了同樣的效果(圖2D)。
4、基于突變的基因組、疾病分期、CTL和6-IFN-g基因特征可以結合起來預測ICI治療的臨床效益。
通過ssGSEA方法發現,與高危組相比,低危組顯示出更高的 2-gene cytolytic得分(P = 0.071),6-gene IFN-g 得分(P < 0.05),和18-gene IFN-g 得分(P < 0.05)。將基于突變的基因集、疾病分期、CTL 和 6 基因 IFN-g 基因特征整合到 ICI 治療的預測列線圖中(圖2E),列線圖在觀察值與預測值之間顯示出良好的一致性(圖2F)。

5、高風險和低風險群體的潛在外在免疫景觀
將風險評分系統應用于TCGA隊列(圖3A),基因組水平的比較顯示,低風險組的白細胞、淋巴細胞和 TIL 分數高于高風險組(圖3B-D),使用其他方法評估也得到同樣的結論(圖3E-F)。根據 Danaher 等人的免疫浸潤評分分析顯示,低風險組有更多的免疫細胞(圖3G-H)。使用無監督聚類根據免疫特征評分對TCGA隊列患者進行聚類,結果顯示了兩種不同的免疫模式,即高水平和低水平的免疫浸潤(圖3I-J)。此外,在低風險組中,腫瘤部位的免疫特征評分明顯高于正常部位;相反,高危組在腫瘤部位的免疫特征評分明顯低于正常部位(圖4A),低風險組免疫活動之間的相關性高于高風險組(圖4B-C)。GSEA結果顯示,在低風險組中,有13條通路明顯富集,包括6條免疫相關通路(圖4D),相比之下,高風險組沒有富集到任何免疫相關的通路。低風險與明顯較高的CYT評分有關(圖4E),并且在高風險組中有明顯較多的纖維細胞(圖4F),低風險組在腫瘤部位顯示出豐富的免疫細胞,對ICI治療更容易響應,而高風險組的成纖維細胞可能有助于外在的免疫逃逸。此外,作者發現低風險組中趨化因子的表達更高(圖 4G-H),由此推斷趨化因子的富集可能會在低風險組中引發免疫反應。


6、高風險和低風險群體的潛在內在免疫景觀
低風險組顯示出比高風險組更高的突變率和新抗原負荷,以及更高的 TCR 多樣性和 BCR 多樣性;與低風險組相比,高風險組表現出更高的 CNV 負荷和非整倍性,表明腫瘤非整倍性與對免疫治療的反應降低和免疫逃避標志物有關,同時高風險組的瘤間異質性高于低危組(圖 5A),高免疫原性可能會在低風險組中引起外在免疫反應。根據體細胞突變數據描繪了突變特征,并在來自 TCGA 的隊列中確定了四種不同的誘變模式(圖5B),在低風險組中發現這四個特征的頻率明顯高于高風險組(圖 5C)。計算了低風險和高風險人群中 10 種常見致癌通路中致癌基因的富集分數。細胞周期、Hippo、NRF2、PI3K 和 TP53 通路在低風險組中得分較高,而 MYC 和 Wnt 通路在高風險組中富集(圖 5D)。與低風險組相比,高風險組表達較少量的 MHC I 和 II 相關抗原呈遞分子導致內在免疫逃逸,低風險組大多數 MHC 基因的表達較高,這表明免疫原性更強。作者還發現免疫檢查點分子(如 PD-1、PD-L1 和 CTLA4)和共刺激分子在低風險組中的表達高于高風險組(圖 5E)。

7、高低風險人群的拷貝數特征
在高風險組和低風險組之間有染色體畸變的顯著差異(圖 6A)。與高風險組相比,在低風險組中觀察到特征明顯的免疫基因如 PD-L1(9p24.1)和 PD-L2(9p24.1)的局部擴增峰(圖6B-C)。Venn顯示,兩組共有692個拷貝數擴增的基因,高危組和低危組分別有310和1218個基因被特異性擴增(圖 6D)。使用Gene Ontology 中的注釋信息對這些擴增基因進行注釋,并對前10的生物學過程進行聚類,低風險組顯著富集了 2 個免疫相關的生物學過程,高危組顯著富集“成纖維細胞增殖的正調節”,但沒有任何免疫相關的生物學過程(圖 6E),這個結果與之前的結果驚人地一致。PD-L1 和 PD-L2在兩個免疫相關的生物學過程中都有注釋,表明 PD-L1 和 PD-L2 可能調節低風險組的免疫狀態(圖 6F)。來自 TCGA 的隊列中的 mRNA 表達水平分析發現,低風險組中 PD-L1 和 PD-L2 的 mRNA 表達顯著增高(圖 6G),與 CNV 數據一致。這一發現表明,腫瘤中的 CNV 有助于觀察到免疫浸潤的差異。

在這篇工作中,整合了多套公共數據結合PSM、LASSO、單因素COX和多因素COX算法構建風險評分,并在大樣本數據集中進行驗證,解析了高低風險組中的外在和內在免疫景觀,分析高低風險組的CNV特征。基于突變的數據進行檢測時不容易受技術手段的影響,在今后的工作中使用突變數據分析為臨床轉化提供更大的便利,純生信分析也可以助力臨床轉化,感興趣的小伙伴千萬不要錯過呀!