近年來,利用各種基因構建預后模型的報道層出不窮,其中很多分析思路和內容都值得借鑒。本篇推文選取2022年7月11日發表在Journal of Oncology(IF:4.5,2021-2022)上的報道,基于8類RNA修飾基因構建模型,預測肺腺癌(LUAD)亞群的免疫微環境、hallmark以及預后的差異。

一 研究背景
肺癌是世界上發病率和死亡率最高的癌種。肺癌可分為兩種病理學亞型:占比85%的非小細胞肺癌(NSCLC)和15%小細胞肺癌(SCLC),而NSCLC亞型中,又以LUAD最為常見。如今,腫瘤微環境的解析為LUAD患者的治療方案帶來了變革,更多病人由傳統的放/化療變為靶向治療和免疫治療,顯著改善了患者的預后。然而,臨床上只有少量LUAD患者對新型治療手段有響應,且腫瘤耐藥性不可避免,導致預后不佳。因此,進一步解析LUAD耐藥機制和挖掘潛在靶點有助于提升病人的治療效果。
RNA修飾是一種重要的轉錄后調控機制,已證實與腫瘤的發生發展密切相關。如今在真核生物中已經發現超過170種RNA修飾類型,其中以m6A和m5C最為常見,研究證實這些RNA修飾基因的異常與LUAD發生發展之間存在聯系。然而,絕大多數研究聚焦一種RNA修飾及相關基因,不能解析多種RNA修飾之間的聯系,因此系統地分析多種RNA修飾基因在LUAD中的變化情況有助于挖掘新的LUAD潛在分子機制,并針對性地設計治療靶點。
本研究系統地分析了LUAD中100個RNA修飾基因(8種修飾類型)在基因組和轉錄組層面的異常,并勾畫了不同修飾類型之間的互作情況。研究發現基于8種RNA修飾類型可以將LUAD病人分為兩種分子亞型,不同亞型之間在腫瘤hallmark、免疫細胞浸潤和預后等指標上有顯著差異。此外,作者還基于RNA修飾相關基因建立了預后模型RMScore,其可作為LUAD病人的獨立預后因子。
二 結果
1. LUAD中8類RNA修飾相關基因的突變和表達變化
作者收集了8類(m6A、m5C、Nm、Ψ、m1A、m7G、A-to-I和mcm5s2U)共100個RNA修飾相關基因進行后續分析。突變分析結果顯示,從RNA修飾類型來看,m6A相關基因的突變率最高(33.16%),其次是m5C(20.63%)、Nm(12.17%)、Ψ(6.53%)、m1A(5.64%)、A-to-I(5.47%)和m7G(3.53%);而從基因角度,Nm writer CMTR2的突變率最高(5%),隨后是m6A writer ZC3H13(4%)和m5C writer DNMT3A(4%)。此外,作者還發現IGF2BP2和FMR1之間存在共突變現象。為了探究100個基因的表達情況,作者利用TCGA和GEO數據進行了差異分析,鑒定出約10%的基因發生了表達失調,且部分基因的異常表達與其拷貝數變異相關。

2. LUAD中8類RNA修飾相關基因的預后價值和互作
為了評估100個RNA修飾基因的預后價值,作者利用uniCox回歸分析來挖掘與病人生存時間相關的基因,鑒定得到18個顯著相關的基因,且multiCox回歸分析顯示其中5個基因可以作為獨立預后因子。此外,Kaplan–Meier分析也證實了uniCox分析的結果。作為外部驗證,作者選取了GEO數據庫種的相應隊列進行類似分析,結果和前文保持一致。隨后,作者分析了100個基因之間的表達相關性,結果發現很多基因之間存在較高水平的表達相關性(r>0.5),進一步分析發現m6A和m5C修飾基因之間顯著共表達。這些結果表明不同修飾相關基因之間可能通過互作來發揮共同調控功能。

3. 不同RNA修飾模式之間的腫瘤標志特征和微環境差異
為了探究LUAD中RNA修飾的總體類型,作者基于100個修飾基因的表達水平,利用無監督聚類將TCGA-LUAD樣本分為兩類:Cluster A和Cluster B。兩組樣本中,100個基因的突變頻率和表達水平均有顯著差異,且Cluster A組病人的生存時間也顯著長于Cluster B組。為了解釋兩組樣本潛在的生物學差異,作者利用GSVA和ssGSEA方法比較了兩組樣本在cancer hallmark和免疫浸潤細胞兩組指標上的差別。結果發現絕大多數cancer hallmarks如hypoxia、epithelial–mesenchymal transition、angiogenesis、TNFα pathway、PI3K-AKT-mTOR pathway、E2F targets、G2M checkpoint、MYC pathway以及glycolysis pathway都在Cluster B中富集,而activated B cells、memory CD4 T cells、effector memory CD8 T cells、 eosinophil cells、immatureB cells、dendritic cells和natural killer cells卻在Cluster A中浸潤程度更高。此外,ESTIMATE分析顯示Cluster A中的樣本有更高的immune score和stromal score。以上結果說明Cluster A組病人較好的預后可能與腫瘤微環境中的免疫浸潤有關,而Cluster B的不良預后則可能與眾多cancer hallmarks富集相關。很多研究以及證實RNA修飾基因可以影響腫瘤免疫細胞的浸潤,為了鑒定與之相關的RNA修飾基因,作者分析了100個基因表達水平與28種免疫細胞豐度之間的相關性。結果發現,7類RNA修飾相關基因都與免疫細胞浸潤之間呈現顯著聯系,除了mcm5s2U。而對于多種免疫浸潤細胞,除了WTAP、CBLL1、IGF2BP3、G3BP1和G3BP2等基因,大多數m6A、m5C、m1A、m7G和Nm調節基因均與之顯著負相關。綜上,RNA修飾相關基因通過影響cancer hallmarks和腫瘤微環境來塑造不同的修飾亞型。

4. RNA修飾score的建立
為了便于評估病人的RNA修飾亞型和預測病人的預后,作者基于100個RNA修飾基因建立了RMScore。首先,作者對Cluster A和Cluster B兩組樣本進行差異基因分析,鑒定得到1348個差異表達基因(DEG),隨后發現其中229個DEGs與病人預后顯著相關。為了證實RNA修飾基因和DEG之間的聯系,作者利用公共CLIP-seq數據,發現超過半數的DEG可以被RNA修飾基因結合,表明兩者之間的直接調控關系。隨后,作者利用multiCox回歸分析從229個DEGs提取5個基因建立RMScore模型。根據RMScore中位值將病人分為高低組,發現Cluster A組病人主要為RMScore-low,而Cluster B主要為RMScore-high。生存分析表明RMScore-low的病人生存時間顯著長于RMScore-high組,表明基于8類RNA修飾基因建立的RNA修飾亞型客觀存在。GSVA分析顯示絕大多數cancer hallmarks如G2M checkpoint、E2F targets、DNA repair、MYC pathway、glycolysis pathway、PI3K-AKTmTOR pathway、EMT、hypoxia和angiogenesis在RMScore-high組病人中顯著富集,與Cluster B結果類似,且免疫細胞浸潤結果也與之前結果吻合。為了更好地探究RNA修飾基因和RMScore之間的互作,作者分析了兩者以及RMScore模型基因之間的聯系,結果發現m6A、Nm和m7G基因與RMScore顯著正相關,而m5C和m1A相關基因則與RMScore顯著負相關。

5. RNA修飾score可作為獨立預后因子
前文主要是針對TCGA-LUAD數據集分析得到的結果,為了進一步驗證RMScore的臨床價值,作者又選取了兩個相關數據集作為外部驗證。結果發現在兩組數據中,RMScore-low均和病人的較長生存時間相關,與前文結果一致。且ROC分析顯示RMScore模型的預測結果具有較高準確度。

三 小結
本篇研究中,作者選取當下的研究熱點之一-RNA修飾相關基因作為研究對象,參考已有研究報道的流程(生信人公眾號前期亦有總結:“三人行必有我師:m6A regulators整合生信分析又又又來了!”),最終建立了具有預后價值的RMScore這樣一個模型,并從cancer hallmarks和免疫細胞浸潤等角度解析了不同RNA修飾亞型之間差異的潛在分子機制,還基于表達相關性推測了不同類型RNA修飾之間的互作。整個內容容易上手,對初學者友好,然而創新性較低,被認可的程度也就不高了。