前言
m6A是作為最近的熱點方向,已經有了各種方向的研究。如何在眾多文章中讓讀者眼前一亮呢?或者說,對于同種數據類型的同種癌癥,怎么推陳出新,讓這個研究具有故事性?今天這篇文章可能可以給大家一些啟發。Identification of Two m6A Readers YTHDF1 and IGF2BP2 as Immune Biomarkers in Head and Neck Squamous Cell Carcinoma【Frontiers in Genetics IF:4.27】

研究m6A的常規思路,可以概述為“分型+預后”思路。m6A只有20多個基因,沒有必要進行降維,可以直接使用二十多個m6A基因,進行聚類,聚類將患者分為兩類后,進行差異分析,然后找相關基因,進行預后分析。但如果說,所有的m6A去參與聚類,聚類相關并不好的話,課題開展就遇到了瓶頸。常規思路的后面,得到模型之后,可以和免疫、免疫檢查點、鐵死亡等熱點進行關聯。
這篇文章則巧妙的設計了一個新的思路——將m6A基因與患者的免疫得分計算相關性,得到幾個與免疫相關的m6A基因,使用這些免疫相關的m6A基因對患者進行聚類。這個時候,患者往往可以較好的被分為兩類。可以說這篇文章思路精巧,另辟蹊徑,將原本可能無法進行的研究思路打通。可謂是,“山重水復疑無路,柳暗花明又一村”。 現在我們來正式看一下這篇文章吧。
數據和代碼
結果
一、鑒定與 HNSCC 免疫譜相關的 m6A調控子
為了探究m6A調控子的表達是否影響HNSCC免疫譜,首先,對來自TCGA的HNSCC患者進行過濾,使用具有生存信息的499名HNSCC患者;然后應用 ESTIMATE 工具和 CIBERSORT 算法這些患者的ESTIMATE 評分和免疫細胞浸潤;使用21個m6A修飾調控子[Table.1],計算這些調控子的表達與 ImmuneScore 的相關性[Fig.1]。


接下來,對21個m6A 調控子和ImmuneScores相關性的絕對值進行排序。 相關性最大的兩個調控子(YTHDF1、IGF2BP2)構建免疫相關特征。
二、基于YTHDF1和IGF2BP2對HNSCC患者進行一致性聚類
選擇499例HNSCC患者的YTHDF1和IGF2BP2的表達數據進行一致性聚類,患者被分為兩個不同的cluster[Fig.2a]。其中,Cluster1包含294名患者,Cluster2包含205名患者。去除106個沒有分期和等級信息的患者后,分析兩個cluster中剩余患者的臨床特征[Table.2]。

同時,PCA分析證實一致性聚類效果良好[Fig.2b]。YTHDF1和IGF2BP在Cluster1表達更高[Fig.2c],而T分期和病理學等級也在cluster1中進展更顯著。 比較腫瘤組織和正常組織中YTHDF1和 IGF2BP2 的表達水平,明顯在腫瘤組織中的表達水平較高[Fig.2d]。使用Kaplan-Meier分析cluster1和cluster2的生存情況,cluster2具有更高的生產率[Fig.2e]。

三、基于YTHDF1和IGF2BP2的cluster的免疫圖譜
通過GSEA分析兩個cluster之間的通路富集。確定cluster1和m6A修飾相關,而cluster2與HNSCC的免疫調節密切相關[Fig3a]。接下來,為了理解cluster1和cluster2之間免疫浸潤譜的差異,分別進行CIBERSORT、ssGSEA分析。cluster2表現出更活躍的抗腫瘤免疫細胞聚集[Fig.3b]。比較關鍵免疫相關基因的表達,結果表明兩個cluster都參與了抗腫瘤免疫細胞失效,但cluster2的TGF-β和FAP水平更低[Fig.3c]。

四、基于YTHDF1和IGF2BP2的聚類與HNSCC相關基因的關聯
使用幾個公認的影響HNSCC生物學行為和免疫治療反應的基因,分別比較來自TCGA和GEO的兩套數據中兩個cluster的表達水平[Fig.4ab]。結果表明,cluster1可能與更差的生物學行為有關。

五、通過DEG分析和WGCNA識別Hub基因
使用499個患者的原始count數據,計算兩個cluster之間的差異表達基因(Fig.5ab)。然后通過WGCNA將識別到的差異表達基因劃分模塊,識別和兩個cluster最相關的模塊[Fig.5c]。

六、Hub基因的功能富集分析和PPI網絡分析
為了理解WGCNA識別的最相關的模塊,對該模塊進行富集分析,并構建PPI網絡。功能富集分析表明,該模塊和免疫調節有關,包括淋巴細胞活化、免疫反應的陽性調節、免疫效應器過程的調節和B細胞活化[Fig.6ab]。通過MCODE算法將整個PPI網絡進一步劃分為兩個主要MCODE,其中,MCODE1與Gα(i)信號事件、GPCR配體結合相關;MCODE2與第二信使分子、T細胞受體信號通路的產生密切相關[Fig.6c]。

七、在GEO數據庫中基于YTHDF1和IGF2BP2聚類驗證免疫特征
為了驗證基于基于m6A聚類的顯著性,從GEO數據庫中獲得額外數據。使用“ConsensusClusterPlus”對來自GEO的270名患者進行一致性聚類[Fig.7a]。PCA分析證實上述聚類效能良好[Fig.7b]。其中cluster2的YTHDF1和IGF2BP2基因具有更低的表達[Fig.7c]。同時,使用CIBERSORT和ssGSEA來估計腫瘤微環境的組成[Fig7.de]。總之,上述結果表明基于YTHDF1和IGF2BP2的聚類識別了不同的免疫譜。

總結
本篇文章在眾多m6A研究中,算得上是另辟蹊徑。整篇文章的亮點在于第一部分,后面的六個部分都建立在第一部分基于相關性找到的兩個免疫相關的m6A基因,這兩個基因可以將患者聚為較好的兩個類。后面的分析也就一通百通了。小編看了兩個基因和免疫得分的相關性,分別是-0.318和-0.285。單看起來,相關性并不高,不過依據它在兩套數據中都可以將患者較好的分開,且具有預后意義,這兩個基因還是極具魯棒性的。