今天給大家分享的是一篇今年9月份發(fā)表在《Frontiers in Oncology》(IF:6.244)上的文章。目前大量證據(jù)表明,卵巢癌 (OC) 的異質(zhì)性是其治療失敗的主要原因。單細(xì)胞RNA測(cè)序技術(shù) (scRNA-seq) 是在單細(xì)胞水平上分析腫瘤異質(zhì)性的有力工具,有助于在遺傳和細(xì)胞水平上更好地了解細(xì)胞功能。本研究中,作者將scRNA-seq與bulk RNA-seq相結(jié)合,最后確定了兩個(gè)標(biāo)記基因,在OC中具有重要的預(yù)后意義和免疫治療價(jià)值。

scRNA-Seq與Bulk RNA-Seq整合分析卵巢癌免疫細(xì)胞異質(zhì)性并建立分子風(fēng)險(xiǎn)模型
背景
卵巢癌(OC)是一種常見(jiàn)的婦科惡性腫瘤,死亡率很高,并具有異質(zhì)性。目前主要的治療手段是手術(shù)和化療,且其異質(zhì)性是其治療效果不佳的主要因素之一。超過(guò)90%的卵巢惡性腫瘤被歸類為上皮性卵巢癌,包括五種主要類型:高級(jí)別漿液性(70~80%%),低級(jí)漿液性(<5%),粘液性(3%),子宮內(nèi)膜樣癌(10%)和透明細(xì)胞癌(10%)。
數(shù)據(jù)組成和方法思路
1. 數(shù)據(jù)組成:GEO數(shù)據(jù)庫(kù)中的兩個(gè)scRNA-seq數(shù)據(jù)集(GSE154600和GES158937)、TCGA中OC的bulk RNA-seq。
2. 方法思路:首先使用兩個(gè)scRNA-seq數(shù)據(jù)集(GSE154600 和 GES158937)來(lái)表征OC 異質(zhì)性,共聚類出20個(gè)細(xì)胞群。然后根據(jù)免疫細(xì)胞標(biāo)記篩選出免疫相關(guān)的細(xì)胞群,包括T細(xì)胞或NK 細(xì)胞、B細(xì)胞和髓樣細(xì)胞等。接下來(lái),便是對(duì)TCGA-OC的bulk RNA-seq數(shù)據(jù)的分析,包括有免疫浸潤(rùn)、WGCNA 分析、亞型分析、OS相關(guān)基因鑒定、預(yù)后風(fēng)險(xiǎn)模型構(gòu)建。最后的實(shí)驗(yàn)驗(yàn)證部分包括qPCR和IHC 分析。

結(jié)果
1. ScRNA-seq聚類分析
研究人員首先對(duì)下載的scRNA-seq數(shù)據(jù)集去批次(利用Seurat包中的SCTransform() 函數(shù)),對(duì)其進(jìn)行降維。再通過(guò)函數(shù)FindCluster ()對(duì)細(xì)胞進(jìn)行聚類,獲得20個(gè)聚類。然后再根據(jù)標(biāo)記基因的表達(dá)情況注釋免疫相關(guān)細(xì)胞類群,如PTPRC是免疫細(xì)胞標(biāo)記,EPCAM是上皮細(xì)胞標(biāo)記,COL1A2是成纖維細(xì)胞標(biāo)記(圖2)。

2. 免疫細(xì)胞分析
在這一部分,首先是對(duì)前面注釋的免疫細(xì)胞群基于免疫細(xì)胞標(biāo)記基因進(jìn)行亞群聚類和注釋。然后是分別對(duì)T細(xì)胞、B 細(xì)胞和髓樣細(xì)胞進(jìn)行GSVA富集分析,并描繪各類的細(xì)胞相應(yīng)的特征情況(圖3)。其中,對(duì)于腫瘤浸潤(rùn)的髓樣細(xì)胞,分析了M1-like和M2-like髓樣細(xì)胞的活性,結(jié)果發(fā)現(xiàn)M1和 M2相關(guān)基因在具有數(shù)據(jù)集GSE154600的P3和P4患者中顯著上調(diào)。綜上所述,研究人員通過(guò)分析兩個(gè)OC scRNA-seq數(shù)據(jù)集以及基于免疫細(xì)胞亞型的腫瘤和髓樣細(xì)胞之間的差異相互作用探索了卵巢癌的異質(zhì)性。

3. CIBERSORT
CIBERSORT是一種常用的計(jì)算免疫細(xì)胞浸潤(rùn)的方法,它利用線性支持向量回歸的原理對(duì)免疫細(xì)胞亞型的表達(dá)矩陣進(jìn)行去卷積,來(lái)估計(jì)免疫細(xì)胞的豐度。在這里,為了進(jìn)一步分析OC浸潤(rùn)免疫細(xì)胞的臨床意義,研究人員通過(guò)CIBERSORT這種計(jì)算方法,根據(jù)TCGA中的bulk RNA-seq數(shù)據(jù)的counts預(yù)測(cè)22個(gè)免疫細(xì)胞的比例,同時(shí)也計(jì)算了這378名 TCGA-OC患者的bulk RNA-seq數(shù)據(jù)中M1-like TAMs(腫瘤相關(guān)巨噬細(xì)胞)豐度(圖4A)。生存分析結(jié)果表明,M1-TAMS豐度高的患者生存率更高(圖4B、C)。而不同豐度M2-like TAMS的患者之間的生存差異并不顯著。因此研究人員后續(xù)又對(duì)M1-like TAMs進(jìn)行了深入的分析。

4. WGCNA分析和免疫治療預(yù)測(cè)
為了進(jìn)一步探索M1-TAMS在OC中的潛在作用,研究人員對(duì)TCGA中的樣本數(shù)據(jù)進(jìn)行了WGCNA分析。最后總共生成了7個(gè)模塊(圖5A-D),其中棕色模塊(內(nèi)含3213個(gè)基因)與M1-like TAMs score的相關(guān)性最高(圖5E)。為了篩選出這一模塊中與OS相關(guān)的基因,他們通過(guò)計(jì)算基因與模塊特征基因之間的相關(guān)性與基因表達(dá)與 OS 之間的相關(guān)性這兩者之間的相關(guān)性,最后得到了45個(gè)關(guān)鍵基因(MM>0.5 和 GS>0.1)(圖5F)。
根據(jù)IMvigor210CoreBiologies包中OC的免疫治療隊(duì)列數(shù)據(jù),可將樣本分為“免疫浸潤(rùn)型” 、 “免疫排斥型”和 “免疫沙漠型”三種表型。根據(jù)三種表型的預(yù)測(cè)AUC值,可以發(fā)現(xiàn)這些關(guān)鍵基因在用于區(qū)分免疫浸潤(rùn)型和免疫沙漠型樣本時(shí)預(yù)測(cè)效果更好(圖 5H)。這些結(jié)果表明鑒定出的這45個(gè)基因是免疫浸潤(rùn)的潛在預(yù)測(cè)標(biāo)記。

5. 基于M1-Related基因的分子分型
篩選出關(guān)鍵基因以后該做什么呢?一般套路主要是有兩種,一種是對(duì)樣本進(jìn)行亞型分類,一種是構(gòu)建回歸模型。這里一共篩選出了有45個(gè)基因,構(gòu)建回歸模型的話顯然基因數(shù)量過(guò)多了,所以研究人員接著基于前面所篩選出的基因表達(dá)情況將所有樣本分成兩個(gè)亞型,分別研究這兩個(gè)亞型之間的差異,以進(jìn)一步識(shí)別生存相關(guān)標(biāo)記基因。首先是提取這45個(gè)基因的表達(dá)量矩陣,然后利用R包NMF基于M1相關(guān)基因?qū)CGA中的OC樣本分成兩個(gè)亞型(cluster1和cluster2),圖6C中就展示了這45個(gè)基因在所有樣本中的表達(dá)情況。預(yù)后分析顯示,cluster1的預(yù)后效果要更差(圖6D)。兩種OC分子亞型中cluster2中M1-like髓樣細(xì)胞的比例更高(圖6E)。最后還分別對(duì)兩個(gè)亞型進(jìn)行了KEGG富集分析(圖6F-G)。

6. 構(gòu)建預(yù)后風(fēng)險(xiǎn)模型
研究人員將TCGA中的OC樣本按照1:1比例隨機(jī)分成訓(xùn)練集和測(cè)試集,從658個(gè)DEGs挑選出101個(gè)蛋白編碼基因,再通過(guò)cox回歸和Lasso回歸構(gòu)建了預(yù)后風(fēng)險(xiǎn)模型(圖7)。首先使用Cox識(shí)別出4個(gè)生存相關(guān)基因(CXCL13、PLA2G2D、IL26、CARD17),然后再結(jié)合Lasso回歸,發(fā)現(xiàn)CXCL13和 IL26的低表達(dá)是一個(gè)風(fēng)險(xiǎn)因素。最后確定將這兩個(gè)基因用于構(gòu)建風(fēng)險(xiǎn)模型,結(jié)果發(fā)現(xiàn)CXCL13和IL26基因表達(dá)較低的患者的風(fēng)險(xiǎn)評(píng)分和死亡率越高,高風(fēng)險(xiǎn)組的預(yù)后也更差。

7. 預(yù)后風(fēng)險(xiǎn)模型的驗(yàn)證
構(gòu)建完風(fēng)險(xiǎn)模型之后自然是對(duì)該模型的驗(yàn)證了。根據(jù)測(cè)試集數(shù)據(jù)和TCGA中所有OC樣本數(shù)據(jù)分析,結(jié)果發(fā)現(xiàn)具有高 RiskScore的樣本的風(fēng)險(xiǎn)評(píng)分明顯小于具有低RiskScore的樣本。同時(shí),KM曲線顯示低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組之間存在顯著的生存差異(圖8)。

8. 實(shí)驗(yàn)驗(yàn)證
這篇文章并不完全的純生信分析,研究人員最后還是做了一些實(shí)驗(yàn)驗(yàn)證的。他們通過(guò)qPCR(圖9A、B)和IHC(圖9C、D)分析了 OC 患者臨床樣本中特征基因(CXCL13和 IL26)的表達(dá)情況,結(jié)果顯示OC組織中CXCL13和 IL26的表達(dá)確實(shí)較低。

小結(jié)
這篇文章所用的分析數(shù)據(jù)都源于公共數(shù)據(jù),只是在分析出關(guān)鍵基因后做了一點(diǎn)簡(jiǎn)單的實(shí)驗(yàn)驗(yàn)證。我們來(lái)回顧一下,其實(shí)文章后面基于bulk RNA-seq的分析都是常規(guī)套路,不過(guò)他們想到了和腫瘤的異質(zhì)性聯(lián)系在一起,所以加入了scRNA-seq數(shù)據(jù)用來(lái)表征異質(zhì)性,這也正是文章的一大亮點(diǎn)。
參考文獻(xiàn)
Liang L, Yu J, Li J, Li N, Liu J, Xiu L, Zeng J, Wang T, Wu L. Integration of scRNA-Seq and Bulk RNA-Seq to Analyse the Heterogeneity of Ovarian Cancer Immune Cells and Establish a Molecular Risk Model. Front Oncol. 2021 Sep 21;11:711020.