大家好呀,今天讓我們來看一篇如何通過整合bulk數據和single-cell數據來解釋肝癌的腫瘤異質性及其免疫抑制機制,文章于今年六月發表在《Molecular Oncology》(IF = 7.449)上,讓我們來一起學習一下吧!

肝細胞癌 (HCC) 是最常見的原發性肝癌。由于腫瘤異質性,肝癌治療中出現耐藥性是不可避免的。為了提高免疫治療的療效,我們應進一步研究不同亞型患者免疫細胞的異質性,并確定合適的患者進行特異性免疫治療。研究腫瘤抑制的機制,從而豐富免疫治療的療效。近年來,單細胞RNA測序 (scRNA-seq) 已成為揭示腫瘤免疫微環境中細胞異質性的有力工具。在這項研究中,作者整合了scRNA-seq和多組學數據的分析,揭示了肝癌的腫瘤間和腫瘤內的異質性及其免疫抑制機制。該發現有助于臨床診斷,豐富肝癌免疫治療。

作者首先通過NMF聚類方法將患者分為的三個亞型,并分析其腫瘤間異質性,包括免疫浸潤狀態和突變譜。將S1亞型定義為具有高免疫浸潤評分的 “hot tumors”,將S2定義為具有高腫瘤純度評分的 “cold tumors”,將S3定義為具有高水平免疫抑制評分的 “immunosuppressed tumors”。
然后,作者使用來自三種HCC亞型的差異基因將大量RNA數據與scRNA-seq數據整合構建了一個基于108個基因的基因分類器。scRNA-seq樣品也可以使用108基因分類器被分成相應的HCC亞型 (S1-CS1、S2-CS2、S3-CS3)。
隨后,三種亞型的腫瘤內異質性被研究。值得注意的是,由于亞型三具有最差的預后,作者分析其免疫抑制的調控機制,發現轉錄因子BATF可以促進CTLA4和TIGIT等免疫抑制基因的表達水平,并且在BATF敲除細胞系數據和其他兩個單細胞數據集中對BATF進行了驗證,證明了BATF可以促進免疫抑制基因并誘導HCC的不良臨床預后。


1、使用非負矩陣分解(NMF)方法確定了HCC中存在三個子類型
對來自TCGA數據庫中的353例轉錄組數據,利用非負矩陣分解(NMF)算法的共識聚類確定了3個不同亞型(如圖1B),其中模式S1聚類120例,S2聚類144例,S3聚類89例。并在ICGC隊列中驗證了聚類結果。有趣的是,發現S3患者在三種亞型中預后最差。同時,三種亞型的臨床指標差異分析顯示S3患者的腫瘤分期明顯升高,這可能是該亞型預后不良的部分原因。

2、HCC的腫瘤間微環境(TME)異質性分析
作者利用ESTIMATE算法評估三個亞型免疫浸潤和腫瘤純度的異質性,發現S2的免疫評分低,但是腫瘤純度高(圖2A);并通過CIBERSORT計算三個亞型22種免疫細胞的浸潤比例,發現三個亞型之間浸潤的活化免疫細胞存在差異(圖2B)。通過對三個亞型免疫細胞抑制基因評分的比較發現S3免疫抑制基因高表達,比較亞型T細胞的標記基因(圖2C)、免疫抑制評分和生存預后結果,免疫抑制T細胞基因高評分可能和不良預后相關。 還通過GSVA對三種亞型進行GO_BP和HALLMARKER進行富集分析來研究亞型之間的功能特征,結果顯示,免疫相關通路(如IL6-STAT3和T cell selection)在S1和S3中富集,而CD4激活、炎癥反應和T細胞分化通路在S1中富集。此外,與S2中脂肪酸、脂質代謝和氧化磷酸化水平相比,S3中B細胞凋亡和WNT通路的富集分數更高(圖2D)。綜上所述,S2具有較低的免疫浸潤率,顯示“cold tumors”特征,S1具有“hot tumors”特征,而S3具有高表達的免疫抑制基因特征,顯示“immunosuppressed tumors”特征。

為了研究突變和腫瘤免疫相關性,本文分析了HCC亞型之間的體細胞突變和拷貝數變異(CNV)的頻率差異以及不同亞型的特異性突變特征。具體來說,S2的鈣粘蛋白相關蛋白beta 1(CTNNB1)和ARID1A突變頻率顯著高于S1和S3。與S1和S2相比,S3中TP53和BAP1的突變頻率更高。BAP1調控細胞死亡和線粒體代謝,這與S3中耗竭標記基因的高表達水平相一致(圖3A)。三種亞型的CNV譜均存在顯著的異質性。S1擴增的變異樣本最多,而S2缺失的變異樣本最多(圖3B)。S1、S2和S3三個亞型CNV突變區域也存在差異(圖3C)。根據每個亞型之間基因表達、缺失和擴增得出以下結論,BAP1的高突變、YEATS4和VIMP的擴增以及CYFIP2和ABLIM3的缺失可能誘導S3的免疫抑制環境,而CTNNB1的高突變可能抑制S2的免疫浸潤。

3、一種通過整合bulk和single-cell轉錄組數據的新型基因分類器
為了整合scRNA-seq數據和bulk數據,作者將GSE149614 scRNA-seq數據集中的10個樣本根據基因平均表達值整合成bulk數據。使用免疫浸潤和腫瘤純度估計計算免疫抑制、活化T細胞(aT)和liver scores。同時,評估了10個樣本的免疫和腫瘤純度評分。根據算得的評分將10個樣本分類:HCC02T、HCC03T、HCC04T和HCC05T為“cold tumor”(圖4A);HCC08T、HCC09T和HCC10T“immunosuppressed tumor”(圖4B);HCC01T、HCC06T和HCC07T為“hot tumor”(圖4C)。接下來,作者通過選擇與亞型相關的基因建立分類器識別上述參考集中的所有陽性樣本。使用從三個亞型(S1、S2和S3)的差異表達基因對參考集進行了分類分析,結果顯示,當選擇前108個基因構建分類器時,所有假陽性率(FPRs)均為0且所有真陽性率(TPRs)均為1(圖4d)。總而言之,這108個基因作為特征可以很好地將樣本分成我們預期的三個亞型。

4、三個HCC亞型之間的TME異質性
作者對三個單細胞亞型(CS1,CS2,CS3)在細胞水平上進行腫瘤微環境(TME)異質性評估。結果發現,CS3的免疫和免疫抑制評分最高,CS2的腫瘤純度和liver score最高(圖5A)。根據細胞譜系特異性標記基因進行基因表達歸一化、降維、聚類和表征,將這些細胞分為16種類型,通過marker gene進行注釋(圖5B,C)。然后,使用基因集變異分析(GSVA)的免疫基因集對免疫細胞進行分類。在T細胞和NK細胞中,mT是一種(高表達IL7R、CCR7和CD69)記憶T細胞,在幼稚T或mT信號中富集。tT是一種(高表達HAVCR2、TIGIT、BATF和CTLA4)免疫抑制T細胞類型 (圖5D,E)。總而言之,在三個單細胞亞型中免疫細胞的占比結果顯示,CS1亞型NK和aT細胞占比多,CS3亞型mT、mB、tT、mMφ、myCAF細胞占比多,CS3亞型上皮細胞(H1、H2、H3、H4)細胞占比多,進一步驗證了基因分類器的分類效果(圖5F)。


5、轉錄因子BATF以及MDSC樣巨噬細胞可促進免疫抑制細胞的形成
由于CS3(single-cell)和S3(TCGA)兩個亞型都有著相似的免疫抑制的調控機制,所以本文分析促進該亞型中免疫抑制T細胞形成的調節機制和細胞間的相互作用。首先,本文利用WGCNA計算CS3特異性亞型(mT、tT、myCAF和mMφ)相關的基因模塊(圖6A),得到12個顯著相關的基因模塊。每個模塊的關鍵基因構建共表達網絡,mT hub基因在T細胞選擇和T細胞分化途徑中富集,而tT hub基因負調控T細胞活化以及白細胞介素10的分泌(圖6B)。然后,將WGCNA與SCENIC計算的TF結果結合,選擇tT hub基因和TF調控顯著的結果,從而挖掘關鍵的免疫抑制促進的轉錄因子(TF)。值得注意的是:轉錄因子BATF可以調控TIGIT、CTLA4和共刺激基因ICOS(圖6C)。進一步的驗證也證明了這些基因對之間存在明顯的共存現象(圖6D)。并發現BATF的高表達與不良預后相關(圖6E),將Treg細胞上BATF敲除的GSE149197基因表達數據顯示,BATF、CTLA4、TIGIT和FOXP3的表達顯著降低(圖6F),這說明轉錄因子BATF可以通過上調免疫抑制基因的表達,在免疫抑制細胞的形成中發揮關鍵作用。
由于S3亞型具有較高的基質得分,作者分析了腫瘤微環境細胞在腫瘤免疫抑制微環境形成中的作用。細胞相互作用結果顯示,tT中的細胞可以通過趨化因子CXCL12_CXCR4、CCL4_CCR5和CCL3_CCR1與CS3特異性的mMφ相互作用。mMφ的特征是過表達免疫抑制基因IL10,并可以通過NECTIN2_TIGIT與tT相互作用。tT可以進一步抑制T細胞的免疫應答,最終促進HCC中免疫抑制環境的產生。此外,mMφ通過CXCL12_CXCR4和生長因子VEGFA_FLT1等趨化因子與myCAF和內皮細胞相互作用(圖6G)。同時,endothelial (End)中的內皮細胞也可以通過TIGIT_PVR與tT相互作用,這也可能促進免疫抑制細胞的形成。因此,mMφ可以直接或間接地促進HCC的S3樣亞型的免疫抑制狀態。



作者通過對HCC bulk數據聚類分析,識別出三個亞型(S1,S2,S3),并且通過免疫評分、基質評分、生存率、CNV對三個亞型進行了異質性分析并得出了很好的結果。發現免疫抑制亞型S3和不良預后相關。接下來對單細胞數據取均值模擬bulk數據,使用bulk數據構建的將HCC的single-cell數據分成CS1、CS2和CS3三個亞型,憑借這樣的方法將bulk數據和single-cell數據很好的結合在一起,發現了TF BATF可以通過上調免疫抑制基因的表達,在免疫抑制細胞的形成中發揮關鍵作用,并通過細胞之間的互作發現了S3腫瘤免疫抑制微環境形成的原因。我們可以從本文中學習到亞型分析的常規方法以及如何連接bulk數據、single-cell數據。隨著single-cell技術迅速的發展,它可以讓我們對疾病在細胞有更好的解析,但是bulk數據常常具有更大的樣本量、包含更多的表型信息,所以將單細胞數據和bulk數據結合分析亞型也是很值得我們學習的。

參考文獻:
Wang T, Dang N, Tang G, Li Z, Li X, Shi B, Xu Z, Li L, Yang X, Xu C, Ye K. Integrating bulk and single-cell RNA sequencing reveals cellular heterogeneity and immune infiltration in hepatocellular carcinoma. Mol Oncol. 2022 Jun;16(11):2195-2213. doi: 10.1002/1878-0261.13190 . Epub 2022 Mar 1. PMID: 35124891 ; PMCID: PMC9168757 .