小編今天給大家?guī)淼氖墙衲暌辉掳l(fā)表在CANCER RESEARCH(IF:13.312)上的一篇文章。腎透明細胞癌(ccRCC)具有高度的腫瘤異質(zhì)性。本文中作者對19個ccRCC樣本進行了scRNA-seq和scATAC-seq以及全外顯子組測序來了解個體之間的異質(zhì)性。構(gòu)建ccRCC的單細胞轉(zhuǎn)錄組和染色質(zhì)可及性圖譜,揭示ccRCC中不同腫瘤細胞亞型的調(diào)控特征。
腎癌是泌尿系統(tǒng)最常見的癌癥之一,其發(fā)病率每年都在增加。腎透明細胞癌(ccRCC)是最常見的腎癌類型。近年來,ccRCC靶向治療和免疫檢查點抑制劑治療取得了多項突破和巨大進展。然而,無病生存率的整體改善仍十分有限。晚期腎細胞癌(RCC)死亡率仍然很高。ccRCC是一種具有潛在高水平腫瘤異質(zhì)性和遺傳易感性的疾病。TCGA關(guān)于ccRCC的項目在DNA、RNA和蛋白質(zhì)水平以及重要分子途徑上對ccRCC患者進行了研究,很好地說明了ccRCC的遺傳特征。但由于無法分析到單個腫瘤細胞,因此仍存在一定的局限性。近年來,許多針對ccRCC的scRNA-seq研究在單細胞水平上揭示了腫瘤細胞、腫瘤特異性標志物和腫瘤免疫微環(huán)境的特征。然而這些研究忽視了ccRCC的表觀遺傳調(diào)控。
文章對19個ccRCC樣本進行了單細胞多組學研究。在研究中,作者通過整合19個ccRCC樣本(共約16.4萬個細胞)的scATAC-seq和scRNA-seq,結(jié)合全外顯子組測序,揭示了ccRCC的表觀遺傳調(diào)控特征。

通過質(zhì)量控制,一共獲得了102,723個高質(zhì)量的細胞。根據(jù)以往研究中標記基因的表達對細胞注釋,將ccRCC分為22種獨立的細胞類型,包括4種腫瘤細胞亞型,4種內(nèi)皮細胞亞型等(圖2B,C)。在ccRCC中,T細胞數(shù)量最多,其次是腫瘤細胞(圖2D)。由于ccRCC的腫瘤異質(zhì)性,對來自19個不同個體的腫瘤樣本進行了scRNA-seq。大多數(shù)細胞類型沒有樣本差異,而腫瘤細胞和內(nèi)皮細胞之間的個體差異比較明顯(圖2E)。廣泛的免疫細胞浸潤,特別是T細胞和TAMs,是ccRCC免疫微環(huán)境的特征。

考慮到ccRCC的遺傳易感性,作者對所有ccRCC樣本進行了全外顯子組測序,以了解個體之間的DNA變異。常見突變基因的變異與以往研究中發(fā)現(xiàn)的相似。VHL是最常見的突變基因,突變率為84.2%(圖3A)。CA9、KRT14、CD24也表現(xiàn)出較高的突變率 (圖2A),將腫瘤細胞分為VHL、CA9、KRT14和CD24突變組和非突變組,并比較它們的基因表達差異。發(fā)現(xiàn)突變和非突變腫瘤細胞的基因表達非常相似,Pearson相關(guān)系數(shù)大于0.98(圖2B-E)。這也說明ccRCC中單個突變基因并沒有引起腫瘤細胞所有基因表達的巨大變化。

根據(jù)基因表達特征,腫瘤細胞被聚類為4個細胞亞型。除ccRCC 4外,其余三種腫瘤細胞亞型無患者間異質(zhì)性(圖4A,B)。雖然個體差異仍然存在,但在腫瘤細胞中,細胞亞群分類有很好的代表性。ccRCC 1高表達CA9和NDUF4AL2;ccRCC 2高表達KCNQ1OT1和CP;ccRCC 3高表達NDUF4AL2和CYB5A,而ccRCC 4在腫瘤細胞中表達大部分高表達基因(圖4C)。CA9、NDUF4AL2和CP在之前的研究中被確定為ccRCC的標記基因。KCNQ1OT1是一種致癌的lncRNA,但這是第一次通過scRNA-seq發(fā)現(xiàn)KCNQ1OT1在特定的ccRCC細胞亞型中高表達。

之后進行了CNV分析,發(fā)現(xiàn)這些腫瘤細胞亞型存在不同的CNV特征(圖4D)。大多數(shù)腫瘤細胞特征是3號染色體的丟失和5號染色體的增加。這一結(jié)果集中在ccRCC 1中(圖4D)。這可能是由克隆或亞克隆腫瘤細胞引起的。因此,可以利用scRNA-seq的結(jié)果來預測處于根狀態(tài)的腫瘤細胞以及腫瘤細胞的進化方向。結(jié)合RNA速度和Monocle3來重建腫瘤細胞的進化軌跡。結(jié)果發(fā)現(xiàn)ccRCC 4位于根,提示其可能是干細胞樣細胞,可分化為ccRCC 1、ccRCC 2和ccRCC 3(圖5)。

接著作者希望預測這四種腫瘤細胞類型的預后。基于scRNA-seq的結(jié)果,計算每種腫瘤細胞類型的DEGs。選擇每個細胞亞型的前100位的DEGs,并根據(jù)TCGA數(shù)據(jù)確定預后結(jié)果。ccRCC 1、ccRCC 2和ccRCC 3中大部分的DEGs提示陽性生存,而ccRCC 4中更多的DEGs提示預后不良(圖4E)。
與腫瘤細胞類似,內(nèi)皮細胞在ccRCC中也有4種細胞亞型(圖6A-B)。存在一種具有癌癥相關(guān)成纖維細胞(CAF)標記(TAGLN, PDGFRB, COL1A2和ACTA2)的內(nèi)皮細胞亞型(Endo cells 3)。內(nèi)皮細胞和成纖維細胞在腫瘤微環(huán)境中可以相互轉(zhuǎn)化,該結(jié)果支持了ccRCC中存在這種轉(zhuǎn)化的可能性。另一方面,隨著ccRCC樣本數(shù)量的增加,內(nèi)皮細胞的亞型比之前的研究更多,說明內(nèi)皮細胞的異質(zhì)性。使用CellphoneDB測定內(nèi)皮細胞和腫瘤細胞之間的配體-受體相互作用。大多數(shù)內(nèi)皮細胞和腫瘤細胞亞型與大量配體-受體對相互作用,特別是在Endo cells 3中(圖6C-D)。ITGB1和VEGFA在內(nèi)皮細胞與腫瘤細胞的相互作用中發(fā)揮了重要作用(圖6E-H)。

免疫細胞在ccRCC組織中所占比例較高,約占所有細胞的64.7%(圖2D),可分為13種細胞類型(圖7A)。在腫瘤微環(huán)境中,免疫細胞的相互作用非常密切,特別是TAM 1、DCs和增殖性CD8+ T細胞(圖7B-C)。CD74-MIF,CD74-COPA和CD74-APP配體-受體對在TAM和其他免疫細胞中發(fā)揮著重要作用(圖7D)。
T細胞是ccRCC中最豐富的免疫細胞,可分為5種細胞亞型(圖7E)。PD-1是免疫檢查點的一個關(guān)鍵受體,它可能對免疫治療的效果很重要。PD-1在ccRCC中的陽性率約為21.49%(圖7F)。ccRCC中,巨噬細胞主要以TAM的形式存在。TAM在ccRCC中可分為兩種細胞亞型,一種亞型CD163、CSF1R和CD86基因高表達,另一種亞型則低表達這些基因(圖7G)。接下來,分析了TAM 1和TAM 2與所有腫瘤細胞亞型之間的相互作用。TAM與腫瘤細胞之間的細胞相互作用非常密切,尤其是TAM 1(圖7H-I)。除了CD74-APP和CD63-TIMP1常見的配體-受體相互作用外,還發(fā)現(xiàn)了SLC40A1-CP。SLC40A1是TAM的標志物,而CP是ccRCC腫瘤細胞的標志物。因此,SLC40A1-CP結(jié)合的生物學效應值得進一步研究。

雖然已有研究構(gòu)建了腎細胞癌免疫細胞的染色質(zhì)動態(tài)單細胞圖譜,但更全面的包括腫瘤細胞在內(nèi)的ccRCC單細胞染色質(zhì)可及性圖景可能揭示腫瘤細胞的調(diào)控特征。作者通過10x Genomics平臺對19個ccRCC樣本進行了scATAC-seq。基于LSI算法,將細胞分為29種不同的細胞類型,并確定了每種細胞類型的樣本來源(圖8A-B)。細胞注釋首先計算了腫瘤細胞、內(nèi)皮細胞、CAF、免疫細胞、CD4+ T細胞、B細胞內(nèi)皮細胞和NK細胞的標記基因活性評分。隨后,分析細胞類型特異性峰,然后確定這些峰對應的基因區(qū)域(圖8C,D)。在此基礎上,相對可靠地定義了ccRCC中29種不同的細胞類型。

通過scATAC-seq鑒定了所有細胞類型的共同可及染色質(zhì)區(qū)域(圖9A)。這表明它們的調(diào)節(jié)過程不是細胞類型特異性的。因此,通過識別細胞類型特異性的共可及染色質(zhì)區(qū)域,可以發(fā)現(xiàn)細胞類型特異性的調(diào)控過程。此外,scATAC-seq結(jié)果顯示,非腫瘤細胞的染色質(zhì)可及性在個體間是一致的(圖9B)。每種細胞類型都具有良好的樣本普適性,幾乎來自所有樣本。然而,腫瘤細胞可以根據(jù)染色質(zhì)可及性分為16種細胞亞型(圖9C)。大多數(shù)腫瘤細胞亞型來源于單個ccRCC樣本(圖5C)。ccRCC中腫瘤細胞染色質(zhì)可及性存在顯著的個體間異質(zhì)性。

CA9和KRT14作為ccRCC細胞中可達區(qū)域的標記,在每種腫瘤細胞亞型中保持染色質(zhì)可及性(圖9D-E)。為了更好地發(fā)現(xiàn)腫瘤細胞亞型之間的異質(zhì)性,富集了16種細胞亞型的前10個染色質(zhì)可及區(qū)域,并將這些區(qū)域映射到基因。發(fā)現(xiàn)這些染色質(zhì)可及性區(qū)域既重疊又不同,呈現(xiàn)不規(guī)則狀態(tài)。這也可能表明ccRCC在DNA水平上的遺傳易感性。
四種lncRNAs(RP11-661C8.2,CTB-32H22.1,CTB-164N12.1和RP11-267A15.1)可被scATAC-seq特異性地接觸到(圖10A)。所有這些lncRNAs都有一個位于5號染色體上(圖10A)。通過各種機制,順式作用的lncRNA已被證明可以激活、抑制或以其他方式調(diào)節(jié)靶基因的表達。證實了ccRCC具有5號染色體拷貝數(shù)增加的特征,作者推測這些lncRNAs可能在ccRCC中發(fā)揮特異性的調(diào)控作用。

作者選擇了兩種lncRNA(RP11-661C8.2和CTB-164N12.1)進行后續(xù)實驗,驗證了這兩種lncRNA的生物學功能。首先,通過細胞質(zhì)/核分離實驗,證實了這兩種lncRNAs在細胞核中表達。本研究構(gòu)建ASO-5608特異性干擾RP11-661C8.2的表達,ASO-5717干擾CTB-164N12.1的表達,反向驗證其生物學功能。以ccRCC細胞系786-O和Caki-2為細胞模型。ASO-5608和ASO-5717處理48h后,與NC組相比,786-O和Caki-2中RP11-661C8.2和CTB-164N12.1的表達明顯降低。這一結(jié)果也表明ASO-5608和ASO-5717的抑制作用是可信的。
接下來,在ccRCC細胞系上進行5-ethynyl-2′-deoxyuridine(EdU)檢測。ASO處理后ccRCC細胞系的增殖活性明顯降低(圖10B)。CCK-8實驗也支持該結(jié)果(圖10C)。隨后,進行細胞劃傷實驗,觀察ccRCC細胞系在被劃傷0、24、48h后的創(chuàng)面愈合情況。NC組的創(chuàng)面愈合情況優(yōu)于ASO治療組(圖10D-F)。此外,通過transwell實驗觀察ASO處理后ccRCC細胞系遷移功能的變化。ASO處理后786-O和Caki-2 w e的遷移顯著降低(圖10G-H)。上皮細胞-細胞粘附分子鈣粘蛋白1(E-cadherin)是一種生長和侵襲抑制因子,已知其通過復雜機制抑制致瘤性和腫瘤擴散。通過免疫印跡試驗發(fā)現(xiàn)ASO處理后,ccRCC細胞系中E-cadherin的表達明顯升高(圖10I)。上述結(jié)果證實了RP11-661C8.2和CTB-164N12.1在體外促進ccRCC侵襲遷移的作用。
基于以上結(jié)果,確認了RP11-661C8.2和CTB-164N12.1的部分功能。然而,這些lncRNA的調(diào)控機制仍不清楚。首先獲得了與RP11-661C8.2和CTB-164N12.1相互作用的熒光蛋白。然后,對這兩種蛋白質(zhì)進行了蛋白質(zhì)質(zhì)譜分析。通過使用Proteome Discoverer軟件分析質(zhì)譜結(jié)果,只保留可信的肽段和蛋白,并進行FDR驗證,去除FDR大于1%的肽段和蛋白。其中TPM1、TPM4、MYH9、HSPB1、CNBP、MYL6、PUF60和KRT8等蛋白最為顯著(圖10J)。隨后,編碼這些蛋白質(zhì)的基因根據(jù)scRNA-seq數(shù)據(jù)估計它們在每個細胞亞型中的表達。這些基因在CAF和Endo cells 3中幾乎高表達(圖10J)。一些基因,如TPM1、HSPB1和KRT8在腫瘤細胞中高表達(圖10J)。這表明RP11-661C8.2和CTB-164N12.1的調(diào)控功能具有細胞類型特異性,主要調(diào)控CAF、內(nèi)皮細胞和腫瘤細胞。
scATAC-seq的另一個優(yōu)勢是可以發(fā)現(xiàn)特定的調(diào)控過程,特別是TF。在這項研究中,作者發(fā)現(xiàn)SPIC和EOMES分別是B細胞和NK細胞中的特異性TF。ZEB1作為一種TF普遍與腫瘤細胞結(jié)合,而ETV4普遍與非腫瘤細胞結(jié)合(圖11A)。此外,scATAC-seq鑒定了內(nèi)皮細胞、CAF和T細胞的特異性TF和motif(圖11A)。每種細胞類型中最顯著的前10個TF,這些TF具有細胞類型特異性,特別是在腫瘤細胞和免疫細胞之間(圖11B)。
為了預測這些細胞類型特異性TF的確切結(jié)合位置,進行了TF足跡分析(圖11C)。TF肝細胞核因子1β(HNF1B)是發(fā)育性腎病最常見的單基因病因。據(jù)報道,HNF1B也與一種罕見的RCC有關(guān),其機制尚不清楚。

基因表達的調(diào)控是一個非常復雜的過程,受表觀遺傳調(diào)控、lncRNA、增強子、啟動子等因素的影響。作者將scATAC-seq和scRNA-seq的結(jié)果進行整合,旨在發(fā)現(xiàn)ccRCC的調(diào)控規(guī)律。構(gòu)建了單細胞染色質(zhì)可及性和單細胞轉(zhuǎn)錄組co-embedding圖(圖12A)。雖然單細胞轉(zhuǎn)錄組和單細胞染色質(zhì)可及性的數(shù)據(jù)上存在差異,但從空間投影可以看出,相同細胞類型之間的分布非常相似。
然后,通過整合scATAC-seq(16個亞型)和scRNA-seq(4個亞型)中的所有腫瘤細胞,發(fā)現(xiàn)腫瘤細胞亞型中染色質(zhì)可及性和基因表達之間的相關(guān)性(圖12B)。ccRCC 1(scRNA-seq亞型)的基因表達與15種腫瘤細胞類型(scATAC-seq亞型)的染色質(zhì)可及性相關(guān),這表明了腫瘤細胞調(diào)控的復雜性(圖12C)。還有ccRCC 2 (scRNA-seq亞型)和ccRCC 11 (scATAC-seq亞型),這意味著染色質(zhì)可及性和基因表達之間的對應關(guān)系(圖12C)。ccRCC 2和ccRCC 11主要來源于同一樣本。因此,由ccRCC 11的可及染色質(zhì)區(qū)調(diào)控的ccRCC 2基因表達特征是準確的(圖12D)。然而,ccRCC 1 (scRNA-seq亞型)的調(diào)控特征是復雜的,包括15種scATAC-seq腫瘤細胞亞型的調(diào)控特征(圖12E)。所有15種腫瘤細胞亞型中發(fā)現(xiàn)了幾個常見的可及染色質(zhì)區(qū)域(圖12E)。其中'chr11-111906243-111914666'和'chr5-178286237-178290844'分別位于DLAT和ZNF354B上。在TCGA ccRCC隊列中,DLAT信號的低表達與患者總生存期的降低有關(guān)。'chr19-10352456-10354286'和'chr7-73829891-73835325'出現(xiàn)在DNA非編碼區(qū),它們分別與MRPL4和CLIP2的位置接近。這些發(fā)現(xiàn)表明,ccRCC腫瘤細胞的可及染色質(zhì)區(qū)域存在個體差異,并且存在共同的調(diào)控區(qū)域。

作者通過scRNA-seq從19個ccRCC樣本中捕獲了102,723個高質(zhì)量的單細胞轉(zhuǎn)錄組信息。通過整合單細胞轉(zhuǎn)錄組和全外顯子組測序結(jié)果,作者發(fā)現(xiàn)突變和非突變腫瘤細胞中的基因表達非常相似。這也表明,ccRCC中單個突變基因并沒有引起腫瘤細胞所有基因表達的巨大變化。腫瘤免疫微環(huán)境中發(fā)現(xiàn)了一個特殊的配體受體對(SLC40A1-CP),主要是TAM與腫瘤細胞相互作用。scATAC-seq揭示了細胞類型甚至單個細胞的表觀遺傳調(diào)控特征。作者發(fā)現(xiàn)lncRNAs上有一些染色質(zhì)可及區(qū)域具有腫瘤細胞特異性。此外,實驗也證實了這些lncRNAs能夠促進ccRCC在體外的侵襲和遷移。基于scATAC-seq發(fā)現(xiàn)的這些lncRNAs,通過蛋白質(zhì)譜進一步尋找結(jié)合蛋白,從而了解其調(diào)控機制。