肺癌異質性分析還能發18+
利用單細胞數據分析肺癌中細胞組成的文章日益增多,但只要找好研究角度仍然可以發高分文章。今天分享一篇一月份發表在Signal Transduction and Targeted Therapy(IF=18.187)的文章,通過整合單細胞測序數據和其他組學數據,揭示肺癌生存相關的細胞和轉錄模塊。

一 研究背景
肺癌在世界范圍內仍然是惡性腫瘤相關死亡的主要原因,其病因和生物學上的異質性是導致治療失敗和預后不良的重要原因。肺癌分為非小細胞肺癌(non-small cell Lung cancer, NSCLC)和小細胞肺癌(small cell Lung cancer, SCLC)。NSCLC占肺癌病例的85%,主要由肺腺癌(LUAD)和肺鱗癌(LUSC)兩種亞型組成,這兩種亞型是根據腫瘤的臨床和組織學特征確定的。遺傳、表觀遺傳和微環境特征可以影響細胞程序并導致不同的NSCLC發病機制。由于潛在的異質性,統一的治療策略可能會失敗,導致預后不良。LUAD和LUSC之間的異質性和細胞組成的差異,以及這些細胞組成在多大程度上影響患者的生存仍在很大程度上有待探索。因此,更好地理解肺癌異質性的各種來源,包括遺傳、表觀遺傳、細胞和微環境特征,是一個具有廣泛治療意義的關鍵目標。
本文作者使用了一種綜合的方法來了解NSCLC的異質性,結合了LUAD和LUSC患者在多個腫瘤階段的scRNA-seq,bulk RNA-seq、全基因組測序(WGS)和ATAC-seq數據集。通過scRNA-seq確定了已知存在于肺癌中的各種細胞類型,包括II型肺泡細胞(AT2)、基底細胞和各種骨髓和淋巴細胞。揭示了主要肺癌亞型中不同的細胞組成,并確定了與預后不良有關的亞組。研究發現,LUAD和LUSC在AT2和基底細胞亞群中有選擇性的擴增,并且具有與肺癌低生存率相關的獨特的細胞組成模塊。惡性和階段特異性基因分析進一步揭示了腫瘤進展中的關鍵轉錄因子和基因。此外,在AT2和基底細胞中發現了具有增殖和分化特性的亞簇。亞簇標記AQP5和KPNA2等10個基因的過表達分析進一步揭示了它們的功能,為肺癌的早期診斷和治療提供了潛在的靶點。
二 主要結果
構建LUAD和LUSC的多組學圖譜
為了全面了解NSCLC的細胞類型組成和轉錄譜,作者生成了LUAD和LUSC的單細胞和多組學圖譜。在華西醫院(WCH)的32名未經治療的患者中,共獲得52個新鮮的手術切除的肺部腫瘤和鄰近組織,包括11個配對的原發和鄰近LUAD樣本,8個未配對的LUAD和2個鄰近樣本,以及9個配對的原發和鄰近LUSC患者和2個額外的原發LUSC樣本,共21名肺腺癌和11名鱗癌患者(圖1a, b)。共有220716個細胞通過質量控制,其中127593個細胞來自腫瘤組織,93123個細胞來自相應的鄰近肺組織。總共檢測到17277個基因,平均每個細胞1424個基因,突顯出該數據集的高質量。作者還整合了之前的數據集,包括全基因組測序(WGS)、ATAC-Seq和bulk RNA測序,這些數據來自45名肺癌患者(圖1b)和4名良性肺腫瘤患者的獨立隊列。總之,作者構建了LUAD和LUSC在體分辨率和單細胞分辨率上的多組學圖譜。
為了定義每個細胞類型,作者使用Seurat 和Harmony 來處理293,432個細胞,進行質量控制、歸一化、批量效應校正和聚類。所有的細胞都通過UMAP進行可視化,并根據已知群體的標志性基因的表達水平聚類到特定的細胞類型,每個樣本都顯示出細胞組成的差異。作者在LUAD和LUSC的腫瘤和鄰近組織中確定了17個主要的細胞群(圖1c,d),每個細胞類型平均有5050個獨特的轉錄本(圖1e)。分類后的細胞群可分為兩組,非免疫細胞,包括基底細胞(Basal)、肺泡II型細胞(AT2)、肺泡I型細胞(AT1)、纖毛細胞(Cilia)、俱樂部細胞(Club)、內皮細胞(EC)、成纖維細胞(Fib)和神經內分泌細胞(NE)。其余的細胞是構成腫瘤免疫微環境的九個免疫細胞群,包括B細胞(B)、CD4+T細胞(CD4)、CD8+T細胞(CD8)、樹突狀細胞(DC)、粒細胞(Gran)、肥大細胞(Mast)、巨噬細胞(Mφ)、自然殺傷細胞(NK)和調節T細胞(Tregs)(圖1f)。最后,根據第八版肺癌TNM分類法對其原發病人的分類,將每個細胞群分配到腫瘤階段。來自早期階段(I期和II期)的細胞占LUAD的63.2%,而LUSC約87%的細胞來自早期階段的樣本(圖1g)。總之,scRNA-seq分析發現了LUAD和LUSC的多種免疫和非免疫細胞類型,揭示了腫瘤內異質性和不同亞型肺癌的腫瘤微環境。

繪制非小細胞肺癌惡性細胞異質性
為了審視NSCLC惡性細胞的瘤間和瘤內異質性,首先將細胞分為惡性和非惡性細胞類型(圖2a)。對于每種細胞類型,使用inferCNV根據每個染色體區域100個基因的平均表達推斷出拷貝數變異(CNV)。例如,我們在LUAD患者的AT2細胞中發現了大規模的擴增,如CD74、RPS14、GPX3、Chr5的TNIP1、CSNK1D、CD7、CYBC1、NARF、FPXK2、Chr17的TBCD,以及Chr19的MED16、CFD、PTBP1(圖2b),與WCH7和TCGA數據集的WGS標志一致。接下來,作者比較了惡性細胞與非惡性細胞的比例。在LUAD和LUSC中占優勢的惡性細胞分別是AT2和基底細胞(圖2c,d),表明AT2和基底細胞在肺癌異質性形成中的重要性。根據推斷的CNVs,作者將每種細胞類型分為亞克隆(圖2e,f)。為了進一步確定每個亞克隆的關鍵驅動基因和潛在的治療目標,作者計算了具有關鍵臨床價值的基因的擴增情況,包括EGFR、KRAS、BRAF、ERBB2和MET。例如,作者發現在AT2的2號和7號亞克隆(圖2g)和AT1細胞的1號亞克隆、NE細胞的5號亞克隆中,EGFR的擴增達到峰值。這些亞克隆的大部分細胞來自LUAD患者,這與AT1可由成熟的AT2細胞通過EGFR- KRAS途徑更新的觀點一致(圖2g)。此外,與傳統的細胞毒性療法相比,靶向治療顯示出更好的無進展生存期(PFS)和更高的客觀反應率(ORR),并且發現EGFR擴增與TKI療法的敏感性有關。作者還發現MET擴增在基底細胞的3號和6號亞克隆中富集,這些細胞主要來自LUSC患者(圖2h),這與MET作為LUSC的預后作用可以促進腫瘤表型的進展相一致。總之,結果表明AT2和基底細胞的特定亞克隆可能是肺癌中EGFR和MET的潛在治療目標。

確定循環細胞組成模塊
為了全面體現惡性細胞的瘤內異質性,作者在scRNA-seq中確定了細胞組成,然后試圖從bulk RNA-seq中發現大隊列中反復出現的細胞組成模塊。首先根據scRNA-seq中LUAD和LUSC的所有非免疫細胞的組成對樣本進行了分級聚類。值得注意的是,LUAD和LUSC傾向于聚在一起,表明這兩個亞型有不同的細胞組成(圖3a)。為了驗證這一觀察,作者試圖從大型隊列中評估腫瘤和正常肺的RNA-seq的細胞組成,包括TCGA(n=1116)、WCH RNA-seq(n=49)、東亞人組(n=260)、CHOICE(n=490)和GTEx(n=427)。由于大體積樣品由各種細胞類型的異質混合物組成,作者開發了一個去卷積工作流程inferCC(根據scRNA-seq表達特征推斷細胞組成)來評估不同細胞類型的相對比例(圖3b)。作者發現,盡管LUAD、LUSC和正常肺的大量RNA-seq來源不同,但細胞組成高度一致(Pearson相關性r>0.8,圖3c)。事實上,細胞組成可以區分WCH(圖3d)、TCGA(圖3e)和CHOICE中的LUAD和LUSC樣本,以及東亞隊列中的LUAD和鄰近組織。接下來作者通過去卷積方法的曲線下面積(AUC)分析確認了可靠性。基于這些細胞組成,能夠使用支持向量機(SVM)對肺癌亞型進行正確分類,準確率很高(圖3f,AUC=0.89,SD=0.01),表明inferCC解卷的細胞組成可用于肺癌患者的分類。綜上所述,分析顯示LUAD和LUSC擁有不同的細胞組成,這在形成其異質性方面發揮了重要作用。作者進一步確定,基底是LUAD和LUSC之間異質性的主要來源之一,而成纖維細胞和NE是區分兩個腫瘤亞型和其鄰近組織的關鍵細胞類型,表明這些細胞類型在NSCLC中具有重要意義(圖3g)。接下來,作者試圖根據LUAD和LUSC的細胞組成來確定其亞組。在LUAD中,確定了四個組。AT2-high、Fib-high、AT1-high和NE-high(圖3h)。這四個亞型在TCGA隊列中得到進一步證實(圖3i)。值得注意的是,在TCGA中,被歸類為Fib-high的患者與LUAD的預后不良有關(P = 0.016,對數檢驗,圖3l)。在LUSC中,發現了四個主要組別:basal-high、fib-high、AT2-high和NE-high(圖3j),并利用TCGA隊列進行了驗證(圖3k)。 重要的是,作者發現AT2-high(P = 0.0043,對數檢驗,圖3m)可以促成LUSC的不良生存。這一部分的結果表明,特定的細胞組成可能對預測肺癌的預后有重要的潛在價值。

修飾LUAD和LUSC的細胞間相互作用
細胞間相互作用的改變在腫瘤進展中起著重要作用。為了闡明NSCLC兩種亞型中每種配體受體相互作用的重新分布,作者進行了細胞間相互作用(CCI)分析,并根據CellPhoneDB計算每種細胞類型中受體配體的數量。包括AT2和Fib細胞在內的非免疫細胞類型的細胞間相互作用在LUAD和LUSC之間發生了轉變(圖4a)。相比之下,免疫細胞的細胞相互作用在兩個亞型之間沒有明顯的變化。結果強調了免疫和非免疫細胞以及NSCLC兩個亞型之間的細胞相互作用的差異。鑒于LUAD的Fib-high、AT2-high和LUSC的Basal-Fib hybrid與預后不良有關,作者接下來關注AT2和成纖維細胞在LUAD和LUSC的CCI。結果顯示,與鄰近組織相比,LUSC和LUAD的CCI明顯增加(圖4b, c)。此外,GO注釋表明,AT2、Fib和Mφ之間的配體和受體在白細胞遷移、激活和肽基酪氨酸相關通路中富集(圖4d,e)。例如,作者發現酪氨酸激酶受體TYRO3和GAS6、免疫抑制受體LILRB2和HLA-F之間的受體配體配對特別發生在LUSC的AT2細胞中(圖4f),而AXL和GAS6之間的相互作用在LUAD的成纖維細胞中觀察到,但在其鄰近組織中沒有(圖4g),與它們在NSCLC中的潛在功能一致。事實上,以前的研究發現,TYRO3和GAS6可能促進Mφ極化為促進腫瘤的M2表型,而LILRB2也與在NSCLC中可以促進腫瘤浸潤的髓細胞極化為炎癥表型有關。這一部分的結果顯示,LUAD和LUSC的CCI增加,一些受體配體配對可能在NSCLC中發揮功能作用。

惡性和階段特異性基因改變
為了揭示基因表達變異與腫瘤內/腫瘤間異質性之間的關系,作者對LUAD和LUSC中每種細胞類型的惡性和非惡性細胞進行了差異表達分析。與非惡性細胞相比,惡性細胞中有數千個差異表達基因(DEGs)。值得注意的是,AT2、基底細胞、NE細胞在惡性細胞中具有最高數量的上調或下調基因(圖5a)。為了確定兩種亞型共有的上調基因,作者比較了不同細胞類型中亞型特異性和共同DEGs的百分比。例如AT2和NE細胞的DEGs中只有20%和8.93%的LUAD和LUSC共有基因(圖5b)。作者進一步構建了一個基于上調基因的TF調控網絡。家族特異性腫瘤抑制因子NKX2-1被鑒定為LUAD中AT2細胞的關鍵調控因子之一(圖5c),該網絡揭示了S100A13,一個參與鈣結合和細胞周期進程的基因,受NKX2-1的調控。事實上,與良性孤立性肺結節(BSPN)相比,S100A13在LUAD中轉錄起始位點(TSS)附近有更高的ATAC-seq峰。與惡性AT2的高表達相一致(圖5d)。在LUSC的網絡分析中發現了包括KLF5和MYC在內的關鍵的基底細胞TF,其在肺癌患者中的擴增和過表達與之一致,是早期腫瘤的預后標志。接下來,作者對惡性細胞上調基因進行了GO和DOSE分析。在LUAD中,AT2細胞富集了來自未折疊蛋白反應、免疫細胞和mRNA代謝過程調控的基因。在LUSC中,基底細胞富含免疫反應、蛋白折疊、I型干擾素、白細胞和細胞活化。
為了研究腫瘤階段性的調節,作者對每種細胞類型進行了差異基因表達分析(DEG),進一步構建了AT2(LUAD)和基底(LUSC)細胞的基因模塊。結果發現在I期患者的細胞中有許多與腫瘤相關的基因,包括LUAD的AT2細胞中的PIGR、AZGP1、BTG2、EGR1和LMO3(圖5e),以及LUSC的基底細胞中的AQP3、SPHK1、PPT1和PDIA6(圖5f)。最后,作者探討了惡性細胞中的上調基因S100A13和LUAD中AT2的階段I上調基因AZGP1以及LUSC中基底細胞的PPT1的潛在功能。S100A13是S100鈣結合蛋白的一個成員,在細胞周期進展和膜通透性方面發揮作用。AZGP1在脂質動員中發揮重要作用,并有助于惡性腫瘤相關的惡病質,而PPT1編碼的小糖蛋白通過從半胱氨酸殘基上去除硫酸鹽連接的脂肪酰基而參與脂質分解。此外,S100A13(P=7.29e-4,t檢驗)、AZGP1(P=6.31e-4,t檢驗)和PPT1(P=1.18e-4,t檢驗)的過表達,顯著增加了肺癌H1299細胞的增殖(圖5g)。此外,轉孔實驗也證實AZGP1、S100A13和PPT1增強了H1299細胞的遷移和侵襲能力(圖5h ,j),表明這些基因的致癌作用。綜上所述,研究結果確定了LUAD和LUSC的轉錄組改變,并揭示了AZGP1、S100A13和PPT1基因在腫瘤發生中的潛在功能,這些基因在早期DEGs中被發現,表明它們是早期診斷和治療的潛在生物標志物和目標。

LUAD中AT2子簇的明顯特征
為了進一步了解LUAD中關鍵AT2細胞的亞簇,作者重點研究了21465個惡性AT2細胞及其5個亞簇。簇1、2和4的細胞主要來自早期(I和II期)肺癌患者,而簇3和5的細胞主要來自晚期(III和IV期)患者(圖6a)。為了說明AT2細胞的轉錄軌跡,作者使用URD進行了假時間分析。推斷擬時間結果反映280個細胞之間的階段(圖6 b, c)。這些結果符合stage-specific基因模塊(圖5 e), 表明AT2早期和晚期的病人之間的細胞轉錄組差異。為了評估每個亞群的生物學功能,作者將每個亞群的標記基因與來自人類肺單細胞圖譜的標記基因進行比較,其中11個基因被分為AT2一般和AT2信號選擇性(AT2-s)、AT1一般標記基因和亞群特異性基因。有趣的是,作者觀察到正常和惡性AT2細胞之間有一些一致的表達模式。AT2通用標記顯示在所有集群廣泛表達 (圖6 d)。值得注意的是,AT2-信號通路(AT2-s)基因,包括WNT通路的配體(WNT5A)、調節蛋白(CTNNBIP1)共受體(LRP5)和轉錄因子(TCF7L2),據報道與罕見的WNT活性AT2細胞亞群同源,可能是肺泡干細胞。簇1、2、3和4傾向于AT2信號基因的高表達,而簇5中AQP5、AXIN2和GSTA1的表達最低(圖6d)。在比較簇間的干細胞得分時,簇5具有干細胞潛能的細胞比例與其他簇相比相對較低(圖6e),這表明不同腫瘤分期的細胞具有不同的干細胞潛能的細胞組成。接下來,作者比較了這些亞群中預后生物標志物、藥物靶點(圖6f)和可靶向突變(圖6g)的基因表達水平。它們在簇5中的表達相對較高,表明目前的預后標志物和藥物局限于晚期分化細胞的基因,而不是針對腫瘤早期的增殖簇。為了研究增殖集群標記基因的功能含義,作者評估了七個基因,包括一般標記(ANXA1),集群1(AQP5,ATF3,AZGP1和CHI3L1),集群2(SPINK1)和集群4(EFF1A2)。ANXA1在所有集群中都有高表達。作者通過免疫熒光染色實驗驗證了ANXA1蛋白在LUAD腫瘤和正常組織中的表達,ANXA1的過表達表明它可能通過增強增殖來促進腫瘤的發展。更重要的是,與正常對照組相比,AQP5的免疫熒光染色以及AT2標記物SPB在LUAD腫瘤組織的AT2細胞中上調(圖6h),并且AQP5在肺癌H1299細胞中的過度表達增強了增殖(圖 6i,P=1.13e-4,t檢驗),高水平的AQP5與較好的預后(圖6j,P=0.045)和肺癌細胞的侵襲能力有關,表明AQP5有促進腫瘤的作用(圖6k,l),與它通過誘導上皮間質轉化(EMT)過程促進腫瘤發生的作用一致。根據過表達實驗結果,集群1(ATF3、AZGP1和CHI3L1)、集群2(SPINK1)和集群4(EFF1A2)的其他標記物也被發現可以促進腫瘤的發生。總之,作者在惡性AT2細胞中發現了一些具有明顯特征的簇,其中一些類似于增殖細胞(簇1-4),而另一些(簇5)則傾向于第三期患者的分化,實驗驗證的六個標記基因可能具有潛在的臨床價值。

LUSC基底細胞分化亞群
基于細胞模塊的分析,基底細胞被證明是LUSC的關鍵細胞類型之一。為了確定基底細胞亞群的特征,作者集中研究了8202個惡性細胞,這些細胞可分為七個群。聚類1、3、4和7主要由來自早期(I期和II期)患者的基底細胞組成,而聚類5和6是不同階段的混合體,聚類2則全部來自III期(圖7a)。在偽時間分析中,來自II期的細胞與I期和III期的細胞有偏差(圖7b,c),這與II期有最多的階段性特異基因相一致(圖5f)。為了了解每個集群的生物學特性,作者將集群特異性基因(圖7d)與人類肺細胞圖譜中的基因進行比較。結果發現,基底的一般標志物在所有集群中廣泛表達,而近端基底的標志物(Bas-px)在集群7中高度表達,分化基底的標志物(Bas-d)在集群3中選擇性表達(圖7d)。值得注意的是,集群4選擇性地表達了增殖基底(Bas-p)的標志物,包括MKI67、TOP2A、PBK和GTSE1。作者進一步利用干性和細胞循環得分,發現第4簇的干性得分最高,主要被歸類為循環細胞(圖7e,f),表明該簇可能具有增殖細胞的特征。最后,作者通過實驗研究了集群4的特異性KPNA2(karyopherin alpha 2)和集群7的PPT1。與正常肺組織相比,通過免疫熒光染色觀察到腫瘤組織中KPNA2蛋白的表達增加(圖7g)。綜上所述,這部分結果揭示了類似于正常肺細胞亞群的惡性細胞群和一個(群4)在惡性基底細胞中具有干性增殖的特征,KPNA2可能促進LUSC的腫瘤增殖。

三. 總結
綜上所述,本研究結合多組學分析建立了肺腫瘤圖譜,并廣泛研究了LUAD和LUSC之間的異質性變化,為了解肺癌亞型之間腫瘤進展的獨特機制提供了有價值的資源。為肺癌的早期診斷和治療提供了藍圖。
參考文獻
Zhang, L., et al., Integrated single-cell RNA sequencing analysis reveals distinct cellular and transcriptional modules associated with survival in lung cancer. Signal Transduct Target Ther, 2022. 7(1): p. 9.