肺癌的生存率低和預后差已廣為所知,作為全世界范圍內發病率和死亡率都非常高的一種癌癥,其單細胞方向的研究也非常廣泛了。今天給大家介紹的這篇肺腺癌的單細胞文章[Oncogene:9.867],為我們提供了一個新的思路。
Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma

一、數據和代碼:
數據:
代碼:
【這篇文章給的代碼十分清晰,尤其是單細胞數據的前期處理和細胞注釋;以及文章中每個結果和圖,包括作者的數據和代碼結構,大家都可以借鑒學習】
作者代碼和數據存儲
二、背景:
肺癌預后差,占全世界癌癥新發病例和死亡人數的大多數。肺癌最常見的亞型,尤其是不吸煙者,是肺腺癌。在本研究中,作者通過單細胞RNA測序分析了肺腺癌腫瘤微環境中的腫瘤上皮細胞和相關非惡性細胞。發現患者腫瘤微環境的異質細胞組成遵循與癌細胞分化等級相關的特定模式。將我們的研究結果轉化為一個以bulk基因表達為特征的回顧性隊列,揭示了微環境模式的潛在預后相關性。作者的結論是,對肺腺癌微環境的全面分析可能有助于揭示基于癌細胞和微環境特征的新的臨床相關腫瘤亞型。
三、內容和結果:
(一)單細胞RNA測序揭示肺腺癌細胞多樣性
- 為了研究肺腺癌的細胞組成,收集10份正常肺組織和10份肺腺癌組織樣本,并對其進行單細胞RNA測序,在質量控制和篩選后產生114489個高質量的單細胞轉錄組數據(Fig. 1A)。
- 通過UMAP進行分析和可視化顯示,不同組織類型或患者的單細胞轉錄組混合在許多簇中,去除批次效應后,部分形成腫瘤或患者特異性簇,表明潛在的生物學差異(Fig. 1B,C)。
- 為了揭示哪些細胞最能解釋患者間的異質性,作者分析了上皮、免疫和基質細胞marker基因表達的單細胞轉錄組。總共覆蓋了20450個上皮細胞、89766個免疫細胞和4273個基質單細胞轉錄組。
- 上皮轉錄組的產量因組織學亞型而異,因為我們觀察到實體/肉瘤樣癌的頻率<10%,而鱗狀細胞癌/腺泡癌的頻率高達>40%。上皮細胞表現出最高程度的患者間異質性(Fig. 1D)。
Fig.1Single-cell RNA sequencing of lung adenocarcinomas
(二)腫瘤上皮細胞的瘤間異質性反映了分化梯度
- 為了進一步分析上皮細胞中患者間的異質性,對上皮轉錄組重新聚類。基于組織起源,Cluster被定義為正常或腫瘤,其與細胞的拷貝數狀態基本一致,并證明腫瘤純度>90%。
- 基于典型基因marker和基因Signatures,注釋細胞類型。腫瘤細胞cluster與正常細胞細胞cluster分離,腫瘤細胞主要是患者特異性的,表明腫瘤間異質性(Fig. 2A,B)。
- 腫瘤上皮細胞中的差異表達基因按患者分組,每個患者最多顯示前十個基因(Fig. 2C)。不同患者免疫染色表明EGFR、TFF3、CDKN2A和SFTPA2與蛋白質表達相關(Fig. 2D)。
- 按患者分組的腫瘤上皮細胞平均通路活性得分(Fig. 2E)。
- 盡管存在明顯的腫瘤間異質性,作者注意到上皮腫瘤細胞轉錄組在患者亞組中的共同特征。為了強調腫瘤之間的相似性,上皮轉錄組被嵌入低維UMAP中。基于所有腫瘤上皮單細胞轉錄組基因表達的主成分分析;沿著PC1的腫瘤細胞特征模塊分數示意圖(Fig. 2F、G、H)。
Fig.2 肺腺癌中腫瘤上皮細胞的瘤間異質性
(三)、肌成纖維細胞的兩種亞型構成了腫瘤基質微環境
- 第三部分主要介紹肺腺癌間質微環境的組成,作者首先正常和腫瘤組織樣本中的基質細胞進行了分類和分析,根據不同marker的表達主要分為內皮細胞、淋巴管內皮細胞、成纖維細胞、肌成纖維細胞、平滑肌細胞和間皮細胞(Fig.3A、B)。
- 檢測到腫瘤組織中成纖維細胞向肌成纖維細胞簇的轉移,并且在一個獨立的數據集中也觀察到了這一點。
- 值得注意的是,肌成纖維細胞簇2幾乎只存在于腫瘤組織中,而肌成纖維細胞簇1包含正常組織和腫瘤組織。通過對間質微環境中不同細胞類型差異表達基因,發現肌成纖維細胞簇2高表達COL3A1、COL5A1等基因,表明其在細胞外基質重塑中起作用(Fig.3C)。
- 同時,通過計算不同細胞類型信號通路活性,發現肌成纖維細胞簇2表現TGFβ和JAK/STAT信號的高活性以及缺氧誘導相關通路(Fig.3D)。而兩個cluster的相關性分析(Fig.3E)、免疫染色(Fig.3F)驗證肌成纖維細胞簇1和簇2分別代表肌成纖維細胞的“正常樣”和“癌癥相關”表型,并且它們中的任何一個都可以主導基質微環境。
Fig.3 肺腺癌間質微環境的組成
(四)腫瘤免疫微環境表現出促炎和非炎癥特性
- 第四部分作者對免疫細胞進行了分類和分析,通過分析發現腫瘤免疫微環境的細胞組成發生了顯著的定量變化(Fig.4AB)。
- 然后分析不同巨噬細胞cluster的炎癥和M1/M2極化相關的模塊得分,發現cluster 2表達高水平的促炎性趨化因子,如CXCL9和CXCL10、促炎性細胞因子IL1B,以及與免疫反應和M1極化相關的基因特征(Fig.4C)。
- 通過在患者內的促炎癥和非炎癥的相關性分析,確定巨噬細胞cluster 1和2分別代表非炎癥和促炎癥功能(Fig.4D)。
- 通過CXCL9和CD123免疫染色驗證促炎性單核細胞源性巨噬細胞cluster 2和漿細胞樣樹突狀細胞的分布(Fig.4E)
- 分析CD8+T細胞不同cluster的耗竭得分和毒性得分(Fig.4F)。確定耗竭型的CD8+T細胞與促炎性單核細胞源性巨噬細胞和漿細胞樣樹突狀細胞數量顯著相關(圖4G)。
綜上所述,作者確定了從正常肺組織到腺癌患者免疫細胞成分的總體變化,以及導致患者間異質性的不同腫瘤免疫微環境模式。
Fig .4 肺腺癌免疫微環境的組成
(五)、肺腺癌的腫瘤微環境主要有兩種類型
- 為了分析腫瘤微環境中不同細胞普遍性,計算患者骨髓細胞、淋巴細胞、內皮細胞和成纖維細胞/肌肉細胞的細胞比例。
- 基于基質細胞和免疫細胞簇的比例,利用主成分分析,發現腫瘤根據腫瘤微環境的細胞組成形成亞群(Fig.5A)。
- 基于腫瘤微環境的組成,將患者分為不同的亞組——兩種不同的模式(Fig.5B),分析基質細胞和免疫細胞cluster細胞比例的相關性(Fig.5C)。
- 量化兩種模式的受體-配體互作(Fig.5D)。為了測試腫瘤微環境模式是否可以通過患者隊列中的bulk基因表達模式來重現,分析TCGA中533名肺腺癌患者的marker基因的表達。
- 研究這些患者亞組的生物學和臨床相關性,分析TCGA肺腺癌隊列中不同基因特征表達的總體生存率。與CP2E模式的特征相比,N3MC相關基因特征與更好的總體存活率相關。

Fig.5 肺腺癌的腫瘤微環境模式 四、結論:
我們來總結一下這篇文章的整體思路,在拿到肺腺癌的單細胞數據后,正常組織細胞類型和腫瘤微環境中主要細胞類型——上皮細胞、間質細胞、免疫細胞;最后根據腫瘤微環境組成,將患者劃分為兩種模式,并在大規模的bulk數據中得到了驗證。
文章的思路非常簡單,其精彩的點除了最終根據微環境的組織發現患者可以分為兩種模式外;前期的研究非常細致,一點點的解析不同的細胞類型。這樣看來,這篇文章確實很值得學習和借鑒,雖然大家對常規的單細胞流程都比較熟悉了如經過常規的處理和過濾,但是這篇文章的規范化,值得一覽。
最后給大家一個干貨,作者用來注釋細胞類型的marker。對細胞類型marker沒有總結和記錄的崽崽們,拿走不謝。其他腫瘤或細胞類型的marker,大家可以參考相關數據庫。
筆記:
識別細胞類型
獲得細胞類型已知的marker【從文章或者cellMarker、ImmGen數據庫】
通過前期處理后,將細胞進行聚類,識別cluster特異的基因【“Seurat v3 】
對cluster賦予相應的細胞類型【根據marker的表達情況,如果cluster特異高表達某類細胞marker(log2 FC值和FDR_p值在top5或top10以內的差異基因)】
正常細胞類型,一般其marker比較固定,即通過某些marker基因/蛋白的組合就能唯一確定該細胞類型。
有些細胞類型,可以分成多種更為特異的細胞類型,如文章中對免疫細胞、間質細胞的分類等。
肺腺癌細胞注釋marker參考文獻:
Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma [published online ahead of print, 2021 Oct 18]. Oncogene.