人乳腺癌單細胞深度解析

今天給大家介紹一篇人乳腺癌的單細胞測序文章,該篇文章發表在Nature Genetics,該期刊在最近一年的影響因子為38.33,比上一年增加了10.727。中科院大類: 生物學 1區中科院小類: 1區 遺傳學。這篇文章最大的特色是深度解析人乳腺癌單細胞測序。

根據雌激素受體(ER)、孕激素受體(PR)的表達和人表皮生長因子受體2(HER2)的過度表達或HER2基因ERBB2的擴增,對乳腺癌進行臨床分層。形成了三個與預后相關并確定治療策略的廣泛亞型:Luminal(ER+,PR+/?);HER2+(HER2+,ER+/?,PR+/?);以及三重陰性乳腺癌(TNBC;ER?,PR?,HER2?)。根據使用PAM50基因signature的轉錄圖譜,乳腺癌也被分成五個“intrinsic”分子亞型:luminal(官腔樣型)樣型(Luma和Lumb);HER2富集型(HER2E);基底樣型;以及正常型。分子亞型和臨床亞型之間有大約70-80%的符合率。雖然PAM50對預后和治療提供了重要的見解,但目前對這些亞型在細胞分辨率上的功能理解是有限的。
人類乳腺癌的高分辨率細胞景觀
總共有130,246個單個細胞通過了質量控制,并使用規范的譜系標記進行了注釋(Fig. 1a,b)。使用已發表的基因signatures進一步證實了這些高級注釋。所有主要細胞類型在腫瘤和臨床亞型中均有表達(Fig. 1c)。正如先前在其他癌癥中所報道的那樣,UMAP可視化顯示按腫瘤清楚地分離上皮細胞,盡管三個簇包含來自多個患者和亞型的細胞(Fig. 1d,e)。這些細胞經鑒定為正常乳腺上皮細胞(Fig. 1f)。由于乳腺癌在很大程度上是由DNA拷貝數變化驅動的,作者使用inferCNV估計了單細胞拷貝數變異(Cnv)譜,以區分腫瘤和正常上皮細胞(Fig. 1f)。這揭示了患者特有的拷貝數變化,以及在乳腺癌中常見的那些變化,例如管腔癌中chr1q的增加和基底樣癌中chr5q的丟失。

SCSubtype:scRNA-seq數據的內在子類型
由于單細胞數據固有的稀疏性,作者開發了一種與scRNA序列兼容的內在分子分型方法。作者根據每個腫瘤的scRNA-seq構建了“Pseudobulk”圖譜,并應用了PAM50質心預測因子。為了確定一個穩定的訓練集,作者使用了使用大約2,000個基因的固有乳腺癌基因list3和1,100個乳腺腫瘤的癌癥基因組圖譜(TCGA)數據集,對Pseudobulk進行了分層聚類。訓練樣本選自在Pseudobulk PAM50亞型和TCGA聚類之間具有一致性的樣本。對于訓練數據集中的每個PAM50亞型,作者進行了腫瘤細胞和差異基因表達的成對整合,以確定4組定義單細胞衍生分子亞型的基因。作者將這些基因定義為“SCSubtype”基因signatures(Fig. 2a)。SC亞型顯示,在20個樣本中,有13個腫瘤細胞不到90%屬于一個分子亞型,而只有一個腫瘤(CID3921;HER2E)顯示出完全同質的分子亞型(Fig. 2b)。在一些腔內腫瘤和HER2E腫瘤中,SC亞型預示著少量的基底樣細胞,并且作者在兩個ER+的病例中用免疫組織化學(IHC)證實。在其他ER+的腫瘤細胞中,有少量形態上的惡性細胞ER陰性,細胞角蛋白-5(CK5)陽性,細胞角蛋白-5(CK5)是基底細胞標志物(Fig. 2c). 為了進一步驗證SCSubtype,作者計算了上皮細胞分化度(DScore)和增殖度,這兩個指標都與每個細胞的分子亞型獨立相關。Basic_SC細胞傾向于低DScore和高增殖分數,而Luma_SC細胞顯示高DScore和低增殖分數(Fig. 2d),正如在TCGA中觀察到的PAM50亞型。


驅動腫瘤細胞異質性的復發基因模塊
以前的方法依賴于“bulk”分子亞型的先驗知識來開發分類器。為了補充這一點,作者以一種無監督的方式調查了驅動腫瘤內轉錄異質性(Itth)的信號通路,使用至少50個腫瘤細胞的整合聚集性,產生了574個itth的基因signatures。基因集富集鑒定了這些轉基因生物共有的和不同的功能特征(Fig. 2e) GM4在包括MKI67、PCNA和CDK1在內的基因驅動下,獨特地富集了細胞周期和增殖的特征(例如,E2F_靶標)。GM3主要富集干擾素反應(IFITM1/2/3,IRF1),抗原呈遞(B2M;HLA-A/B)和上皮-間質轉化的標志(EMT; VIM, ACTA2)。Gm1和Gm5具有雌激素反應途徑的特征,而Gm1也富集到缺氧、腫瘤壞死因子-α和p53信號轉導以及細胞凋亡等通路上。當將所有腫瘤細胞的簽名分數關聯起來時,也可以看到類似的功能關聯。對于每個腫瘤細胞,作者計算了七個GMs的簽名分數,并使用分層聚類來識別細胞相關性。這清楚地將腫瘤細胞分組,減少了圖1d-f中所見的巨大的腫瘤間變異性。作者還發現有一些模塊與SCSubtype調用相關聯,而其他模塊則顯示與更多樣化的子類型關聯(Fig. 2f,g)。最后,作者使用基于GM的細胞狀態分配來觀察腫瘤細胞在腫瘤內的異質性。類似于SCSubtype(Fig. 2b),作者看到了細胞異質性的證據,這種異質性與腫瘤亞型大致一致,但不受腫瘤亞型的限制(Fig. 2h)。SCSubtype和GM分析為腫瘤性ITH的分類提供了互補的新方法,并提供了進一步的證據表明癌細胞在大多數腫瘤中表現出不同的表型。
乳腺癌的免疫環境
為了高分辨率地檢測乳腺腫瘤的免疫環境,作者將免疫細胞重新聚集,以鑒定T細胞和先天淋巴樣細胞、髓系細胞、B細胞和漿母細胞。作者使用轉錄本和表位的細胞索引通過測序(cite-seq)對4個樣本進行免疫表型分型,并進行基于錨點的整合以將蛋白表達水平轉移到剩余的病例,這顯示出與實驗測量值高度相關。
淋巴細胞和先天淋巴樣細胞
作者在患者中識別了18個T細胞和先天淋巴細胞團(Fig. 3a)。CD4簇包括CD25蛋白標記的FOXP3+的調節性T(Treg)細胞(CD4+T細胞:Foxp3/c2)、濾泡輔助T(TFH)細胞(CXCL13、IL21和PDCD1;CD4+T細胞:CXCL13/c3)、幼稚/中央記憶CD4+(CD4+T細胞:CCR7/c0)和1型輔助T(TH1)CD4效應記憶T(TEM)簇(CD4+T細胞:IL7R/C1)(Fig. 3b)。作者還根據自然殺傷細胞(NK細胞:AREG/C9)和自然殺傷T細胞(NKT細胞:FCGR3A/C10)的αβT細胞受體和NK標志(KLRC1、KLRB1、NKG7)的表達,鑒定了NK細胞(NK細胞:AREG/C9)和自然殺傷T樣細胞(NKT細胞:FCGR3A/C10)(Fig. 3b) 。與TNBC中TILs和CD8+T細胞的富集相一致,T細胞簇Ifit1/c6、LAG3/c8和MKI67/c11在TNBC樣本中所占比例較高(Fig. 3c)。這些群集在臨床亞型之間有質的差異,在TNBC病例中,來自LAG3/c8和IFNG/c7群集的CD8+T細胞具有顯著更高的功能障礙分數(Fig. 3d)。此外,腔內腫瘤和HER2+腫瘤的檢查點分子表達不同于TNBC (Fig. 4f)。值得注意的是,在TNBC中,LAG3/c8缺失的CD8亞群PD-1(PDCD1)、LAG3以及CD27和CD70的配體-受體對的表達明顯增高,這些亞群可以增強T細胞的細胞毒性(Fig. 4f)。作者檢測了PDCD1、CD27、LAG3和CD70在乳腺癌國際聯合會(METABRIC)40個隊列的分子分類中的表達,這些分子在基底樣亞型和HER2+亞型中持續富集。當作者使用無監督的分層聚類檢查整個數據集中時(更廣泛的免疫檢查點分子列表),臨床亞型之間檢查點分子表達的差異更為明顯,包括在CAF等非免疫細胞。這些數據提供了對每種亞型疾病最合適的免疫治療策略的見解。當作者重新聚集B細胞時,作者觀察到兩個主要的亞群(幼稚和記憶B細胞),其中漿母細胞形成一個單獨的簇。另外的亞群似乎主要是由B細胞抗原受體特異性基因片段驅動的,而不是可變的生物基因表達程序。

髓系細胞
髓系細胞形成13個簇,在所有腫瘤中都能以不同的頻率被識別出來(Fig. 4a)。沒有檢測到粒細胞,可能是因為它們對腫瘤解離方案的敏感性和它們的低豐度。單核細胞形成三個簇:Mono:IL1B/c12;Mono:S100A9/c8;和Mono:FCGR3A/c7。Mono:FCGR3A群體形成了一個以CD16蛋白高表達為特征的獨特的小簇(Fig. 4b,c)。值得注意的是,作者發現了兩個新的巨噬細胞群(LAM1:FABP5/c1和LAM2:APOE/c2),超出了傳統的M1/M2分類,占總髓系細胞的30-40%(Fig. 4a–c)。這些細胞與在肥胖小鼠和人類中擴張的脂質相關巨噬細胞(LAM)群體具有密切的轉錄相似之處,包括TREM2和脂質/脂肪酸代謝基因(如FABP5和APOE)的高表達(Fig. 4c)。LAM1/2獨特表達CCL18,其編碼的趨化因子在免疫調節和腫瘤促進中起重要作用。作者觀察到在HER2+腫瘤中LAM1:FABP5細胞的比例大大降低(Fig. 4d)。提示腫瘤基因組學或微環境的獨特特征決定了LAM1/2的命運。使用METABRIC隊列進行的生存分析表明,LAM1:FABP5特征與較差的生存相關(Fig. 4e)。而編碼PD-L1(CD274)和PD-L2(PDCD1LG2)的RNA在Mac:CXCL10和DC:LAMP3髓系群體中高度共表達(Fig. 4f)。對CITE-SEQ數據的分析表明,PD-L1和PD-L2蛋白在Mac:CXCL10,LAM1:FABP5,LAM2:APOE和DC:LAMP3簇中的表達分布更廣(Fig. 4b)。強調LAM1/2是免疫調節分子的重要來源。


基質亞類與不同的分化狀態相關
在間質隔室中,作者鑒定出三種主要的細胞類型(Fig. 5a,b)。包括CAFs(PDGFRA和COL1A1Fig. 5c,d) 血管周圍(PVL)細胞(MCAM/CD146、ACTA2、PDGFRb;Fig. 5e,f), 內皮細胞(PECAM1/CD31和CD34;Fig. 5g,h),外加兩個較小的淋巴管內皮細胞群(LYVE1)和循環PVL細胞群(MKI67)。用Monocle 2進行的偽時間軌跡分析揭示了五個CAF狀態(Fig. 5c)。對于PVL細胞,作者確定了三種狀態(Fig. 5e) 。PVL S1和S2表達與干細胞、未成熟周皮細胞(PDGFRb、ALDH1A1、CD44、CSPG4、RGS5和CD36)和粘附分子相關的標記(ICAM1, VCAM1 and ITGB1)有關。它們進一步在與受體結合和血小板衍生生長因子活性相關的通路上富集。RGS5、CD248和THY1定義S2的分支。與基因表達一致,在早期PVL狀態s1和s2中,CITE-SEQ顯示細胞表面CD90(THY1)以及整合素分子CD49a和CD49d出現富集(Fig. 5i,j)。隨著細胞向PVL s3過渡,這些標志物的表達下降,PVL s3富含收縮相關基因(MYH11和ACTA2)(Fig. 5f),以及與平滑肌表型相關的通路。PVL狀態部分富集到肌成纖維細胞樣CAF基因特征。CAF標記物ACTA2的共同表達提示PVL S3細胞歷史上在IHC分析中被錯誤地歸類為CAF。作者確定了三種內皮狀態(Fig. 5g)。內皮S1類似于柄狀內皮細胞和小靜脈內皮細胞(ACKR1, SELE and SELP),并且富集到與細胞粘附相關的途徑 (ICAM1和VCAM1)和抗原提呈/主要組織相容性復合物(HLA-DRA)。隨著細胞分成兩種狀態,這些標記物隨著偽時間的延長而減少,兩者都伴隨著DLL4的表達升高,DLL4是一種內皮尖狀細胞的標記物(Fig. 5h)。

繪制乳腺癌異質性的空間圖譜
為了深入了解細胞類型的空間組織,作者對6個樣本進行了空間分辨轉錄組學研究,其中包括來自作者scRNA-seq隊列的兩個ER+(CID4535和CID4290)和兩個TNBCs(CID44971和CID4465),以及另外兩個TNBCs(1142243F和1160920F)(Fig. 6a)。 為了解每個大約55微米直徑斑點的細胞組成,作者應用了一個立體顯微鏡的概率模型,使用的是臨床亞型匹配的scRNA-seq數據。細胞類型與其適當的病理注釋相關聯(Fig. 6b)。作者早些時候表明,GMs富集了不同的微環境相關途徑和因子。作者在6個病例中通過立體顯微鏡和病理學鑒定癌細胞的位置。然后檢查了7個GM signatures的強度。這揭示了在TNBC病例中GM3(EMT、IFN、MHC)和GM4(增殖)的預期富集,以及在ER+病例中GM1和GM5(ER、Luminal)的預期富集(Fig. 6c)。這些數據表明,這些GM不是基于解離方法的產物。為了系統地理解模塊之間的空間關系,作者計算了所有癌癥部位GM評分之間的皮爾遜相關性。這揭示了這兩個簇在六個案例中大部分是保守的,其中一個簇包括GM1、GM3、GM5和GM6,而另一個簇則是GM2和GM4 (Fig. 6d)。 有趣的是,GM3(EMT、IFN、MHC)和GM4(增殖)在所有樣本中都顯示出強烈的負相關(Fig. 6e–g)。這表明這些不同的癌癥表型發生在乳腺癌的相互排斥的區域。

繪制新的異型細胞相互作用圖
6個病例中有5個病例發現了肌成纖維細胞樣CAF和iCAF之間存在適度的負Pearson相關性(Fig. 7a–c)。在7例HER2+乳腺腫瘤的獨立空間轉錄學數據集中,CAF定位是一致的,這表明這種關系在臨床亞型中是保守的(Fig. 7a)。與上述iCAF的免疫調節特性一致,iCAF在兩項研究中都與幾個淋巴細胞群體共定位,包括記憶/幼稚B細胞和CD4+/CD8+T細胞(Fig. 7a 和 Fig. 7d,e)。6例肌成纖維細胞樣CAF與CD8+T細胞的相關(Fig. 7a),這提示可能與高TIL浸潤或具有炎癥表型的浸潤性乳腺癌的功能相關。為了探索這些區域的CAF-淋巴細胞相互作用的潛在介質,作者研究了CAF和CD4+/CD8+T細胞最豐富的部位的頂端配體-受體相互作用,并通過scRNA-seq檢測到了這兩種細胞類型所檢測到的頂端配體-受體相互作用。這揭示了免疫調節因子配體和同源T細胞受體的富集,包括趨化因子(CXCL12/CXCL14-CXCR4和CXCL10-CXCR3)、補體途徑、轉化生長因子-β(TGFB1/TGFB3-TGFBR2)和淋巴細胞抑制/激活分子(LTB-LTbR、TNFSF14-LTbR和LTB-CD40、VTCN1/B7H4-B) (Fig. 7f)。通過將信號預測與周圍細胞鄰相結合,發現這些數據突出了CAF直接調節免疫細胞。在所有Viium病例中,LAM1和LAM2細胞均出現在浸潤性癌區;然而,從形態學上看,LAM2也存在于間質細胞、脂肪細胞和淋巴細胞的區域。LAM1和LAM2細胞在大多數情況下表現出適度的空間負相關,這可能表明一個共同的LAM細胞通過其局部的TME向LAM1或LAM2極化(Fig. 7a) 在三種亞型的八種腫瘤中,LAM2細胞而不是LAM1細胞與CD4+和CD8+T細胞呈正相關(Fig. 7a) 此外,在許多病例中,Mac:CXCL10/c9和CD8T細胞之間存在正的Pearson相關性(Fig. 7a),這主要集中在標記為浸潤性癌+間質+淋巴細胞的斑點上(Fig. 7g)。提示這些生態位在調節抗腫瘤免疫方面可能具有功能相關性。

乳腺腫瘤生態型與患者生存相關。
作者的單細胞數據產生了乳腺腫瘤的細胞分類方案,在26個腫瘤中觀察到細胞頻率的顯著變異和重復模式。于是作者假設乳腺癌的亞群可能具有相似的細胞組成和腫瘤生物學。并且對METABRIC隊列中的所有原發性乳腺腫瘤數據集進行了去卷積。共識聚類顯示,有9個腫瘤簇具有相似的估計細胞成分(‘ecotypes’) (Fig. 8a–c)。這些生態型與腫瘤亞型、SC亞型細胞分布和多種主要細胞類型相關(Fig. 8a)。生態型3(E3)的腫瘤富含Basal_SC、Cycling和Luminal_前體細胞(推測是基底乳腺癌的起源細胞)和基本PAM50亞型(Fig. 8a,b)。而E1、E5、E6、E8和E9則以腔細胞為主。生態型還具有獨特的基質和免疫細胞富集模式。E4高度富集到與抗腫瘤免疫相關的免疫細胞(Fig. 8a) 。包括耗竭的CD8T細胞(LAG3/c8)、TH1(IL7R/C1)和中央記憶性CD4 T細胞(CCR7/c0)。E2主要由LumA和正常樣腫瘤組成(Fig. 8b) 。至于預后,E2腫瘤患者的預后最好(Fig. 8d,e)。而E3的腫瘤與較差的5年存活率有關(Fig. 8d)。這與已知的基底細胞樣高增殖性腫瘤預后不良是一致的。E7預后也較差,以HER2E腫瘤和HER2E_SC細胞富集為主。E4也有較高的HER2E和基底樣瘤富集(Fig. 8b),然而,這些患者的預后明顯好于E7 (Fig. 8f)。可能是由于抗腫瘤免疫細胞的滲透所致。


在這項研究中作者為乳腺癌分類提供了一個完整的細胞模型的重要進展。從三個層面定義了乳腺腫瘤的細胞結構。首先,詳細介紹了包括脂肪細胞、肥大細胞和粒細胞的細胞類型。作者通過對完整組織進行空間轉錄,部分解決了這一問題。與此同時,未來的工作可能會應用互補技術,如單核或基于微孔的測序。其次是每個臨床亞型的病例數量有限,這限制了作者估計亞型特異性特征的能力。