空間轉錄組測序技術(ST)能夠將基因表達情況與感興趣組織切片的染色圖像進行整合,將組織內細胞的基因表達信息定位到原始空間位置上,從而直接觀測組織中不同區域基因表達的差異。小編今天和大家分享一篇今年一月剛剛發表在CANCER RESEARCH(IF:13.312)雜志上關于三陰性乳腺癌空間轉錄組分析的文章。文章利用空間轉錄組數據識別出了三陰性乳腺癌的保守結構,并對其功能及預后影響進行了分析,文章邏輯清晰,簡單易懂,對空間轉錄組感興趣的小伙伴不要錯過呀。
Spatial transcriptomic analysis of a diverse patient cohort reveals a conserved architecture in triple-negative breast cancer
不同患者隊列的空間轉錄組分析揭示三陰性乳腺癌的保守結構
一、研究背景
乳腺癌是最普遍的女性癌癥,分為不同的組織學和分子亞型。其中,三陰性乳腺癌(TNBC)是一種不表達雌激素受體、孕激素受體或HER2擴增的乳腺癌。由于TNBC具有更強的侵襲性,且易發生早期轉移,因此在臨床治療上具有挑戰性。此外,TNBC與其他乳腺癌亞型相比也表現出更高的復發率及更差的預后,而且由于TNBC缺少可操作靶點的表達,使得開發有效的治療方法更加困難。因此,該文章利用空間轉錄組數據來研究TNBC,以期能夠全面注釋其空間結構并探索細胞亞群的轉錄狀態。
二、文章摘要
研究對14例TNBC患者的28個切片隊列中的38706個空間特征進行了空間轉錄組分析。研究發現腫瘤內各個切片的空間特征表現出不同的轉錄亞結構。研究進一步對所有樣本進行綜合分析識別了9個不同的轉錄亞群。此外,研究使用連接計數分析也發現了共享轉錄亞群的非隨機定向空間依賴性,證明了TNBC中存在保守的空間轉錄結構,這些發現也在獨立的驗證隊列中得到了證實。此外,研究也分析了這些轉錄亞群的功能及預后影響。
三、文章的主要內容及結果
1. 樣本的選擇及空間轉錄組
文章第一部分對使用的樣本及空間轉錄組數據進行了介紹。研究選擇了14例原發性TNBC腫瘤樣本進行研究,并從每個腫瘤中獲得兩個組織切片。因此,研究隊列包括28個TNBC組織切片,接著作者進行了空間轉錄組(ST)研究,研究流程如圖1所示。最終,平均每個樣本產生了1382個空間特征的表達數據,接著研究對每個樣本的表達數據進行標準化,后續分析均使用標準化的數據進行。

2. 樣本的人工及基因特征注釋
這一部分文章對樣本的注釋進行了介紹。研究首先由解剖病理學家根據染色圖像對每個樣本的癌組織進行了手動標注(圖2A),結果發現切片以腫瘤和纖維化區域為主,而壞死區域、脂肪組織和免疫浸潤較少。接下來,研究使用ESTIMATE定義每個樣本的轉錄結構,發現ESTIMATE結果與組織手工注釋結果緊密相關,例如樣本094D(圖2A)中,ESTIMATE的間質評分展示了廣泛的纖維化區域(圖2B),而腫瘤純度評分則準確地識別了腫瘤區域(圖2B-C)。此外,在樣本120D中,人工注釋發現了的密集的淋巴浸潤區域以及纖維化和壞死區域(圖2D),而ESTIMATE評估同樣觀察到了一致的結果(圖2E-F)。接下來研究使用了一組來自腫瘤相關免疫細胞的細胞類型特異性表達特征,對免疫細胞浸潤特征進行進一步刻畫,發現了T細胞富集的空間模式及其余區域巨噬細胞強烈表達的特征(圖2G-H)。接著研究進一步觀察到同一患者的樣本顯示出相似的腫瘤純度(圖2I),且UMAP降維也反映了配對樣本的轉錄的相似性。此外,研究發現在所有樣本中免疫評分和間質評分密切相關,兩者在組織學定義的纖維化區域富集(圖2J)。

3. 聚類揭示了瘤內異質性
這一部分研究對TNBC的遺傳異質性進行了探索。作者首先在單個樣本內使用ST數據進行無監督聚類,結果觀察到低分辨率的空間特征聚類識別的腫瘤和間質區域與基于組織學和信息學注釋的結果一致(圖2A-B)。此外,研究也觀察到腫瘤及間質存在不同的轉錄區域(圖2A-B)。研究發現樣本平均包含4個腫瘤亞群和1個非腫瘤亞群(圖2C)。接著,研究基于表達數據對樣本094D進行聚類分析,識別出6個亞群(圖3A-B),其中3個亞群腫瘤純度高,還有一個亞群表現出較低的腫瘤純度,為纖維化的亞群(圖3C-D)。研究也觀察到樣本中混合Lehmann等人定義的TNBC亞型(圖3E)。接下來研究通過差異表達識別了每個亞群的表達特征(圖3F-G),并通過基因集富集分析(GSEA)來識別每個亞群富集的分子通路(圖3H),研究也觀察到亞群水平的GSEA的結果與特征水平的富集結果一致(圖3I)。

4. 數據整合及共享細胞亞群的識別
在這一部分作者研究了TNBC共享的空間轉錄特征。研究首先整合了所有特征的表達數據,接著進行聚類分析,得到9個整合亞群(ICs)(圖4A),然后作者對亞群中可以映射回單個樣本的特征進行了分配來評估跨樣本及切片的聚類子結構(圖4B)。結果發現亞群IC3、IC6和IC7可能代表間質免疫細胞,而其余亞群則主要是腫瘤細胞并具有不同的腫瘤純度(圖4C)。此外,研究也發現每個IC都以不同的比例出現在所有個體樣本中(圖4D)。研究進一步評估了IC的標記基因(圖4E),發現標記基因與各自的IC共定位(圖4F)。接下來,研究對IC表達數據進行GSEA分析,發現IC5中富集缺氧特征,而IC9參與干擾素α和γ反應通路(圖4G)。接著作者對IC的表達數據進行CIBERSORTx分析,結果發現與ESTIMATE和GSEA分析一致,IC3的CIBERSORTx得分最高(圖4H)。此外,腫瘤簇IC5具有較高比例的腫瘤相關巨噬細胞,而CD4及CD8 T細胞則相對缺乏(圖4H)。

5. 整合亞群的空間分布
研究在這一部分對整合亞群的空間分布進行了分析。作者使用連接計數分析(JCA)對IC之間的空間相關性進行了研究(圖5A)。接著研究對空間數據進行光柵化并保持分類信息(圖5B-C),結果發現空間上接近的觀測結果有許多相似的鄰居和連接(圖5D),而空間分散的觀測結果則展現出鄰居不相似性(圖5E)。接著作者將觀察到的每對觀測數據的連接計數與空間隨機條件下的預期結果進行了比較(圖5F)。此外,研究使用z-score表示空間相關性,發現每個IC通常具有強的正自相關特征(圖5G)。接下來作者將JCA應用于所有樣本(圖5H),結果觀察到幾個亞群的空間關系具有一致的模式(圖5I)。

6. 獨立驗證隊列的注釋
在這一部分作者在驗證隊列中驗證了參考隊列定義的IC。驗證隊列中的樣本從II期到III期且具有不同的腫瘤純度(圖6A)。接下來,作者將IC標簽與每個樣本的手動注釋和腫瘤純度評分進行了比較(圖6B-D),且當對所有樣本的腫瘤純度評分進行分析時發現其模式與參考隊列中的模式相匹配(圖6E, 4C)。此外,作者進一步發現參考數據集中識別的IC標記基因與驗證集相對應(圖6F)。此外,JCA結果表明參考隊列中觀察到的所有強空間相關性都在驗證樣本中得到了證實(圖6G-H)。

7. TNBC空間轉錄組揭示種族差異
在文章的最后一部分研究分析了IC的種族差異。研究發現白種人樣本中IC3、IC6和IC8的比例較高,而IC5、IC7和IC9的則主要是美國非裔(AA)樣本(圖7A),且白種人的IC3明顯高于AA樣本,而AA樣本的IC5也顯著更高(圖7B)。作者進一步對IC3和IC5進行分析,CIBERSORTx結果表明IC3在白種人樣本中淋巴細胞和巨噬細胞含量顯著更高,而AA樣本的整體免疫細胞含量較低(圖7C-D)。接著研究驗證了IC5與AA和白種人樣本中高缺氧評分的特征相關(圖7E),且具有高腫瘤純度評分的特征(圖7F)。此外,研究也發現在驗證隊列中NDRG1與IGKC在AA特征的IC5中表達更高(圖8A),其中IGKC高表達具有保護作用(圖8B-D)。相反,NDRG1的高表達與較差的預后相關(圖8E)。


到這里這篇文章的主要內容就介紹完了,文章對空間轉錄數據進行分析識別出了TNBC的一個保守的空間結構。文章的分析方法并不難,但亮點在于使用了熱點的空間轉錄組數據,畢竟空間轉錄組測序技術解決了組織測序難以區分不同細胞的基因表達情況,以及單細胞轉錄組無法解決細胞原始位置表達的難題。如今空間轉錄組數據越來越多,小編覺得做單細胞的小伙伴們也可以考慮加入空間轉錄組分析,畢竟研究切入熱點可能會產生事半功倍的效果。