整合空間轉錄組和單細胞測序揭示PDAC組織結構
單細胞RNA測序(scRNA-seq)能夠系統地識別組織中的細胞群,但描述其空間組織仍然具有挑戰性。2020年發表在Nature Biotechnology(IF=54.901)上的文章Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas,結合了基于微陣列的空間轉錄組(ST)方法,利用一系列spots揭示基因表達的空間模式。開發了Multimodal intersection analysis (MIA)多模式交叉分析,對原發性胰腺腫瘤應用發現導管細胞、巨噬細胞、樹突狀細胞和癌細胞的亞群具有空間限制。此外,還識別出表達應激反應基因模塊的炎癥性成纖維細胞和癌細胞的共定位。
結果一:用 scRNA-seq 識別 PDAC 中的細胞群
首先收集了兩個未經治療的PDAC患者的新鮮原發腫瘤,用于平行scRNA-seq和ST分析。scRNA-seq 數據每個細胞具有大約 2500 到 3300 個UMI 和大約 1400 到 1700 個唯一表達的基因。分別確定了PDAC-A和PDAC-B腫瘤中的15種和11種不同的種群,共享的細胞類型的基因表達特征顯示患者樣本之間具有很強的相關性,驗證了對樣本群集的注釋。基于scRNA-seq的拷貝數變異(CNV)分析區分PDAC癌細胞和非惡性導管細胞。對于每個已識別的細胞類型推斷染色體擴增和缺失,并檢測到 PDAC-A 中的兩個cluster和 PDAC-B 中的一個cluster顯示異常 CNV。兩個PDAC-A癌癥cluster-1和cluster-2表現出TM4SF1(cluster-1)或S100A4(cluster-2)的高表達,而PDAC-B癌癥集群在TM4SF1表達中高,表明PDAC-A cluster-1和PDAC-B癌癥群的相似性。為了進一步驗證 scRNA-seq 數據中識別的TM4SF1和S100A4表達種群是否代表癌細胞群,在源自同一患者的組織石蠟切片上對 TM4SF1 和 S100A4 進行了雙重免疫熒光染色進一步驗證了這一現象。

結果二:PDAC 組織空間轉錄組
組織切片及H&E染色揭示了PDAC的四個主要區域:癌細胞粘連區、非惡性導管上皮區、基質區域和胰腺腺泡區,其中PDAC-B的患者組織不包含正常的胰腺腺泡區。然后對樣本進行空間轉錄組測序,使用芯片特定位置的barcode對序列進行解碼,識別每個轉錄本在組織內的空間定位。使用 H&E 染色圖像估計每個 ST spot捕獲了大約 20-70 個細胞、約2400個UMI和大約1000個唯一基因。對所有ST spot中表達變異程度最高的基因進行主成分分析(PCA),根據主成分對每個ST陣列的spot進行聚類后,發現所生成的cluster與獨立的組織學注釋一致,支撐了僅根據ST基因表達在一個切片內識別不同空間區域的能力。
結果三:多模式交叉分析 (MIA)
為了集成 scRNA-seq 和 ST 數據集,作者開發了 多模式交叉分析Multimodal intersection analysis (MIA)。首先劃定細胞類型特定和組織區域特定基因集,然后確定它們的重疊程度,相比于隨機數值判斷其重疊程度是否顯著富集。在 scRNA-seq 數據中識別每個細胞類型來定義基因集,相比于其他細胞類型這些基因的表達該細胞類型中具有較高的統計學水平,隨后識別出每個空間區域的表達率明顯高于其他區域的基因。通過超幾何檢驗,評估在 scRNA-seq 和 ST 模式中提取的基因集是否顯著重疊,進而將空間信息與轉錄組信息聯合起來進行其他分析。

結果四:識別和映射跨組織區域細胞亞群
scRNA-seq 最有用的方面之一是它能夠揭示細胞類型中不同的亞群。因此,作者試圖通過識別細胞類型中的亞群,然后應用 MIA 來查詢整個組織空間的映射來描述細胞群體內部的異質性。基于scRNA-seq發現兩個腫瘤樣本中大多數細胞由KRT19+導管細胞組成,這是胰腺外分泌系統的兩種主要成分細胞類型之一。作者總共確定了四個導管細胞亞群:(1)表達APOL1和缺氧相關基因的導管細胞亞群;(2)表達TFF1、TFF2和TFF3的終端導管亞群;(3)表達CRISP3和CFTR的中心亞群;(4)表達MHC-II類分子和補體通路成分的抗原呈遞導管細胞。雖然MHC-II類分子主要表現在抗原呈遞細胞(B細胞、巨噬細胞、樹突狀細胞)的表面,但肝臟、胃腸道和呼吸道的上皮細胞表達MHC-II類分子。由于它們存在于腫瘤中,這些抗原呈遞導管細胞很可能通過促進T細胞活化,在調節腫瘤微環境內的炎癥反應方面發揮作用。這四種亞群中,第1類和第4類是先前的單細胞測序沒有報道過的,作者通雙重免疫熒光實驗驗證了亞群的存在。
與細胞類型分析一樣,作者使用每個導管亞群特有的標記基因,使用 MIA 確定這些導管亞群在組織切片中的富集情況。作者發現PDAC-A患者中的所有導管亞群都富集在組織的導管區域。相比之下,只有缺氧和晚期導管細胞群在癌癥區域顯著豐富。這些導管細胞所展示的轉錄表型可能反映來自周圍組織的環境信號,例如由于含氧量低,癌區導管細胞可能表達缺氧反應相關基因。相比之下,PDAC-B 中的導管亞群都完全富集于導管上皮區域。

結果五:整合分析不同癌癥人群PDAC組織
在PDAC-A scRNA-seq數據中發現了兩個癌細胞群,這些數據在基因和轉錄上似乎都截然不同。雖然作者發現這兩種癌癥種群在相應的ST癌癥區域中都富含,但它們是否與該地區內不同的細胞類型同位?為了探索PDAC-A患者兩個癌癥種群是否在相同切片區域共定位的問題,作者對該患者進行了額外的組織切片,確保 scRNA-seq 數據代表所有 ST 部分:腫瘤切片先分為三個部分,然后每個部分被分在 ST 和 scRNA-seq 之間。通過比較PDAC-A新增的區域,作者確定了各自PDAC-A樣本區域特有的基因列表之間的重疊,發現整個ST數據集的癌癥和基質區域之間有顯著重疊。對于每個組織部分中癌癥豐富的區域,使用分層聚類進一步將癌癥豐富的區域劃分為轉錄組相關的分區。在定義了每個子區域特有的基因集后,再次應用 MIA 映射方法來研究與子區域相關的基因集、每個細胞類型定義的基因集和 scRNA-seq 數據中的子群之間的重疊,進一步定義了細胞類型/亞群與組織空間之間的關聯性。

結果六:解析腫瘤微環境下的細胞狀態關系
最近對癌細胞scRNA-seq數據的研究表明,在膠質母細胞瘤、黑色素瘤、頭頸癌等多種癌癥類型中,細胞狀態是獨一無二的。由于ST提供空間信息,是否可以繪制癌細胞狀態到不同的空間組織區域,并描述它們與其他細胞類型的相互作用。為此,作者生成了第三個PDAC scRNA-seq數據集并定義PDAC癌細胞中的三個基因表達模塊。根據每個模塊的基因,注釋這些作為缺氧反應,氧化磷酸化和應激響應模塊。作者發現單核細胞和T/NK細胞在應激反應模塊區域大量富集。綜合分析TCGA PDAC數據,結果表明涉及炎癥性成纖維細胞和表達應激基因模塊的癌細胞之間的關系,并驗證了MIA方法對于生成細胞群與空間受限結構的關系的效能。

小結:
作者對于單細胞測序和空間轉錄組信息進行了整合分析,開發了MIA分析方法,系統揭示了胰腺導管腺癌的空間組織結構,為我們提供了良好的整合分析思路。