單細胞RNA測序(scRNA-seq)可以識別組織內的細胞亞群。scRNA-seq技術的出現,使得人們可以對細胞的基因組學、轉錄組學以及表觀基因組學進行精準的研究。但不能捕捉它們的空間分布,也不能揭示細胞間通訊的局部網絡。而空間轉錄學方法正好相反,于是單細胞測序聯合空間轉錄組測序分析就這樣誕生了。同時,一個關鍵問題誕生——如何將這兩者整合?
☆本文看點☆
一、單細胞測序聯合空間轉錄組測序一般流程
二、單細胞測序聯合空間轉錄組整合方法
三、Cell2location介紹
四、小編總結
一、單細胞測序聯合空間轉錄組測序一般流程

Nature雜志及其子刊每年都會總結一年中的研究成果,根據每個領域的重大發現,推選出最有價值的技術為年度技術。2018年的“單細胞轉錄組技術”、2019年的“單細胞多組學技術”以及2020年年度技術方法“空間轉錄組技術”無疑不證明了單細胞和空間分辨率轉錄組技術應用的重要性。在轉錄組技術的發展的歷程中,我們已經有了bulk RNA-seq、scRNA-seq、ST RNA-seq(空間轉錄組測序)。bulk RNA-seq對大量混合細胞進行轉錄組測序,但是該方法只能獲得基因平均表達水平。scRNA-seq對細胞基因表達的認識推進到單細胞的層面,目前已在發現新的細胞類型、揭示細胞異質性等方面展現出優勢。但單細胞測序會失去了組織空間位置信息。ST RNA-seq可以同時獲得細胞的空間位置信息和基因表達數據,但目前還達不到單細胞精度。在這里,作者提出了一種結合單細胞RNA序列(scRNA-seq)和ST(空間轉錄組)法來研究的方法。在這種方法中,首先對腫瘤(處理組)組織進行分割,從其中一部分產生單細胞懸浮液,并對其進行scRNA-seq處理,以識別組織中存在的細胞群體。從剩余的組織中,冷凍切片使用ST方法進行處理,以提供整個組織中表達的轉錄本的無偏圖譜。然后,就是本文關注的重點:通過引入什么樣的方法來整合這兩個數據集。
二、單細胞測序聯合空間轉錄組整合方法

鑒于空間轉錄組學方法還不能在組織中產生深層單細胞分辨率的轉錄組圖譜,能夠成功整合單細胞和空間轉錄組數據的分析將有助于理解細胞類型分布的結構以及構成這種結構的細胞間通訊的假定機制。整合scRNA-seq和空間轉錄組數據有兩種主要方法:去卷積(Deconvolution)和映射(Mapping)。去卷積旨在根據單細胞數據,從每個捕獲點的mRNA轉錄物的混合物中分離出離散的細胞亞群;映射有兩方面:將指定的基于scRNA的細胞亞型定位到HPRI(high-plex RNA imaging)圖譜上的每個細胞和將每個scRNA-seq細胞定位到組織的特定區域。
去卷積:從單個捕獲點中分離出離散的細胞亞型。去卷積有兩種主要方法:推斷一個特定spot的細胞亞型比例和對一個特定的空間轉錄組spot進行評分,以確定它與單個細胞亞型的對應程度。
Inference-based的去卷積技術估計每個細胞類型在特定捕獲點的比例。這種形式的去卷積的方法之一是采用基于統計回歸的模型,并使用scRNA-seq數據矩陣來去卷積每個捕獲點的mRNA混合物。估計每個細胞類型在給定捕獲點中的確切比例的補充方法是通過貝葉斯統計框架,將概率分布與scRNA-seq數據的基因計數分布相適應。如:Spotlight的基準策略是最徹底的:評估細胞類型檢測的準確性、敏感性和特異性,以及與ground truth的總體相關性。
有許多基于富集分數的去卷積技術,例如Seurat 3.0通過從該細胞類型的基因組的平均相對表達量中減去對照基因組的平均相對表達量,計算給定捕獲點的細胞類型的相對表達量分數。多模態交叉分析(MIA)根據scRNA-seq建立的細胞類型基因程序和根據空間條形碼數據建立的組織類型基因程序之間的重疊,以闡明在每個區域中某些細胞類型的富集或減少程度。
映射:以單細胞分辨率創建空間分辨率的細胞類型映射。就像去卷積一樣,繪制圖譜的第一步是基于scRNA-seq數據建立細胞亞型。然后,映射的主要挑戰是將基于scRNA-seq的細胞類型從HPRI數據分配到每個細胞上。對14種已發表的算法進行系統評估,這些算法通過基于聚類的分析實現了映射的批量校正策略,確定了三種最有效地將scRNA-seq數據與單細胞分辨率空間數據集成的算法:LIGER、Seurat Integration(來自Seurat 3.0)和Harmony。這三種算法最終都是使用不同的方法將聚類集成到低維空間中,通過對聚類的群體檢測得到細胞類型2。
三、Cell2location介紹
下面我就來具體介紹Cell2location這項整合方法。為什么選擇這個方法呢?因為我覺得這個方法有潛力,作者通過比較當前其他主流的方法,證明Cell2location方法在繪制細粒度細胞類型上具有優勢。簡單來說fine-grained指的就是細粒度,fine-grained classification是細粒度的圖像分類。與之相對應的是coarse-grained classification(粗粒度)。我舉個栗子。粗粒度就是可以在水果中分辨這是蘋果,但是細粒度可以分辨這是哪一種蘋果。

首先,因為基于陣列的mRNA捕獲目前與組織中的細胞邊界不匹配。因此,每個空間位置對應于幾種細胞類型或多種細胞類型的不同部分。其次,空間RNA-Seq測量因不同的變異源而混亂。因為
1)不同組織位置的細胞數量不同。
2)不同細胞和細胞類型的總mRNA含量不同。
3)薄組織切片捕獲每個細胞體積的不同部分。
計算方法需要對所有這些因素進行適當的建模和考慮。在這里,作者介紹了cell2location,一個原則性和通用性強的貝葉斯模型,用于在空間轉錄數據中全面繪制細胞類型圖。Cell2location通過整合來自特定組織的單細胞或細胞核RNA-seq和空間轉錄數據來繪制細胞類型的空間分布圖。

本篇文章3發表在期刊: Nature Biotechnology 該期刊在最近一年的影響因子: 54.908,水平很高。
Cell2location工作流程的第一步是根據單細胞和單核RAN-seq圖譜估計參考細胞類型簽名。
在第二步中,cell2location使用這些參考簽名和一個或多個空間轉錄數據集作為輸入,將各個空間位置的mRNA計數分解為參考細胞類型
Cell2location軟件在計算上和識別位于同一位置的細胞類型上是高效的,并且與scvi-tools框架集成在一起,并附帶一套下游分析工具。為了驗證Cell2location,作者最初考慮了生成的模擬數據,這些數據反映了ubiquitous、regional細胞類型之間的不同細胞豐度模式。然后,作者使用Cell2location來估計各個位置不同細胞類型的細胞類型比例。將這些估計值與模擬的細胞類型比例進行比較。結果顯示,無論細胞豐度模式如何,Cell2location都能高精度地繪制細胞類型,包括低豐度和區域性細胞類型。接下來,作者將Cell2location與最近提出的從空間轉錄數據中估計相對細胞類型豐度的方法進行了比較(Stereoscope, Seurat, RCTD, NNLS(AutoGeneS) 和 SpotLIGHT)。在考慮的細胞豐度模式中,作者發現Cell2location比其他方法能更準確地估計不同位置的細胞類型比例4。

作者首先將該模型應用于來自小鼠大腦的數據,其特征是不同類型的神經細胞在大腦區域之間組織成具有良好特征的空間結構,從而是測試空間基因組學的典型用例。作者從端腦和間腦多個區域的相鄰小鼠腦切片中生成了匹配的單核(sn)和空間RNA-seq圖譜。為了評估空間圖譜中的生物學和器官內技術差異,作者分析了兩個小鼠大腦的連續組織切片(兩個來自兩個動物的匹配切片,以及一個額外的snRNA-seq切片),創建了一個豐富的轉錄數據集。在這些細胞中,44個簇被識別為大腦中預期的細胞類型,包括星形膠質細胞、興奮性或抑制性神經元或膠質細胞亞型。作者應用cell2location將這些細胞類型繪制到小鼠大腦的空間位置。由此得到的細胞類型圖譜與先前文獻中預期的解剖位置明顯一致。并且,作者的結果捕捉到了不同的細胞類型,分辨了廣泛的區域性細胞類型,如丘腦的興奮性神經元、白質的少突膠質細胞,皮質中間神經元等罕見亞型以及次區域亞型,如跨皮層的興奮性神經元。在相鄰的組織切片和復制動物之間,細胞類型豐度的估計高度一致。接下來,為了評估Cell2Location方法與其他方法的特異性,作者繪制了一個現有的大型scRAN-seq數據集,其中包括來自多個腦區的細胞類型。
當作者將這些細胞類型映射到軀體感覺(SSp)皮層數據時,作者預計陰性細胞類型被排除在外,只有陽性細胞類型被分配了相當大的細胞類型比例。結果證明,與陽性細胞類型相比,Cell2Location給出的陰性細胞比例要低得多。相比之下,其他方法顯得比較弱。這表明cell2location準確地排除了不應該出現在空間數據集中的參考單元類型。最后,為了展示cell2location在空間轉錄技術中的多功能性,作者將鼠腦snRNA-seq參考映射到(10-μm空間分辨率)Slide-seq數據集。Cell2location在Slide-Seq空間數據中解析細胞類型,包括跨越海馬分區和皮質層的精細解剖亞型。
總而言之,作者的結果表明,Cell2location在描繪不同的腦細胞類型上具有很高的準確性和重復性,并且該方法廣泛適用于空間轉錄技術。

與小鼠腦不同,人類淋巴結的特征是動態的微環境,有許多空間上相互交錯的細胞群體。作者分析了來自10x Genomics公開的人類淋巴結的空間數據集,并通過整合來73,260個細胞組成的人類次級淋巴器官的scRNA-seq數據集,繪制了包含34種參考細胞類型的綜合圖譜。淋巴結標本的組織學檢查顯示有多個生發中心(GC)。相應地,用Cell2location后,可以很容易地識別淋巴結組織中預期的主要區域,包括T細胞區和B細胞區,以及帶有濾泡樹突狀細胞((FDCs)的生發中心(GC)。作者對來自Cell2location的細胞類型豐度估計進行了非負矩陣分解(NMF)。作者觀察到,NMF鑒定的細胞類型組與已知的功能相關的淋巴結細胞隔間相對應。綜上所述,作者的結果表明,cell2location可以定位以空間交錯的細胞類型為特征的復雜組織。

三、cell2location用來繪制精細免疫細胞
細胞圖譜研究極大地擴展了人體組織中細粒度細胞類型的目錄,這通常是理解組織功能和病理學的關鍵興趣。作者考慮了兩種人體組織中的免疫細胞群,在這兩種組織中可以識別出許多具有特殊免疫功能的優良亞型。最初,作者檢查了人體淋巴結中GC特異性免疫細胞類型。作者利用Visium組織學圖像對GC的解剖位置進行了注釋,并評估了將六種GC細胞類型映射到預期GC位置的準確性。盡管所有方法對于映射不同的細胞類型(如FDC)都達到了很高的精度,Cell2location在定位細粒度細胞類型(如GC T濾泡輔助細胞)方面明顯更準確(圖3)。
作者還檢查了人類腸道中的免疫細胞群。人類腸道為空間圖譜提供了一個極具挑戰性的應用,因為它包含了大量轉錄上細粒度的免疫和非免疫細胞類型,免疫細胞在相對較小的淋巴濾泡的組織區域中富集。作者通過結合兒童和成人腸道的scRNA-seq數據集定義了全面的細胞類型參考特征,該數據集富含免疫(CD45+)細胞和同等比例的非免疫(CD45?)亞型,總共跨越153,901個細胞的76種細胞類型。作者將這些參考細胞類型映射到兩個成人結腸的空間數據集,在該數據集中,作者使用組織學和Visium數據中的標記基因表達來注釋淋巴濾泡的位置。相應地,在用Cell2location后,可以很容易地識別出結腸內預期的主要區域。同上,盡管其他的方法對于不同的細胞類型,如循環B細胞,都達到了很高的精度,但細胞定位在繪制細粒度細胞類型方面再次獲得了明顯更高的精度。其他的方法要么無法定位幾種細致的免疫細胞類型,如Viium數據中的FCRL4+記憶B細胞和Tfh細胞,要么映射它們的特異性較低。綜上所述,這些結果表明,在繪制復雜組織中轉錄細粒細胞類型的圖譜方面,cell2location優于其他方法。

四、小編總結:
基于單細胞組學在近三年發展起來的新興領域,“單細胞多組學技術”和“空間轉錄組技術”先后在2019年和2020年被Nature Methods評為年度技術方法。時間和空間維度多維研究技術結合,將以全新研究思路出發,既能夠獲得單個細胞間異質性,又能獲得細胞在組織空間上的結構位置信息,發現更多未知且精細化結果。總而言之,單細胞測序+空間轉錄組測序:優勢互補,同時獲得細胞類型群體,以及基因表達和細胞的空間位置信息。如果喜歡本文就mark一下“在看”,順便給小編一個贊吧~
參考文獻
1. Moncada R, Barkley D, Wagner F, et al. Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas. Nat Biotechnol. 2020;38(3):333-342.
2. Longo SK, Guo MG, Ji AL, et al. Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics. Nat Rev Genet. 2021;22(10):627-644.
3. Kleshchevnikov V, Shmatko A, Dann E, et al. Cell2location maps fine-grained cell types in spatial transcriptomics. Nat Biotechnol. 2022.
4. Kleshchevnikov V, Shmatko A, Dann E, et al. Comprehensive mapping of tissue cell architecture via integrated single cell and spatial transcriptomics. bioRxiv. 2020:2020.2011.2015.378125.