導讀:了解不同組織在空間結構上的細胞異質性和發育動態,對生命科學意義深遠。空間轉錄組技術,使得研究者可以生成并驗證假設,并和其它類型的數據結合。8月Nature的綜述,先講了評估不同空間轉錄組技術的6個指標,3種技術路線。之后分別在發育,疾病和生理上,論述空間組的應用。之后重點談論在探索性的數據分析中,5個不同的分析目標策略和3種策略。最后探討了如何將空間組數據和其它類型的數據整合。

https://www.nature.com/articles/s41586-021-03634-9
1)空間組技術概述及應用方向
從技術路線上,空間組測序分為基于二代測序,通過加ployT和代表空間信息的接頭的方法,以及原位測序,原位雜交之后,分別比對,從而得到各個方格的基因表達量矩陣三種方法。

圖1 三種空間轉錄組的實驗策略
評價不同技術有六個指標,依次是通量(一次能檢測的基因數)測序信息(是否能檢測全長轉錄本,從而檢測基因融合,剪切同構體及單堿基突變)敏感性(相同大小的方格內,能夠檢測到的基因數,例如基于NGS的技術,其敏感度就不如原位測序),分辨率(每個方格的大小,光學成像的方法,有對應的最小分辨率極限),切片大小(每張切片的面積越大,能夠考察的組織越大),可行性(技術能否被廣泛地使用)。
基于NGS的方法,目前是發展最快的,潛力最大的。其在單細胞測序的基礎上研發,其主要代表是10X,其中每個區域有對應的barcode,通過比對得到該序列的來源。其當前的分辨率在55um,每個方格可以檢出上萬個基因,切片面積在10平方毫米,而新推出的Stereo-seq,其分辨率在納米級。而另外兩種基于影像的方法,在得出表達量矩陣后,需要手動或用算法分出細胞邊界。
在發育上,不同時間的空間轉錄數據,可以闡明各組織的正常情況的發育地圖和動態,指出每個階段,不同相對位置的關鍵基因;對于患病組織,可以找出治病基因出現的時間和空間順序;指出癌變組織和正常組織間的邊界;對于神經退行疾病,炎癥和感染等生理過程,空間轉錄也可以指出其發生過程中何時何處哪些關鍵基因發生了變化。
2)空間轉錄組的分析套路
空間轉錄組的生信分析,起點是不同位置的各基因的表達矩陣,其第一步是去除低質量的數據,提高信噪比,常用的方法包含Giotto,Seurat,STutility等包,對數據質量的評估,包括檢測到的基因總數,以及每個區域檢測出的平均基因數。由于臨近的區域內基因表達量相近,可以通過滑動窗口,來提升每個區域檢測的基因數(靈敏度),通過除以轉錄本總量,或負二項回歸的方法進行標準化,再通過數據縮放,使得每個方格的平均值和方差相等。
歸一化的基因表達矩陣,是接下來各類探索性分析的統一輸入(下圖中間的部分),由于空間轉錄數據的高維度,在分析前,難以預設計劃,需要根據分析的結果,調整下一步的分析計劃,因此這樣的分析是探索性的。

圖2 五種探索性分析的套路
聚類是識別成一組具有相似轉錄組的點在空間上的聚集情況。通過聚類(例如UMAP,tsne或針對空間數據開發的聚類算法,如BayesSpace),可以識別共表達的區域,以及與細胞類型或細胞狀態相對應的基因模塊。
識別高度可變的基因,通常是可以根據它們在組織中的分布情況,對其空間自相關情況進行評分,例如SpatialDE ,利用高斯過程回歸,可將給定基因的表達變異性分解為空間變異性和非空間分量。
由于基因是共同表達的,通過打分函數,可以將一組表達量相似基因,作為一個單基因表達譜,從而以這種方式,相比單基因的分析方法,更好地總結組織在空間上的功能特性,最簡單的可通過對集合內的基因取平均值,或者結合單細胞數據,進行打分。
要想解釋空間組發現的數據,需要和單細胞或其它來源的先驗知識進行整合,這就需要根據轉錄信息,對于不具備單細胞分辨率的方法,這意味著預估各個方格內的細胞類型及分布。而對于亞細胞級的方法,難點在于將細胞圈出,并確定不同細胞器對應的方格。
關聯:空間轉錄組學是非常適合鑒定基因和組織區域的轉錄的相似性、差異性,不同區域間的空間重疊,或者發育或者功能上的相關性。當標注細胞后,還可以檢出受體和配體之間的信號傳遞和相互作用。

圖3 假設驅動的空間組研究范例
在實驗設計上,空間組即可以用來健康組織,期望能揭示意想不到的變化和描述新的假設,如圖2所示,也可以去傳統的假設驅動行,用以驗證假設,如圖3所示。例如通過聚類識別協同變異基因,并根據它們的所在細胞的特征,找出受體和配體對的高表達子集用于分析細胞間的通信;通過聚類,之后對同類基因打分后,得到不同區域的得分,說明不同區域的基因表達存在差異;或者找出不同區域的細胞類型的差異。

圖4 探索性的空間組研究全流程
以上兩種分析,其各自對應完整的實驗設計,如上圖所示。對于探索性的研究,通過不同位置,不同時間的切片(發育),或者受到藥物,基因編輯或感染影響前后的組織。通過生信分析,找出差異基因,之后通過染色或原位雜交進行驗證。

圖5 假設驗證型的空間組研究全流程
另一類假設驗證型,需要收集多份時間組和對照組在相近條件下的組織切片,測序后找出統計顯著的差異,之后的驗證可以通過臨床數據,體外或體內干預的方式進行。
3)未來技術前景的展望
隨著空間轉錄技術的分辨率和靈敏度的提高,通過高分辨率影像數據的融合,可以進一步提升分辨率。在亞細胞分辨率,染色質的空間組織可能提供了在不同情況下,其是如何調節基因表達的線索。而結合深度學習,可提升組織病理學切片的可解釋性,增強其在臨床決策中的應用。
另一個方向,是集成原位基因組和原位組蛋白標記的空間分布數據。通過對特定位置的細胞進行全基因組測序,并檢測其蛋白質組成,可以加深我們對基因組組織和功能,以及翻譯后蛋白質修飾及其在疾病中發揮功能的了解。
每個細胞都和其相鄰的細胞最相似,但多細胞卻能產生復雜多變的時空模式。隨著技術進步,系統地分析更大的組織區域成為可能,可用于重建3D 器官或生物體層面的細胞表達譜,并可視化轉錄組的變化,最終解決多細胞空間模式是如何從細胞水平的特性中涌現出來的這一問題。