今天跟大家分享的是發表在Molecular Therapy: Nucleic Acids(IF: 8.886)上的一篇文章,主要是基于T細胞軌跡的動態調控網絡解析T細胞狀態轉換的轉錄控制,并識別不同過程中的關鍵調控因子,思路清晰,緊扣T細胞調控的主題,分析深入淺出,是一篇用簡單分析方法講好單細胞故事的優秀典范,非常值得大家學習哦。
Dynamic regulatory networks of T cell trajectory dissect transcriptional control of T cell state transition
T細胞軌跡的動態調控網絡解析T細胞狀態轉換的轉錄控制
T細胞表現出異質性的功能狀態,這與免疫檢查點封鎖的響應和腫瘤患者的預后相關。然而,T細胞狀態轉變動態過程的分子調控機制仍然是未知數。基于非小細胞肺癌中T細胞的單細胞轉錄組數據,研究者結合細胞狀態和擬時序分析,提出一個構建動態調控網絡的方法,對T細胞功能障礙的過程進行解析,并且識別出不同階段的候選調控因子(圖1)。

圖1.流程圖
1.構建CD8+ T細胞在腫瘤微環境中的狀態轉移軌跡
研究者從14例NSCLC患者鄰近的正常肺組織(NTC)、腫瘤組織(TTC)或外周血(PTC)中分離出3700個CD8+ T細胞,對所有T細胞進行無監督聚類,最終被標注為不同的狀態,包括原始T細胞、中間T細胞、效應T細胞、兩組分別被標記為GZMK和ZNF683功能失調前T細胞簇和功能障礙細胞。
為描述不同狀態下CD8+ T細胞之間的關系,研究者使用Slingshot算法進行擬時序分析以建立細胞狀態之間的軌跡。推斷的狀態轉移軌跡包含兩個譜系,分別呈現從原始狀態到功能障礙狀態和到效應狀態的分叉結構(圖2A)。兩種都起源于na?ve狀態,在中間態之后分化。然后,功能失調GZMK和功能失調NF683狀態依次位于譜系1(即功能失調譜系),并以功能障失調狀態結束(圖2B)。相反,譜系2(即效應譜系)直接結束于終端效應狀態(圖2C)。在個體患者中也觀察到這兩種譜系,表明T細胞狀態轉變的軌跡在不同的患者中普遍存在。
對于每個譜系,不同狀態的細胞顯示出不同的擬時序分布(圖2B-C)。此外,na?ve狀態標記(CCR7、SELL和IL7R)在擬時序早期活躍,而共抑制受體(PDCD1、CTLA4、TIGIT、LAG3、和HAVCR2)在后期活躍(圖2D),證實功能失調譜系的準確性。同樣,效應分子GNLY等的表達沿效應擬時序增加,進一步證實沿效應細胞排序的準確性(圖2E)。
組織起源狀態轉變軌跡的投影可以看出在兩個世系中存在明顯差異(圖2F和2G)。為進一步明確起源和軌跡的關系,研究者根據擬時序分析將細胞平均分為10組,并比較其起源/細胞狀態組成。在功能失調譜系中,外周血源性幼稚T細胞和中間T細胞在前四組細胞中占主導地位,然后急劇下降(圖2H和2J)。同時,來自腫瘤組織和正常組織的功能障礙前T細胞逐漸增多。正常組織源性細胞一直減少至細胞組6。相反,腫瘤浸潤T細胞在隨后的細胞組中進一步增加并占主導地位。在效應譜系中,血源性原始T細胞和中間T細胞也占主導地位,正常組織源性和腫瘤浸潤T細胞隨擬時序逐漸增加,對任何組織源性無明顯偏倚(圖2和2K)。組織分布和細胞狀態組成結果表明血液循環的原始T細胞被招募到腫瘤中,持續抗原刺激驅使中間狀態細胞向功能障礙前細胞分化,并進一步分化到功能失調狀態。另一種譜系從中間狀態細胞直接分化為正常效應細胞等。

圖2.單細胞分析揭示CD8+ T細胞在腫瘤微環境中的狀態轉移軌跡
2. 刻畫T細胞功能失調特異基因的動態改變
為確定調控T細胞功能失調的基因,研究者首先嘗試通過應用tradeSeq算法識別出在功能障礙譜系中發生差異表達的1787個基因(圖3 A)。除PDCD1、CTLA4和HAVCR2等共抑制受體外,還識別出許多參與T細胞分化的基因(圖3B-3F),如IFNG等效應分子(圖3D)和腫瘤壞死因子 (圖3E)的持續增加,表明功能障礙T細胞可能并沒有完全失去其抗腫瘤效應潛力。此外,CXCL13等與淋巴細胞遷移相關的基因沿著譜系發生動態表達 (圖3F)。
為進一步分析功能失調過程中生物功能的時間關系,研究者進行高分辨率的功能活動分析,結果表明與細胞轉換相關的信號通路在幼稚期高度活躍,并從中間活躍期開始迅速下降(圖3G)。細胞毒性功能繼續上調,并在最近的功能失調階段達到最高活性(圖3H)。然而,T細胞活化和細胞遷移的活性在功能障礙前期達到頂峰,然后在后續階段略有下降(圖3I)。基因表達的動態分析揭示T細胞功能失調過程的分子動態變化。

圖3.功能失調譜系的動態基因分析
3. T細胞功能失調過程的動態網絡構建
功能失調過程中T細胞的狀態轉變受轉錄調控因子(TFs)及其相關輔助因子的控制。為更好地理解驅動T細胞功能調控的分子機制,研究者提出一個動態調控網絡構建的方法,用可變長度滑動窗口的方法來分割細胞。基于細胞狀態的擬時序分布,研究者將功能失調細胞譜系劃分為四個重疊窗口,每個窗口主要由兩個連續狀態的細胞組成。例如,窗口1 (W1)主要由幼稚態和中間態細胞組成,而W2主要由中間態和失調前GZMK態細胞組成(圖4A)。每個窗口分別構建基因調控網絡(GRNs),反映控制兩狀態間過渡的調控環節。最終,在至少一個網絡中推斷出82個調控因子和1641個靶點之間的7117個相互作用(圖4A),每個調控因子的大小從1到229個基因不等。W1、W2和W3具有相似的節點和互作數量,而最后一個窗口的網絡W4包含相對較少的節點(1,143)和較少的交互(1,886)。
研究者進一步基于本工作中的方法在另外8個單細胞RNA測序數據集中構建動態網絡。在不同數據集的每個狀態轉換過程中識別的調控因子有很高的重疊(圖4B)。
為闡明本動態網絡構建方法的優點,研究者對所有功能失調的細胞在沒有窗口細胞的情況下實行GENIE3算法,結果表明未打開窗口識別的TFs與本方法的靶點基因存在重疊(圖4C),表明使用所有細胞構建的GRN_all可以捕獲整個譜系中的某些信息。然而,GRN_all可能偏向于大細胞亞群,丟失來自其他細胞的一些信息。GRN_all與W3中的靶基因交疊程度最高(圖4C),說明受到W3信息偏倚的影響。此外,窗口滑動方法可以進一步TF發揮作用的階段進行分析。例如,研究者在GRN_all中識別出50個TOX靶基因,其中30個靶基因與W4中鑒定的靶基因相同,表明TOX可能更多是在W4中發揮作用 (圖4C)。
研究者選擇晚期功能失調窗口W4,評估不同GRN構建算法的影響,其中GENIE3方法的準確性最高,故本工作選擇GENIE3方法(圖4D)。

圖4.功能失調譜系相關動態網絡的構建和驗證
4. 大量的調控重連控制細胞狀態轉變
為詳細闡述T細胞功能失調過程中調控作用的動態變化,研究者系統地比較不同轉變過程中的調控網絡。在不同網絡之間存在大量的節點重疊,其中44.4%存在于所有四個網絡中(圖5A),而TFs的重疊率更高(63.4%)(圖5B)。然而,通過檢查四個網絡的邊緣重疊,研究者發現在每個窗口中都有大量特異性的邊(圖5C)。基于Jaccard指數(JI)評估任意兩個網絡中TF調控靶點的重疊。兩個連續窗口(W1_W2、W2_W3、W3_W4)之間的平均JI值分別為0.11、0.14和0.12(圖5D),表明TFs沿著T細胞軌跡基本上重新連接到不同的靶點(即重連)。PRDM1在第一個窗口中上調,并在隨后的狀態中持續表達(圖4B-4E)。然而,PRDM1在不同窗口中調控特定的基因,并參與窗口特異性功能。例如,PRDM1在W1中發揮了干擾素相關功能,而在 W3和W4的T細胞激活和去磷酸化中發揮作用(圖5E)。此外,ID2也在四個網絡之間重新連接,進而發揮不同作用(圖5F)。
T細胞耗竭表現為共抑制分子的高表達。研究者提取每個窗口的共抑制受體亞網絡,以研究共抑制因子的調節重連(圖5G)。共抑制受體的動態重連表明,在T細胞功能失調過程中,共抑制受體受到不同轉錄因子的調控,進而形成一個激活級聯。

圖5. T細胞功能失調過程中的大規模網絡重連
5.解析TFs的動態重組模式
狀態轉換網絡中存在大量的特定邊,在相應窗口中調控對的相關性最高(圖6A),此外相關性在各個窗口中逐漸變化。在狀態轉換過程中,窗口間的調控相互作用的波動和重新連接表明,轉錄因子可能在某些階段發揮主導調控作用。如果某特定窗口中轉錄因子的靶點數量高于所有窗口平均數量,則研究者認為該轉錄因子在該窗口和過程中發揮主導調控作用。最終研究者獲得11種調控模式,包括4種窗口特異性調控模式和7種持續性調控模式(圖6B-C)。
為探究TFs的協同效應,研究者基于Simpson指數估計每個窗口中TFs之間的調控相似性,分別識別出W1和W2的兩個模塊,W3和W4的一個模塊(圖6D-G)。同一模塊中的TF傾向于具有相同的調控模式,比如W1中的M1模塊包含TCF7、LEF1、MYC、SATB1和BACH2,除TCF7外,其余均在W1中起主導作用(圖5D)。W2中的M2含有W2特異性調控因子ZBTB38、EOMES和ZEB2(圖6E),在細胞殺傷和白細胞活化中參與免疫應答。W3中的M1包含W3特異性調控因子HOPX、ZNF683和ID2,以及兩個持續的調控因子,僅調控少量靶點(圖6F),涉及免疫系統中細胞因子信號轉導等。W4中的M1含有TOX、ETV1和RBPJ,它們在W4中起主導作用(圖6G),在淋巴細胞活化和T細胞共刺激中富集。

圖6. 轉錄因子的動態調控模式
6. 關鍵調節因子導致T細胞功能失調
為進一步衡量狀態轉移網絡中不同特征因子的重要性,研究者結合度、貼近度等建立一個綜合的中心性度量。圖7A-D顯示四個狀態轉換網絡中中心度指標最高的前10個TFs。這組關鍵的TFs包括TCF7等已知的介導T細胞狀態轉變的調控因子。此外,TSC22D3 在W2、W3和W4中持續發揮調控作用(圖6C),在三個窗口中都是最重要的調控因子之一(圖7B-D)。雖然TSC22D3在不同的窗口中調控不同的靶點(圖7E),但它可以隨著時間的推移不斷調節某些生物學功能 (圖7F)。研究者觀察到TSC22D3在W2中特異性調控細胞對生物刺激的反應,在W3中特異性調控T細胞增殖(圖7F)。
沿著細胞狀態轉換,研究者發現TSC22D3的表達先升高后降低,在功能障礙前狀態表達最高(圖6G)。在另外三套scRNA-seq數據集中,研究者同樣觀察到TSC22D3在功能障礙前狀態下的表達始終顯著高于功能障礙狀態下的表達 (圖7H和7I),表明其在T細胞功能障礙前的關鍵作用。基于GEO的兩組NSCLC患者,研究者發現TSC22D3的高表達與總生存期顯著相關(圖7K和7L)。以上結果表明,TSC22D3可作為T細胞功能障礙前的關鍵調節因子,并與NSCLC患者的臨床結局相關。

圖7. T細胞功能失調的關鍵調節因子
今天的內容就是這些,研究者基于非小細胞肺癌中T細胞的單細胞轉錄組數據,結合細胞狀態和擬時序分析,提出基于滑動窗口構建T細胞功能失調過程中動態調控網絡的方法,識別出不同階段的候選調控因子,以及不同細胞狀態下的關鍵調控機制,是一篇很優秀的單細胞分析文章,非常值得大家學習和借鑒。
生物信息學分析就像講故事,單細胞分析尤甚,故事豐滿流暢,自然實驗結果也更加清晰明了,踏實可靠,如何講好自己的故事,是值得每個生信人思考的問題。
參考文獻:
Dynamic regulatory networks of T cell trajectory dissect transcriptional control of T cell state transition