阿爾茨海默癥 (AD) 目前被認為是全世界最著名的癡呆癥形式,由于缺乏早期診斷以及有效的治療手段,患者預后較差。關于阿爾茨海默癥,研究人員從未停止過探索,今天小編就帶大家閱讀一篇2023年2月21日發表在Frontiers in Immunology(IF:8.786)的文獻吧!
Integration of bulk RNA sequencing and single-cell analysis reveals a global landscape of DNA damage response in the immune environment of Alzheimer’s disease
整合Bulk RNA測序和單細胞分析揭示了阿爾茨海默癥免疫環境中DNA損傷反應的全局圖景
全文概述
本研究使用179個 DNA 損傷反應 (DDR)調節因子評估了AD患者的DDR模式。進行單細胞技術以驗證認知障礙患者的DDR水平和細胞間通訊。在采用WGCNA方法發現DDR相關lncRNA 后,共識聚類算法用于將167名AD患者分組為不同的亞組。評估了不同亞型之間在臨床特征、DDR水平、生物學行為和免疫學特征方面的差異。為了選擇與DDR相關的lncRNA,使用了四種機器學習算法( LASSO、SVM-RFE、RF和XGBoost)建立風險模型。AD的進展與DDR水平高度相關。單細胞分析證實,認知障礙患者的DDR活性較低,主要富含T細胞和B細胞。基于基因表達發現了DDR相關的lncRNA,并鑒定了兩種不同的異質亞型(C1和C2)。 DDR C1屬于非免疫表型,而DDR C2被認為是免疫表型。基于各種機器學習算法,發現了四個與DDR相關的lncRNA,包括 FBXO30-DT、TBX2-AS1、ADAMTS9-AS2和MEG3。基于4-lncRNA的 riskScore在診斷AD方面表現出較好的效能,并為AD患者提供了顯著的臨床優勢。與低風險組相比,高風險患者表現出較低的DDR活性,并有著較高水平的免疫浸潤和免疫學評分。用于治療低危和高危AD患者的前瞻性藥物還分別包括花生四烯基三氟甲烷和TTNPB(圖1)。

DDR相關基因在AD患者中的作用
在排除異常腦組織樣本后,共有150 個正常腦組織樣本和161個AD腦組織樣本。在已發表的研究中獲得的200個DDR相關調控基因,其中179個基因包含在合并數據集中。與正常組相比,在AD腦組織中觀察到51 個DDR調節因子的異常表達,表明AD患者與健康受試者之間的生物學行為存在顯著差異(圖2A)。富集分析表明,這些差異表達的DDR調節因子主要富集在DNA損傷修復相關過程中。
為了系統地闡明51個差異表達的 DDR調控因子之間的關系,作者將這些基因分為三種類型,并生成了一個調控網絡,顯示了這些DDR相關基因之間的相互作用,其中大部分顯示出實質性關聯(圖2B)。隨后,為了進一步說明DDR和AD之間的關系,基于差異表達的DDR 調節因子,使用 ssGSEA 算法計算每個樣本的DDR分數。發現AD患者在組合數據集中表現出顯著低于非AD個體的DDR評分(圖2C),這與其他三個外部驗證數據集的結果一致(圖2D–F)。這些結果表明,這些DDR調節基因之間的相互作用可能在保持基因組完整性方面發揮重要作用,而DDR 的失調可能是導致AD進展的重要因素。
此外,作者進一步分析了DDR與28個浸潤免疫細胞亞群之間的相關模式(圖2G)。較低的DDR 評分代表較高水平的免疫細胞浸潤,表明低DDR評分和高度浸潤的免疫細胞的協同作用可能促進AD的進展。

在單細胞水平上對DDR進行分析
為了研究AD中各種浸潤免疫細胞的DDR活性差異,將來自15個MCI/AD樣本和44個正常CSF樣本的70391個分選細胞劃分為12個簇,最終注釋了7種細胞類型(圖3A–C)。每組的細胞類型分數顯示認知障礙 (CI) 組中所有細胞類型的百分比下降(圖3D)。圖3E展示了每種細胞亞型的前15個標記基因的表達模式。然后使用“UCell”算法計算了每個細胞的DDR分數,結果表明具有較高DDR分數的細胞主要富集在正常樣本中,特別是在T和B細胞區域(圖3F-H),這與批量轉錄組學分析的結果一致。由于T細胞占最大比例,接下來進一步探討了DDR在不同T細胞亞群中的表達。提取并重新分析T細胞,共鑒定出12個簇(圖3I、J)。所有六種主要細胞類型在對照組和CI組之間均存在顯著差異。 UCell算法結果顯示,除Tcm/Naive輔助T細胞外,所有T亞型的 DDR 分數均不同程度上調(圖3K,L)。

認知障礙進展中的細胞間相互作用
隨后,作者進行了CellChat分析,以探索認知障礙進展過程中的細胞間相互作用。交互次數和強度從正常到認知障礙增強。與正常組相比,CI組中的巨噬細胞、ILC 和pDC細胞與其他細胞類型表現出更強的相互作用數量和相互作用強度。而DC 細胞和B細胞與正常組中的單核細胞和pDC細胞頻繁通訊(圖4A、B)。然后通過比較每個通路的相互作用強度,在對照組和CI組之間確定特定通路(圖4C)。此外,在認知受損的CSF樣本中觀察到T細胞與其他細胞類型之間的強通信概率。然而,CD40LG與ITGAM+ITGB2和ITGA5+IRGB1之間的通信是CI組所獨有的(圖4D)。

DDR相關長鏈非編碼RNA的探索
為了進一步闡明DDR的調控模式,進行了WGCNA分析,并根據組合數據集中 lncRNA的表達譜篩選了DDR相關的lncRNA。根據最優軟閾值β,對聚類樹狀圖的樣本進行層次聚類,得到10個不同顏色的lncRNA共表達模塊(圖5A)。在交集之后,最終篩選出33種常見的DDR相關lncRNA(圖5B),構建DDR-lncRNA 共表達網絡(圖5C)。33個DDR 相關lncRNA在對照組和AD患者之間的不同表達模式,其中31個在AD患者中顯著上調,2個DDR相關lncRNA在健康個體中上調(圖5D)。

識別AD患者的DDR亞型
基于33個DDR相關lncRNA的表達圖譜,使用共識聚類算法將AD樣本分為不同的亞型,每個亞型具有不同的DDR調控狀態(圖6A)。將167名AD患者被分為兩個亞型,包括74例C1和93例 C2。 tSNE分析揭示了C1和C2集群之間AD患者分布的顯著差異(圖6B)。DDR C2顯示出相對于DDR C1較低的DDR評分(圖6C),表明DDR C2患者缺乏DDR調節。然而,年齡和性別分布在DDR C1 和 DDR C2 亞型之間沒有統計學差異(圖6D、E)。熱圖表明,這些與DDR相關的lncRNA在不同的DDR簇之間明顯不同,并且大多數lncRNA在DDR C2中上調(圖6F)。

DDR亞型之間分子功能和通路的特征
DDR亞型之間進行DEG分析,探究轉錄組學差異。共獲得2472個DEG(2859 個上調和1856個下調)。基于GSVA算法的功能注釋顯示DDR C2主要參與肌管分化、血管內皮生長因子受體激活、細胞間連接、神經元突起再生、細胞周期停滯和免疫反應。相反,DDR C1與線粒體和氨基酸代謝、tRNA 和溶酶體轉運以及蛋白質定位相關的生物學功能密切相關(圖7A)。通路富集分析表明,DDR C2 主要由免疫調節、細胞因子-細胞因子相互作用和幾種經典信號通路驅動(圖7B)。一致地,GSEA結果表明DDR C2中B細胞受體信號通路、細胞因子-細胞因子受體相互作用、JAK-STAT信號通路、自然殺傷細胞介導的細胞毒性和Notch信號通路上調(圖7C)。DDR C1的特征在于DNA復制、糖異生、溶酶體、氧化磷酸化和 RNA 降解(圖7D)。這些結果突出了亞型1和亞型2之間不同的分子功能和通路。

識別DDR亞型之間的免疫特征
為了更好地闡明DDR亞型之間免疫微環境的差異,首先全面研究了免疫浸潤水平之間的相關性。基于ssGSEA、MCPcounter、xCell、ABIS和ESTIMATE方法的免疫細胞亞群熱圖如圖8A所示,這表明大多數類型免疫細胞的浸潤水平主要分布在 DDR C2。接下來,進一步研究了DDR表型與各種免疫調節劑和免疫檢查點之間的相關性。 DDR對AD免疫微環境影響的結果顯示,CD28和CD80等共刺激因子在DDR C2亞型中的表達水平顯著升高。此外,在DDR C2亞型中也可見抗原呈遞、細胞粘附、共抑制物、配體、受體等功能的表達增加。與DDR C2相比,DDR C1表現出更高的CD274和CX3CL1表達(圖8B)。此外,DDR C2還表現出更強的免疫得分,這表明對免疫療法的反應更強(圖8C)。基于以上結果,作者認為DDR C2是免疫相關亞型,DDR C1是一種代謝表型。

基于機器學習選擇特征的DDR相關lncRNAs
為了進一步確定能夠準確診斷AD的DDR相關lncRNA,使用四個機器學習模型(LASSO、RF、SVM-RFE和XGBoost),在33個DDR相關lncRNA的表達圖譜基礎上進行特征選擇。使用LASSO分類器最終篩選了15個具有非零系數的DDR相關lncRNAs(圖9A)。ROC曲線分析顯示,基于15個lncRNA的LASSO模型的AUC在訓練集為0.745,在測試集為0.743(圖9B)。隨后,確定了9個lncRNA的組合在基于SVM-RFE模型預測AD發生方面表現出最高的準確性(圖9C)。接下來采用Boruta特征選擇算法,共確定了14個重要的lncRNAs。這14個由Boruta算法篩選出來的特征被納入到RF模型中,在訓練集中的AUC值為1,在測試集中為0.731(圖9D)。此外,對于AD的識別,XGBoost分類器在訓練集和測試集的AUC分別達到1和0.778(圖9E)。FBXO30-DT、ADAMTS9-AS2、TBX2-AS1和MEG3在LASSO、SVM-RFE、RF和XGBoost算法均有重要的作用,被確定為DDR相關lncRNAs(圖9F)。

風險模型和列線圖的建立
這四個不同的與DDR相關的lncRNAs被用來計算DDR相關的風險分數,使用它們相應的LASSO模型系數:風險分數=(-0.188478×FBXO30-DT)+(0.117249× ADAMTS9-AS2)+(0.129318×TBX2-AS1)+(0.320641×MEG3)。隨后,使用ROC曲線分析評估了風險分數和臨床特征(年齡和性別)在預測合并數據集中的AD進展方面的診斷功效。基于ROC曲線,預測模型的AUC值為0.712,年齡為0.558,性別為0.455,AD患者表現出明顯較高的riskScore(圖10A,B)。這些結果表明,風險分數可以比經典臨床指標更準確地預測AD的進展。由性別、riskScore和年齡構成的提名圖顯示了這些特征在診斷AD方面令人滿意的預測結果(圖10C),計算的校準曲線證明了列線圖的穩健性(圖10D)。此外,DCA表明基于風險分數的列線圖在臨床上是有益的(圖10E)。

低危和高危人群的臨床價值和分子通路
為了全面說明AD的DDR 風險得分相關機制,作者建立了一個風險模型,并根據中位風險分數將總共167個AD樣本分為低風險和高風險組。這四個與DDR相關的lncRNAs在低風險組和高風險組之間有著不同的表達模式,其中MEG3、TBX2-AS1和ADAMTS9-AS2在高風險組的表達水平更高。而在低風險組中,FBXO30-DT的表達明顯較高(圖11A)。Sankey圖全面描述了低風險組和高風險組中不同亞型和臨床指標比例的細節。高危組的DDR C2亞型樣本更多,而性別和年齡分布在低、高危組之間沒有明顯差異(圖11B-D)。此外,通過比較這兩個風險分數組之間的DDR分數水平,低風險組的DDR分數相對于高風險組要高(圖11E)。
GSEA顯示,高危組在自身免疫性疾病、細胞因子-細胞因子受體相互作用、ECM受體相互作用、JAK-STAT信號通路、自然殺傷細胞介導的細胞毒性。和神經活性配體受體相互作用中富集(圖11F),而低風險組在TCA循環、DNA復制、氧化磷酸化、戊糖磷酸鹽途徑、嘧啶和丙酮酸代謝以及RNA降解相關的通路調節中富集(圖11G)。
為了評估AD患者的個體化臨床治療,作者使用CMap數據庫分別探索了低風險和高風險人群的潛在治療藥物。對低風險組來說,前5個蘊含個體化治療潛力的藥物如下。W-13, XAH-6809, TTNPB, butein, 和花生三氟甲烷(圖11H)。而vorinostat、alsterpaullone、STOCKIN-35874、花生醇三氟甲烷和TTNPB是對高風險AD患者最有效的五種治療藥物(圖11I)。特別是花生醇三氟甲烷和TTNPB在低風險組和高風險組的CMap得分分別最低,揭示了不同風險的AD患者的最佳治療效果。

不同AD風險患者之間免疫微環境和治療藥物的差異
根據ssGSEA、MCPcounter、xCell、ABIS和ESTIMATE算法,作者還探討了低風險組和高風險組的浸潤細胞情況。在高危組中觀察到多種免疫細胞亞型(圖12A)。此外,免疫調節劑和免疫檢查點在不同風險的AD患者之間存在明顯的差異。相對于高風險的AD患者,低風險患者只顯示出HMGB1的高表達(圖12B)。此外,在低風險組可以觀察到免疫得分的明顯降低,表明對免疫治療的反應性差(圖12C)。相關分析也表明,較高的風險分數與大多數類型的免疫細胞呈正相關,并顯示出免疫的卓越浸潤水平(圖12D)。

總結
文章到這里就要結束,作者整合bulk和單細胞數據探究DDR調節因子在AD患者中的影響,并構建了診斷模型。文章思路清晰明了,也非常適合生信小白學習。現在生信分析已經成為研究過程中不可缺少的環節,想要更進一步的小伙伴千萬不要落下了,趕緊學習起來吧!