
利用血源性外泌體中的轉錄組學信息和腫瘤微環境中的單細胞多組學數據構建 KIRC 診斷模型
今天分享的文章, 于2023年4月19日發表在Frontiers in Immunology (IF: 8.786), 題為“Dissecting order amidst chaos of programmed cell deaths: construction of a diagnostic model for KIRC using transcriptomic information in blood-derived exosomes and single-cell multi-omics data in tumor microenvironment” 。
腎透明細胞癌 (KIRC) 是最常診斷的腎細胞癌 (RCC) 亞型; 然而,KIRC 的發病機制和診斷方法仍然不清楚。作者收集了 6 個 細胞死亡相關基因(CDRG) 類別,包括細胞凋亡、壞死性凋亡、自噬、細胞焦亡、鐵死亡和銅細胞凋亡。 利用 exoRBase 數據庫的血液外泌體的 RNA 測序 (RNA-seq) 數據、癌癥基因組圖譜 (TCGA)數據庫組織的 RNA-seq 數據聯合GTEx 數據庫的對照樣本,以及GEO數據庫中單細胞 RNA 測序 (scRNA- seq)的數據。 作者首先將來自 exoRBase 和 TCGA 數據庫的 KIRC 隊列的差異表達基因(DEGs)與從單細胞數據集中獲得的 CDRGs 和 DEGs 進行交叉,然后, 進一步使用臨床指標和機器學習方法篩選出候選生物標志物基因,從而構建一個 KIRC 的診斷模型。 最后,使用 scRNA-seq、用于轉座酶可及染色質測序的單細胞分析 (scATAC-seq) 和空間轉錄組學測序 (stRNA-seq) 數據研究了關鍵基因的潛在機制及其在腫瘤微環境中的作用。本文證明13-基因診斷模型在KIRC篩查中具有較高的準確性,而TRIB3high腫瘤上皮細胞可能是KIRC有前景的治療靶點。
一 背景
腎細胞癌 (RCC) 是最常見的腎臟腫瘤,占腎臟惡性腫瘤的 90% 和所有癌癥的 3% 。 腎透明細胞癌 (KIRC) 是最常診斷的病理分類,約占 RCC 的 80% 。 盡管 KIRC 預后相對良好,但近 30% 的局部晚期病例會因局部復發或遠處轉移而復發 。關于該疾病的發病機制和潛在機制仍有許多問題有待闡明,而且對 KIRC 診斷方法的鑒定研究還處于起步階段。 構建一個涵蓋篩查、診斷和預后預測的新型臨床模型對臨床環境具有巨大意義,并為精準醫學治療決策提供新見解。本研究的數據集信息和工作流程如圖 1 所示。

二 結果
多個組織來源中KIRC的轉錄組信息
首先從GEO數據庫提供的五個獨立數據集中收集了48個KIRC樣本。樣本包含癌癥、癌旁組織和來自腎切除術或活檢檢查的健康組織。保留了來自五個獨立數據集的216,155個單細胞并用于以下分析。用Seurat包處理并去除批次效應后,確定了54個細胞簇和10種主要細胞類型以及細胞類型的特定標記和相對豐度(圖2A, 圖2B)。上皮細胞在所有細胞區中占主導地位,表達CA9的典型標志物的腫瘤上皮細胞完全來自腫瘤組織和具有多種起源的正常上皮細胞。使用UMAP可視化了每種主要細胞的類型及其起源的分布(圖2C)。隨后,根據他們的表達譜探索了各種只要細胞類型的癌癥和對照樣本之間的DEG,條形圖顯示了上調和下調DEG的確切計數,餅圖顯示它們在KEGG路徑中顯示其相應類別(圖2D),其中大部分屬于“人類疾病”。有趣的是,腫瘤和正常上皮細胞之間的DEG數最高,其次是癌癥和對照樣本之間的Endo和Fib之間的DEG(圖2D),證明了轉錄組結構細胞的顯著改變及其在腫瘤發生中的基本階段。接下來,根據TCGA隊列與GTEx中的健康樣本合并,進一步解剖了KIRC的轉錄組景觀(圖2E),揭示了癌癥組織中4604,604個上調和2,073個下調DEG(圖2F)。

KIRC中CDRGs的表達模式
作者分析了細胞凋亡、壞死性凋亡、自噬、細胞焦亡、鐵死亡和銅死亡等六種 PCD 及其相關基因 CDRG,顯示出共性和特異性(圖 3A)。 可以看出鐵死亡和自噬共享的基因數量非常多。 圖 3B 所示,大多數 CDRG 在單細胞和 RNA-seq 數據集中都是上調的 DEG,下調的 DEG 比例非常低,其中大部分屬于自噬、細胞凋亡和鐵死亡途徑。 這種現象提出了一個說明性的斷言:CDRGs 的表達水平有不同程度的增強。接下來,作者將 exoRBase KIRC 中上調(圖 4A)和下調(圖 4B)的 DEG 與從單細胞和 TCGA 數據集中獲得的 CDRG 和 DEG 相交,以篩選53個候選生物標志物基因。其中, 20 個基因被上調(圖 4C),33 個基因在 KIRC 患者的血液來源外泌體中被下調。 同時,候選生物標志物基因的這種差異表達趨勢在 TCGA 數據集和上皮細胞、Endo 和 Fib(即結構細胞)的單細胞數據集中基本一致。 這些發現表明外泌體在協調與腫瘤細胞的對話和深刻影響 TME 改變方面的關鍵作用。這 53 個候選生物標志物基因與臨床標志物之間的相關性表明,53 個基因中的 32 個與患者的臨床分期或生存結果密切相關,在 KIRC 中作為風險或保護因素發揮雙重作用(圖 4D)。 此外,與鐵死亡和自噬相關的基因占32個,其中一小部分基因屬于細胞凋亡和壞死性凋亡。 其中,32 個基因中有 13 個同時與 KIRC 的臨床分期和生存結果相關包括 PIP4K2C、FIS1、PSAT1、ERBB2、TRIB3、CLU、GABARAPL2、LRBA、PCK2、CDKN1A、 FKBP1A、MAP1LC3B 和 ITGA6基因。


13-基因診斷模型驗證及機制探索
作者使用 13 個關鍵基因構建了 KIRC 的診斷模型,首先, 將 exoRbase 數據庫中的所有樣本隨機分為兩組(訓練集和測試集),比例為 3:2 以進行交叉驗證。 可以看出13- 基因診斷模型在 exoRbase 數據庫的 KIRC 數據集中表現出出色的鑒別能力(圖 5A),訓練集和測試集的 AUC 值分別為 1 和 0.965。同樣,用 TCGA KIRC 隊列中的 13 個基因構建的模型顯示出有希望的診斷結果,訓練和測試集中的 AUC 值分別為 1 和 0.982(圖 5B)。 此外,由包含 656 個 KIRC 病例的 GEO 數據庫提供的 GSE167093 被用作額外的驗證隊列,表現出極高的診斷準確性,AUC 值為 0.914。 研究結果明確表明,13- 基因診斷模型在檢測 KIRC 時非常穩定和值得信賴,無論樣本是取自血液來源的外泌體還是實體組織,都確保了高靈敏度和特異性。作者根據 scRNA 數據發現這些基因在不同細胞類型中的異常表達模式,尤其是 CLU、CDKN1A、PSAT1 和 MAP1LC3B,它們在幾乎所有細胞類型中都有差異表達。 隨后,作者分析了 KIRC 病例的 scATAC 數據集中的 63,489 個細胞,根據標記基因識別了 15 種主要細胞類型(圖 5C、D)。 有趣的是,作者發現 TRIB3 表達在腫瘤上皮細胞中高于正常上皮細胞。 同時,與正常 PT 細胞簇(圖 5E)(腎臟中常見的上皮細胞類型)相比,其染色質可及性顯著增加。

TRIB3high 腫瘤上皮細胞綜合描述
接下來,作者研究了 TRIB3 在 TME 及其相應細胞亞群中的影響。 對 TRIB3 的分析表明,該基因與 KIRC 的 TNM 分期呈正相關(圖 6A-C),暗示其在 KIRC 的生存結果中起不利作用,這可能是癌細胞轉移的主要原因。 因此,作者側重于了解 TRIB3 在腫瘤上皮細胞特定表型中的作用,后者是從 scRNA 數據集中提取的,并在降維后進一步可視化。 值得注意的是,TRIB3high 子集出現在分散的腫瘤上皮細胞中(圖 6D),并且與 PT 具有更高的相似性(R = 0.864)(圖 6E)。 此外,偽時序分析表明,這種細胞亞群可能是原始癌癥干細胞(圖 6F)。 細胞間通訊分析表明,TRIB3high 腫瘤細胞的相互作用比其他細胞類型更廣泛、更強烈,尤其是與 Mac 和 T 細胞的相互作用(圖 6G)。 同時,甘油醛-3-磷酸脫氫酶 (GAPDH) 的高表達可能預示著這種細胞類型具有很強的外泌體組裝和聚集能力。 細胞-細胞相互作用網絡分析的結果揭示了 TRIB3high 腫瘤上皮細胞與其他細胞類型在某些特定區域具有更高的相互作用。與其他細胞簇相比,TRIB3high 腫瘤上皮細胞主要富集細胞凋亡、鐵死亡、核糖體和溶酶體信號通路(圖 7A、B)。 最后,空間轉錄組學分析證實 TRIB3high 子集在腫瘤組織中高度富集(圖 7C)。


討論和結論
作者成功構建具有 13 個基因的診斷模型, 并在血源性外泌體樣本和組織樣本中均顯示出高診斷效能。 基于單細胞組學的溯源分析表明,基因的表達和改變在TME中以多種細胞身份呈現,尤其是在結構細胞和巨噬細胞中。值得注意的是,癌細胞可以分泌外泌體誘導癌癥相關成纖維細胞和癌癥相關內皮細胞的產生,從而促進 TME 的重塑。并且作者發現其中一個基因,TRIB3 的高表達與 KIRC 患者的晚期臨床分期和較差的預后密切相關。