導讀:
今天給大家分享的文獻是2022 年 5 月發表于《EBioMedicine》(IF:8.143)上的一篇文獻。這篇文獻介紹了一種基于個體樣本中基因表達水平排序的個體化通路活性計算 (IPAM) 的新方法。利用 IPAM,研究人員對來自 TCGA 中的 33 種癌癥的 10528 個腫瘤/正常樣本計算了KEGG 數據庫的 318 條通路的通路活性,以識別不同癌癥類型之間的特征性失調通路。

個體化通路活性算法識別泛癌分析中的致癌通路
算法開發流程
1. 數據收集
2. 算法原理
該研究共納入 TCGA中的33種癌癥類型隊列中的 10528 個腫瘤/正常樣本。首先對于給定的樣本,將所有基因的表達值從小到大排序,排序值作為基因的表達水平。為減少基因表達的微小變化對整個通路活性水平的影響,突出變化大的基因對表達水平的影響,研究人員將相同十位的基因等級視為同一水平,分配給相同的分數。然后通過將每個通路中所有基因的基因表達水平相加并除以該特定通路的基因數量來計算途徑活性,以解釋不同通路中的基因數量效應。最后獲得了318 條 KEGG 通路的通路活性用于后續分析(圖1)。

結果
1. IPAM 在癌癥分類中的性能
為評估 IPAM 的性能,研究人員將其與其他算法和工具進行比較。圖2a結果顯示,在所有通路活性算法中,IPAM 在幾乎所有癌癥類型中都具有最高的分類性能。為進一步驗證 IPAM 的穩定性,研究人員利用IPAM對來自GEO 數據庫中的獨立癌癥數據集進行分類,IPAM 表現出比其他五種通路活性算法(iPAS 、Pathifier、PLAGE、ssGSEA 和 IndividPath)更好的性能(圖2b)。此外,在血小板 (TEP) 數據集的分析中,IPAM 在癌癥早期診斷中表現出的潛力顯著優于除 Pathifier 之外的其他方法(圖2c)。綜上,IPAM在多種癌癥數據的癌癥分類中具有顯著優勢,在癌癥的早期診斷中也具有很高的應用潛力。
2. 通路失調的泛癌鑒定
研究人員在TCGA的20 個不同癌癥隊列中對 318 條 KEGG 通路進行差異分析,以識別不同癌癥類型之間的特征失調通路。圖 2d結果顯示,在所有癌癥類型中,肺鱗狀細胞癌(LUSC)、膽管癌(CHOL) 和 腎透明細胞癌(KIRC) 的失調通路數量最多,而 胰腺癌(PAAD)、宮頸鱗癌和腺癌(CESC)和子宮內膜癌(UCEC)的最少。在318條 KEGG 通路中,酪氨酸代謝通路在大多數癌癥類型中都變化顯著,并在除 CESC、PAAD 和前列腺癌(PRAD )之外的 17 種癌癥類型中都顯著失調(圖 2e、f)。為確定不同癌癥之間的特征失調通路,研究人員基于 318 條 KEGG 通路的變化程度進行聚類分析。圖2g中的聚類結果顯示出很強的組織特異性,具有相同組織學起源的癌癥類型表現出相似的通路失調模式。

3. 基于通路活性的生存分析
具有不同通路失調模式的癌癥類型可能在生存結果方面存在差異。因此研究人員對每種途徑進行生存分析,鑒定出多種癌癥類型中與生存相關的通路。圖 3a結果顯示,在所有癌癥類型中,腦低級別膠質瘤(LGG)、腎透明細胞癌(KIRC)和葡萄膜黑色素瘤(UVM)中與患者生存相關的通路最多,直腸癌(READ)、甲狀腺癌(THCA)和子宮肉瘤(UCS)中最少。DNA復制、細胞周期、鈣信號通路以及脂肪細胞中脂肪分解的調節等通路與多種類型癌癥患者的預后顯著相關(圖3b)。圖 3c結果顯示,ECM-受體相互作用、粘著斑、癌癥中的microRNAs和糖胺聚糖生物合成等通路是對癌癥患者生存最不利的通路;乙醛酸和二羧酸鹽代謝、過氧化物酶體、丁酸代謝和脂肪酸降解等通路則是對癌癥者生存最有利的通路。為進一步確定不同癌癥之間的生存特征,研究人員基于 318 條 KEGG 通路的風險比 (HR) 進行聚類分析。圖 3d結果顯示,一些癌癥類型在聚類分析中緊密聚集,如多形成性膠質細胞瘤(GBM)和急性髓細胞樣白血病(LAML)、胃癌(STAD)和 LUSC等,說明這些類型癌癥的患者生存情況具有相似的模式。為檢驗 IPAM 對患者預后的預測能力,研究人員對 25 種癌癥類型進行單變量和多變量 Cox 回歸分析,結果顯示該算法可以作為預測癌癥患者生存的有用工具(圖3e-f)。總而言之,上述結果表明IPAM 能夠表征個體患者的通路失調,可作為癌癥分類和生存預測的有用工具。

4. 不同 KEGG 類別中的泛癌通路失調
KEGG 通路可分為 6 大類,分別是細胞過程、環境信息處理、遺傳信息處理、人類疾病、新陳代謝和生物系統。圖 4a結果顯示,在細胞過程這一類別中,只有細胞周期和 p53 信號通路在大多數癌癥類型中顯著上調;在環境信息處理中,大多數信號轉導通路在大多數癌癥類型中呈下調趨勢;在遺傳信息處理的類別中,大多數通路在大多數癌癥類型中都被上調;在參與代謝的途徑中,大多數這些代謝通路在多種癌癥類型中被下調;在生物系統這一類別中,大多數通路在大多數癌癥類型中都被下調。
為確定不同 KEGG類別之間通路失調的模式,研究人員進一步對每個 KEGG 類別的失調通路進行層次聚類,圖 4b結果顯示包括肺癌(LUAD 和 LUSC)、結直腸癌(COAD 和 READ)和子宮癌(CESC 和 UCEC)在內的大多數癌癥亞型構成了代謝類別聚類分析中的主要組別,表明這些癌癥亞型具有類似的代謝失調模式。

5. 代謝途徑在癌癥途徑失調中起主導作用
通過對每種癌癥類型的 6 個主要 KEGG 類別中顯著失調的通路數量進行統計,研究人員發現所有癌癥中失調的通路屬于代謝類別的數量最多,其次是生物系統類別,而細胞過程類別中的通路失調數量最少(圖5a)。與其他類別的途徑相比,代謝途徑在大多數癌癥類型中失調的概率更大,并且在每個癌癥數據中的樣本之間的異質性差異也最大,說明了代謝途徑的重要作用(圖 5b-c)。于是研究人員利用 11 種癌癥類型中的 85 種代謝通路的通路活性作為腫瘤分類模型,圖 5d結果顯示,基于 85 種代謝途徑的癌癥分類模型與基于所有 KEGG 途徑的預測效率一樣好,體現了代謝途徑在途徑失調中的主導作用。研究人員又將 85 條單獨的代謝途徑細分為 8 個主要代謝類別,分析發現氨基酸、碳水化合物和脂質的代謝在泛癌中廣泛失調,且與多種類型癌癥患者預后顯著相關(圖 5e-g)

6. 支鏈氨基酸代謝影響腎癌的進展和預后
為進一步研究通路失調的驅動因素并闡明癌癥的病理機制,研究人員對特定癌癥類型中通路失調的個別通路進行了系統分析。氨基酸代謝類別的聚類分析結果顯示,纈氨酸、亮氨酸和異亮氨酸生物合成途徑在包括腎嫌色細胞癌(KICH)、腎透明細胞癌(KIRC)和腎乳頭狀細胞癌(KIRP)在內的腎癌中顯著上調(圖 5e)。纈氨酸、亮氨酸和異亮氨酸是支鏈氨基酸 (BCAA),在調節能量穩態和營養代謝中發揮關鍵作用。圖 6a生存分析顯示,高 BCAA 水平與 KIRC 和 KIRP 的不良預后顯著相關。且大多數腎癌患者都出現各種BCAA代謝基因的體細胞拷貝數變異(CNV)丟失(圖6b)。BCAA 表達水平和 1627 個轉錄因子 (TFs) 表達水平之間的相關性分析顯示,轉錄因子PPRA與 BCAA的相關性最顯著(圖 6c)。圖6d中的BCAA 代謝基因的轉錄因子基序富集分析結果顯示,PPRA結合基序在48個BCAA分解代謝基因的啟動子中富集。總的來說,這些結果表明 PPARA 的低表達可能通過下調 BCAA 分解代謝基因引起BCAA積累,導致腎癌預后不良。為驗證這一推論,研究人員對野生型小鼠和 PPARA 敲除小鼠進行差異表達分析,結果顯示大多數 BCAA 分解代謝基因在 PPARA 敲除小鼠中被下調,且這些基因富集與細胞周期相關通路(圖6e-f)。

總結
文章利用TCGA中的泛癌數據開發了一種基于個體樣本中基因表達水平排名的個體化通路活性計算 (IPAM) 的新方法。IPAM 精確量化了泛癌分析中每個通路的活性水平,表現出了優越的癌癥分類和患者預后預測性能。基于該算法,研究人員證實了代謝通路在癌癥通路失調中的主導作用,并確定了特定通路失調的驅動因素。
參考文獻
Ke X, Wu H, Chen YX, Guo Y, Yao S, Guo MR, Duan YY, Wang NN, Shi W, Wang C, Dong SS, Kang H, Dai Z, Yang TL. Individualized pathway activity algorithm identifies oncogenic pathways in pan-cancer analysis. EBioMedicine. 2022 May;79:104014. doi: 10.1016/j.ebiom.2022.104014. Epub 2022 Apr 26. PMID: 35487057.