預后模型的構建思路相信各位小伙伴已經爛熟于心了,一般是基于基因表達、甲基化或者突變等多個基因組指標的一個或多個構建預后模型并進行驗證,進而將其擴展到泛癌水平。但在今年4月15日EBioMedicine(IF=8.143)發表的這篇低級別膠質瘤的預后模型文章卻讓人眼前一亮,作者運用多種臨床指標與基因表達構建低級別膠質瘤預后模型對患者預后顯示出了良好的預測效能。多種指標是如何整合在一起的?快來和小編一起看看吧!
APOLLO: An accurate and independently validated prediction model of lower-grade gliomas overall survival and a comparative study of model performance
APOLLO:一個準確且獨立驗證的低級別膠質瘤總生存率預測模型和模型性能的比較研究
一.研究背景:
膠質瘤是大腦和中樞神經系統最常見的惡性腫瘤,占惡性腦腫瘤的80%以上。低級別膠質瘤(LGG)由彌漫性低度和中度膠質瘤組成,與膠質母細胞瘤(GBM)的患者相比,LGG患者預后更佳。然而幾乎沒有準確和穩健的低級別膠質瘤(LGG)生存預測模型存在,已有的預測模型僅僅進行了有限的模型驗證,因為大多數模型要么依賴于訓練種群或在測試種群中再訓練模型來評估模型性能,會由于過擬合而被高估。于是作者通過結合人口統計學、臨床信息以及具有主要效應的基因-基因相互作用的轉錄生物標志物來構建LGG準確且獨立驗證的預后預測模型APOLLO,作者還將其開發為一個在線工具,供研究者免費使用。
圖1 APOLLO的開發及驗證流程
二.主要結果
1.APOLLO的開發與構建
作者首先收集整理了TCGA-LGG、中國膠質瘤基因組圖譜(CGGAⅠ)、CGGA2、GSE108476、GSE61374和GSE16011共6個膠質瘤隊列的臨床及基因表達數據。作者使用了由COSMIC定義的723個泛癌驅動基因中6個隊列共享的680個基因,共1420個LGG樣本進行后續的研究。圖1描述了作者研究的工作流程。
對于主要效應分析及G×G互作分析使用兩個Cox模型:
Model1: h(t)=h0(t)exp(α × gene + ∑βi × covariatei)
Model2: h(t)=h0(t)exp(α1 × gene1 + α2×gene2 +
α3×gene1×gene2 + ∑βi × covariatei)
并且矯正了協變量,包括年齡,WHO分級,IDH突變和1p/19q狀態。在這一步,作者識別了與TCGA隊列總生存率相關的42個主效應基因和307對G×G互作基因,其中28個主效應基因和27對G×G互作基因在CGGA1隊列中被驗證為候選轉錄預測因子。接下來作者在TCGA訓練隊列中通過正向逐步回歸對候選轉錄因子篩選以構建最終的Cox模型,最終的模型包括5個主效應基因和4對G×G互作基因。通過Cox模型的系數估計,圖2將APOLLO_Score和Transcriptional_Score進行定義。

2.APOLLO的轉錄預測因子及其免疫相關性
通過KEGG富集分析發現基因富集到包括膠質瘤通路在內多條通路,GO注釋鑒定出279個生物過程通路、24個分子功能通路和20個細胞成分通路,提示潛在的生物功能。作者通過中位Transcriptional_Score將患者分為高風險組和低風險組,發現兩組間22種免疫細胞比例存在顯著差異(圖3A);Transcriptional_Score與基質得分,免疫得分和ESTIMATE得分相關(圖3B),此外,作者還觀察到轉錄預測因子和免疫檢查點基因之間的高連通性和高相關性(圖3C)。因此,APOLLO可能在指導免疫治療方面有潛在作用。
圖3 轉錄預測因子與腫瘤免疫微環境之間的關聯
3.APOLLO的預測效能及驗證
接下來作者對APOLLO進行多種驗證。首先通過APOLLO打分中位數將TCGA訓練集和測試集樣本分為兩組。在TCGA隊列和CGGA1隊列以及4個外部測試集中,高危組較低危組具有較差的生存,且顯示出較大的風險比(HR)值(圖4a-f)。進一步作者為了證實APOLLO的鑒別能力,通過五分位數將患者分為6組。中位生存期隨著APOLLO得分的分組升高而急劇降低,得分最高的組與較短的生存期和較高的死亡風險相關(圖4g-h)。
圖4 APOLLO評分分層的LGG患者生存曲線
在TCGA和CGGA1中,APOLLO相當準確地預測了36和60個月的生存率(圖5a-b),在外部測試集中也展現出良好的預測能力(圖5c-f). 此外,APOLLO在TCGA訓練隊列和CGGA1內部測試隊列以及4個外部測試隊列中均表現出良好的c指數(圖5i)。
圖5 APOLLO對36和60個月總生存預測的ROC曲線
以36個月生存期為重點,APOLLO與無干預且具有合理閾值概率的策略相比,APOLLO模型的凈收益(NB)高于基本模型(圖6a),這意味著APOLLO可以減少55.4%的不必要的臨床干預(圖6b)。敏感度的分析顯示,APOLLO的決策曲線也高于其他策略,且在36個月和60個月的平均NB和 NR均為最佳(圖6a-e)。在進一步的評估APOLLO的穩健性中,作者進行了全方面的亞組分析。在所有的亞種群中,APOLLO均表現出較好的鑒別能力。
圖6 APOLLO臨床應用的決策曲線和nomogram圖
以上文章的大體內容就介紹完啦,下面應該是小伙伴們最關心的如何應用作者構建的APOLLO預測模型啦。作者將其成果開發了一個在線網站(http://bigdata.njmu.edu.cn/APOLLO/)供大家免費使用,且不需要任何編程功底哦。
我們打開網站主頁,頁面做的也相當精美,首先映入眼簾的便是APOLLO的介紹與實例結果(圖7)。
圖7 APOLLO主頁
接下來我們來學習一下如何使用呢。如圖所示,在左側我們可以輸入患者的臨床指標,如年齡、分級、IDH突變狀態,1p/19q狀態以及是否需要添加轉錄組打分。
在我們選擇需要添加轉錄組打分后,點擊Edit score,就需要我們添加各個基因的log2的基因表達值。點擊OK,在Edit score旁就會實時出現作者在文中所計算的APOLLO打分。
通過改變基因的表達值,結果也都是實時顯示的,右側顯示了LGG患者36個月以及60個月的總生存率預測及預測曲線。ROC曲線展示了模型的預測效能,nomogram圖也進一步的驗證解釋結果。
總的來說,作者通過整合多種臨床及基因組轉錄組指標,構建了低級別膠質瘤穩健且易于實現的預后預測模型,結合多套數據集進行驗證,嚴謹可靠。開發的網站非常簡介美觀,使用基本不存在難點,且可以實時展示結果。這為我們構建預后模型的工作也提供了一定的思路,不再局限于篩基因特征,適當的加入一些臨床及多組學指標可能會使模型的效能更好哦。小伙伴們快快學起來!