小伙伴們大家好哇!今天依然給大家介紹預后模型構建的文章,快來和小編一起看看這篇今年7月13號發表在Journal of Oncology(IF=4.501)上的預后模型的文章吧!
A Novel Thrombosis-Related Signature for Predicting Survival and
Drug Compounds in Glioblastoma
一種預測膠質母細胞瘤生存和藥物化合物的血栓相關新特征
一.研究背景
膠質瘤是中樞神經系統最常見的原發性惡性腫瘤,約占成人原發性惡性腦腫瘤的80%。GBM患者的總生存期為1~15年,且個體差異較大。隨著測序技術和分子診斷技術的發展和應用,目前臨床上已經建立了較為客觀準確的腫瘤分類體系。然而,目前已知的分子標志物只能部分解釋GBM患者的預后。
靜脈血栓栓塞(VTE)包括深靜脈血栓(DVT)和肺栓塞(PE),廣泛發生于各種癌癥,包括GBM。GBM靜脈血栓栓塞發生率高,易發生并發癥。除了VTE外,膠質母細胞瘤內血栓形成可能因血管阻塞引起缺血或壞死,也是影響膠質母細胞瘤患者預后的重要因素。既往研究表明血栓形成相關基因介導GBM轉移、血栓形成等生物學過程,提示血栓形成相關基因改變可能在膠質母細胞瘤的診斷和預后預測中發揮重要作用。于是作者對血栓相關基因通過多組學篩選并構建了一個膠質母細胞瘤的獨立預后風險打分模型,旨在為GBM的分子診斷和個體化治療提供幫助。
二.主要結果
1.基于血栓形成相關基因的GBM預后風險評分模型的構建與驗證
整體研究設計如圖1所示。作者首先通過在文獻中查找到140個與血栓形成相關的基因,其中124個基因在TCGA和CGGA數據集中有表達,作者選擇這些基因進行后續分析。

為了確定GBM中與預后相關的血栓形成相關基因,通過對TCGA訓練級進行LASSO回歸分析,從124個基因中篩選出13個基因(圖2a、b)。然后作者基于13個基因的LASSO回歸系數構建了血栓相關基因表達風險評分模型,公式為我們常規的13個基因的表達值乘以系數值的累加和,在此我就不進行詳細描述啦。接下來作者根據risk score的中位數將TCGA訓練集的樣本分為高危組及低危組。如圖2c和圖2d所示,高危組患者OS明顯低于低危組患者。通過timeROC分析顯示,風險評分模型的AUC值為0.752,證明了該風險評分模型在TCGA訓練隊列中對患者預后具有良好的準確性和預測能力(圖2e)。

接下來,作者對血栓相關基因表達風險評分模型進行了多數據集的驗證。首先作者在TCGA測試集和總數據集中進行驗證,在測試集中圖2(f)和圖3(i)的結果顯示出與相同趨勢的結果,即高危組GBM患者的預后生存明顯短于低危組,TCGA測試集和總數據集的ROC曲線分別為0.658和0.704(圖2h和3k)。

CGGA數據進一步驗證顯示高危組GBM患者預后較低的趨勢相似(圖3m),ROC曲線的AUC為0.714(圖3n),CGGA數據集中風險評分分布及患者生存狀態如圖3l所示。這些發現表明,基于血栓相關特征的風險評分模型對患者OS具有良好的生存預測能力。
2. 血栓形成相關基因signature的功能富集分析
為了探索預后性血栓形成相關基因signature在GBM中的潛在生物學功能,作者使用了GSVA分析。圖4a展示了GO富集分析、KEGG分析及HALLMARK分析結果。此外,作者為了按研究血栓相關基因的表達與已知的signature的相關性,如圖4b所示,低危組與高危組在APM表達、細胞周期調控、EMT2、FGFR3相關信號、組蛋白、免疫檢查點、核苷酸切除修復和pan_f_tbr信號等方面存在顯著差異。m6a相關基因在低危組和高危組也具有明顯差異(圖4c)。

3.血栓形成相關預后基因的免疫功能分析
基于ESTIMATE、MCP-counter、TIMER和xCell算法,作者分析了TCGA數據集中風險評分與免疫因素間的相關性。如圖5所示,風險評分與Tumor Purity呈負相關,與Stromal score、Immune score、ESTIMATE score呈正相關;此外,基于MCP-counter進行風險評分與免疫細胞亞群的相關性分析顯示,風險評分與細胞毒性淋巴細胞和NK細胞負相關,而與單核細胞系、髓樣樹突狀細胞、中性粒細胞、內皮細胞和成纖維細胞正相關;TIMER對風險評分與免疫細胞亞群進行相關性分析和xCell也顯示風險評分與B細胞、CD8+細胞、CD4+細胞、中性粒細胞、巨噬細胞和樹突狀細胞(DC)相關。

4. 血栓形成相關預后基因的體細胞突變分析
在此部分,作者分析了TCGA-GBM數據集中經過血栓形成相關基因的GBM預后風險評分模型分組的高危組和低危組之間的體細胞突變差異。在低危組中,超過10%的樣本中有16個基因發生突變,而在高危組中只有12個基因符合標準,其中9個基因重疊(圖6a)。有趣的是,TP53、TTN、PTEN和EGFR在低危組和高危組中突變頻率均占據前四位,它們相互作用調控GBM相關的各種生物學過程,提示它們可能參與了腫瘤的惡化。此外,目前已發現的GBM前致病基因(IDH1、TP53、ATRX、NUP16、TIAM2、NEK10和ABCA1)在高危組和低危組之間的突變頻率存在顯著差異(圖6b)。

接下來,作者通過CoMEt算法對25個最常見的突變基因進行了共發生和特異突變進行了研究。HYDIN和FLG、AHNAK和SYNE1、NF1和LRP2基因共發生突變(圖6c),這表明它們在同一通路中可能存在互補作用。
5. 高危患者潛在治療藥物的鑒定
為了確定具有高危評分的GBM患者的潛在治療藥物,作者分析了PRISM和CTRP-derived的藥物反應數據。作者首先篩選在高風險和低風險組中反應不同的候選藥物,以識別具有高風險評分的患者中具有較高藥物敏感性的化合物。候選藥物符合兩個標準:藥物在高、低風險人群中反應敏感度不同;采用候選藥物AUC估計值與風險評分之間的Spearman相關分析,選擇相關系數為負的化合物。分析得到9個PRISM衍生化合物(圖7e和f)和3個CTRP-derived化合物(圖7g和h)。所有這些化合物在高危組中AUC值均較低,且與風險評分呈負相關(圖7e、h)。


接下來作者對低危和高危GBM患者的臨床和分子特征進行了研究。作者對不同組的臨床病理特征進行風險分層分析,以評估風險評分模型的預后價值。眾所周知,老年是惡性膠質母細胞瘤的危險因素。如圖7a所示,在TCGA GBM隊列中,年齡在65歲以下的GBM患者和65歲及以上的高風險評分的GBM患者的預后均較低風險評分的GBM患者差。目前,IDH突變被認為是預測GBM患者預后的分子標記。在TCGA-GBM和CGGA數據集中作者發現,高風險評分的IDH野生型患者預后較差,再IDH突變患者中也發現了同樣的趨勢(圖7b)。圖7c和圖7d顯示顯示未接受放療和化療的高危組患者預后最差。相比之下,接受放療或化療的低風險組患者的預后最好。以上結果證明基于血栓相關基因的風險評分模型可作為GBM患者獨立的預后因素。
6. 膠質母細胞瘤臨床特征風險模型的構建與評估
在此部分,作者根據血栓相關特征和臨床因素(年齡、性別、IDH突變狀態、放療和化療)建立了一個nomogram圖預測1年、2年和3年總生存期的風險評分(圖8a)。校準圖顯示,nomogram預測TCGA GBM和CGGA隊列的1年、2年和3年OS的能力較為良好,預測的2年OS接近于實際的2年OS(圖7b和7e)。根據臨床特征的風險模型,生存曲線顯示高危組和低危組的OS存在顯著差異(圖7c和7f)。如圖7(d)和7(g)所示,TCGA和CGGA隊列的ROC曲線的AUC分別為0.765和0.785,表明臨床特征風險模型比基于血栓相關基因標記的風險評分模型具有更好的準確性和穩定性。


自此,這篇文章就介紹完啦,總結一下:作者首先基于篩選了與GBM患者預后顯著相關的血栓形成相關基因構建預后模型,然后進行多角度驗證,通過富集分析發現預后相關的血栓形成相關基因在多種癌癥通路和功能上富集,驗證模型的穩定性及可行性;通過風險打分的高低分組關聯基因突變等多組學分析以及聯合臨床特征分析進一步升華主題。簡單來講,這還是我們熟悉的預后模型構建思路,通過變換基因集和疾病極好復現,前提是這個基因集在你所研究的疾病中務必要有一定的意義。快快動起來,下一個發文章的就是你嘍!