今天跟大家分享的是發(fā)表在Clinical Epigenetics(IF: 6.5507)上的一篇文章,主要是基于DNA甲基化識(shí)別胰腺癌預(yù)后相關(guān)亞型,并闡述不同亞型患者在預(yù)后亞型,分子特征等多方面存在的差異。
胰腺癌中DNA甲基化預(yù)后相關(guān)亞型的識(shí)別
Identifcation of prognosis-related molecular subgroups based on DNA methylation in pancreatic cancer
1.數(shù)據(jù)
TCGA數(shù)據(jù)的胰腺癌表達(dá),突變,拷貝數(shù)改變和甲基化數(shù)據(jù)。
2.基于DNA甲基化識(shí)別胰腺癌不同亞型
首先基于單因素Cox比例風(fēng)險(xiǎn)回歸生存分析對(duì)CpG位點(diǎn)進(jìn)行過濾,接著進(jìn)一步基于多因素Cox比例風(fēng)險(xiǎn)回歸分析識(shí)別出與預(yù)后相關(guān)的4227個(gè)CpG位點(diǎn)。基于CpG位點(diǎn)對(duì)胰腺癌患者進(jìn)行一致性聚類?;谝恢滦跃垲惙治龅臉?biāo)準(zhǔn),當(dāng)CDF線下面積趨于穩(wěn)定,沒有明顯增加時(shí)選取K值為4,將樣本劃分為4類(圖1A-C)。不同亞型中4227個(gè)CpG位點(diǎn)甲基化表達(dá)及相應(yīng)的臨床病理信息如圖1D所示。

圖1. 胰腺癌亞型的識(shí)別
3.不同亞型的生存分析及臨床特征比較
四組患者的總生存時(shí)間和無(wú)進(jìn)展生存時(shí)間存在顯著差別(圖2A,C),其中C1組患者預(yù)后顯著優(yōu)于其他3組(圖2B,D)。對(duì)四組患者的不同臨床特征(年齡、性別、stage,TNM分期等)進(jìn)行比較 (圖2E-K),研究者發(fā)現(xiàn)不同亞型患者中的臨床特征存在顯著區(qū)別,其中C1組樣本中富集到更多的年輕患者和腫瘤等級(jí)較低患者。以上結(jié)果表明,臨床病理特征與亞型密切相關(guān)。

圖2. 不同亞型的生存分析及臨床特征比較
4.亞型的分子特征比較
為進(jìn)一步研究預(yù)后相關(guān)亞型在分子機(jī)制上的差異,研究者對(duì)不同亞型患者的分子特征進(jìn)行比較。在所有樣本中突變頻率最高的25個(gè)突變基因中,KRAS、TP53等基因在C1亞組的改變頻率明顯低于C2/3/4亞組(圖3A-B)。另外,對(duì)4個(gè)亞型的六種免疫細(xì)胞浸潤(rùn)含量進(jìn)行比較,發(fā)現(xiàn)C1組巨噬細(xì)胞、CD4+T細(xì)胞、CD8+T細(xì)胞的免疫浸潤(rùn)含量明顯高于C2/3/4組(圖3C-D)。以上結(jié)果表明C1組可能處于免疫增強(qiáng)狀態(tài),有助于解釋C1組乳腺癌患者預(yù)后較好。

圖3. 亞型的分子特征比較
SMAD4是一種已知的胰腺癌抑制基因。本研究結(jié)果表明SMAD4的表達(dá)與其拷貝數(shù)改變顯著相關(guān)(圖4A),SMAD4在C1組中表達(dá)顯著高于C2/3/4子組,且在C1組中更易發(fā)生雙缺失(圖4B-C)。另外,本研究也發(fā)現(xiàn)PLEC表達(dá)水平與其拷貝數(shù)之間存在顯著相關(guān)性(圖4D)。在C1亞組中,PLEC表達(dá)水平明顯低于C2/3/4亞組(圖4E),而在C2/3/4亞組中,PLEC的擴(kuò)增頻率較高(圖4f)。

圖4.SMAD4和PLEC在C1和C2/3/4亞群中的拷貝數(shù)改變
5. CpG位點(diǎn)對(duì)應(yīng)基因的GO和KEGG分析
為進(jìn)一步研究預(yù)后相關(guān)亞群劃分背后的分子機(jī)制,研究者對(duì)用于一致性聚類的4227個(gè)CpG位點(diǎn)所對(duì)應(yīng)的基因進(jìn)行GO和KEGG分析。首先基于GENCODE中的GRCh38注釋對(duì)4227個(gè)CpG位點(diǎn)進(jìn)行注釋,最終注釋到2939個(gè)基因。2939個(gè)基因在4個(gè)亞組間的基因表達(dá)模式存在差異,說明各亞組間存在內(nèi)部異質(zhì)性。對(duì)2939個(gè)基因進(jìn)行進(jìn)行GO和KEGG分析(圖5B-E),KEGG分析的結(jié)果識(shí)別出多種經(jīng)典的腫瘤相關(guān)通路,如PI3K-AktHippo、AMPK和P53信號(hào)通路(圖5E)。

圖5. CpG位點(diǎn)對(duì)應(yīng)基因的GO和KEGG分析
6.基于五個(gè)CpG位點(diǎn)的預(yù)后預(yù)測(cè)模型的構(gòu)建
為開發(fā)一種特異性工具來預(yù)測(cè)胰腺癌患者預(yù)后,研究者基于CpG位點(diǎn)的表達(dá)建立一個(gè)風(fēng)險(xiǎn)模型。首先,識(shí)別出在C1和C2/3/4亞組之間發(fā)生差異甲基化的CpG位點(diǎn)。C1組甲基化水平相對(duì)較低,而C3組甲基化水平最高,111個(gè)CpG 位點(diǎn)在C1和C2/3/4亞組之間發(fā)生差異表達(dá)(圖6A-C)。

圖6.差異甲基化位點(diǎn)的識(shí)別
為構(gòu)建預(yù)后預(yù)測(cè)模型,研究者將所有樣本隨機(jī)分為訓(xùn)練集(N= 125)和驗(yàn)證集(N= 53),使用Lasso模型構(gòu)建預(yù)后預(yù)測(cè)模型,最終構(gòu)建出由cg23811464、cg19267846等5個(gè)位點(diǎn)組成的風(fēng)險(xiǎn)打分公式(圖7A-B)。基于風(fēng)險(xiǎn)打分的中位數(shù)將訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)分成高低風(fēng)險(xiǎn)兩組,其生存狀態(tài)和5個(gè)位點(diǎn)表達(dá)如圖7C-D,7F-G所示。不論是在訓(xùn)練數(shù)據(jù),還是驗(yàn)證數(shù)據(jù)中,兩組患者總生存時(shí)間均存在顯著差異(圖7E,H)。ROC曲線分析表明該打分模型在訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)中均有較好的分類效能(圖8A,B)。

圖7.CPG位點(diǎn)打分模型的構(gòu)建
7.基于獨(dú)立預(yù)后因素構(gòu)建列線圖模型
列線圖模型可作為臨床醫(yī)師進(jìn)行臨床決策的可靠工具。本研究綜合利用5CPG位點(diǎn)風(fēng)險(xiǎn)評(píng)分模型和其他臨床病理信息,構(gòu)建更有效、更直觀的列線圖模型。首先,基于單因素cox分析識(shí)別出可作為預(yù)后因素的臨床特征,包括風(fēng)險(xiǎn)模型,年齡等。多因素Cox分析進(jìn)一步識(shí)別出風(fēng)險(xiǎn)評(píng)分模型、年齡等為獨(dú)立的預(yù)后相關(guān)因素?;诹芯€圖模型分別預(yù)測(cè)胰腺癌患者1年、3年和5年生存率,ROC曲線表明該模型具有良好的預(yù)測(cè)效能 (圖8C-D)。風(fēng)險(xiǎn)評(píng)分與列線圖模型均具有良好的預(yù)測(cè)效能,然而風(fēng)險(xiǎn)評(píng)分模型的C-index低于列線圖模型 (圖8E-F)。為進(jìn)一步比較風(fēng)險(xiǎn)評(píng)分和列線圖模型的預(yù)測(cè)效果,研究者進(jìn)行決策曲線分析,結(jié)果表明列線圖模型的預(yù)測(cè)效果更好(圖8G-H)。

圖8. 列線圖模型的構(gòu)建
今天的內(nèi)容就是這些,不知道大家都掌握的怎么樣呢?讓我們最后再來總結(jié)一下,首先基于單因素Cox比例風(fēng)險(xiǎn)回歸生存分析對(duì)CpG位點(diǎn)進(jìn)行過濾,接著進(jìn)一步基于多因素Cox比例風(fēng)險(xiǎn)回歸分析識(shí)別出與預(yù)后相關(guān)的位點(diǎn),從而進(jìn)行一致性聚類。聚類后的樣本在生存時(shí)間,臨床特征和基因組改變等方面存在顯著差異。為進(jìn)一步構(gòu)建預(yù)后相關(guān)的CPG位點(diǎn)預(yù)測(cè)模型,研究者識(shí)別出在不同類別中存在差異的CPG位點(diǎn),并基于lasso構(gòu)建CPG預(yù)測(cè)模型,以及在臨床中更為有效實(shí)用的列線圖模型。
本文是一篇經(jīng)典的基于DNA甲基化特征構(gòu)建癌癥預(yù)后標(biāo)志的文章,非常適合大家學(xué)習(xí)。感興趣的同學(xué)可以在本文的研究流程和研究思路基礎(chǔ)上,對(duì)癌型,模型構(gòu)建方法做許多改動(dòng)或者提升,也行不錯(cuò)的文章就在向你招手哦~