大家好呀!今天給大家介紹一篇2021年3月發表在Oncogene(IF:9.867)上的一篇文章。目前,已有很多基于蛋白質編碼基因預測胃癌分子分型的方法。本研究作者基于長鏈非編碼RNA分析(FLORA)方法鑒定到1235個腫瘤特異性lncRNAs并確定了3種亞型。其中lncRNA亞型3(L3)的生存情況較差,特征為發生TP53突變,染色質不穩定,低甲基化和致癌lncRNAs過表達。lncRNA亞型1(L1)的生存情況最好,根據LINC01614的表達水平進一步將L1進行分組。作者的結果表明LINC01614過表達可作為一個獨立預后因子并基于網絡功能預測與細胞遷移的相關性。總的來說,作者提出了一個基于lncRNA的GC亞型分類模型,可以預測患者生存情況。
Classifying gastric cancer using FLORA reveals clinically relevant molecular subtypes and highlights LINC01614 as a biomarker for patient prognosis
使用FLORA對胃癌患者進行分類揭示臨床相關分子亞型并強調LINC01614可以作為患者的預后標志物
結果:
1.使用FLORA流程鑒定GC中致癌的lncRNA
作者使用FLORA流程鑒定lncRNA,通過構建共表達網絡和GO富集分析鑒定lncRNA的功能。在TCGA-GC數據集中共鑒定到28507個lncRNA,包括10356個新的lncRNA。根據FPKM>0.1篩選到4700個lncRNA,包括1547個新的lncRNA和3153個已有lncRNA。腫瘤中lncRNA的表達水平較高,與正常組織相比,GC樣本中有1235個上調lncRNA和689個下調lncRNA。
2.基于lncRNA的GC亞型的臨床相關性
基于1235個GC特異性的lncRNA將375個TCGA-GC樣本分為3個簇,分別為L1,L2和L3(圖1A)。有359個lncRNA特異性富集于亞型L3中,包括DUXAP8,H19和HOXCAS3而腫瘤抑制因子GUARDIN下調表達。亞型L3與總生存期最差,而亞型L1的總生存期最好(圖1B)。為了驗證lncRNA亞型的臨床相關性,作者對GC患者的表達譜數據進行分析。亞型L3的總生存期最差(圖1C)。多因素Cox回歸分析表明亞型L3,腫瘤分期和年齡可以預測GC患者的預后(圖2A)。聯合腫瘤分期和lncRNA亞型的預測效果更好。在Ⅰ/Ⅱ分期中亞型L3的總生存期較差。亞型L3可以作為獨立預后因子,表明基于lncRNA的亞型預測總生存期的有效性。

2.基于lncRNA亞型與組織學的相關性
作者基于組織學亞型對胃癌進行分類,彌漫型GC富集于亞型L2中,而腸型GC富集于亞型L1和L3中(圖2B),腸型-L3亞型的預后較差(圖2C和2D)。

3.GC亞型的基因組和表觀組學特征
作者對TCGA和ACRG數據集的基因組學數據進行分析,亞型L3中TP53突變最顯著(圖3A),而亞型L1中ARID1A,PIK3CA,KMT2B,KRAS和FBXW7的突變頻率較高,亞型2中CDH1的突變頻率較高。此外,亞型L1的TMB較高,亞型L3的染色體不穩定性較高,CNV頻率較高(圖3B和3C)。亞型L3中CIN腫瘤比例較高,亞型L2中EBV和GS腫瘤比例較高,亞型L1中MSI腫瘤比例較高(圖3D)。根據CpG島甲基化表型(CIMP)水平將GC患者分為EBV-CIMP,CIMP-h和CIMP-l亞型。亞型L3中非CIMP富集程度最高(圖3E)。

4.亞型L3中TP53突變和DNA甲基化驅動致癌lncRNA表達和侵襲性表型
在亞型L3中富集的lncRNA中有137個低甲基化,包括H19,HOXC13-AS,NOVA-AS1和DUXAP8。H19,TEN1,TEN3和TDG的甲基化水平與表達水平負相關。此外,在發生TP53突變的GC樣本中H19的甲基化水平和表達水平變化顯著。使用FLORA的功能預測功能,作者發現H19的共表達網絡與ECM組織和細胞遷移相關。此外,還構建了HOXA和HOXD基因的HOTAIR共表達網絡,構建了HOXA13,HOXA11和HOXA10基因的HOTTIP共表達網絡。結果表明,H19高表達的亞型L3患者的疾病侵襲性更強,總生存期較差。
5.鑒定GC中致癌lncRNAs
與正常組織相比,GC樣本中有1235個lncRNA顯著上調表達(圖4A),其中有一些lncRNA與生存結果較差相關,包括H19和LINC01614(圖4B)。根據腫瘤中lncRNA的表達水平,與患者生存期的相關性,與GC風險相關的SNP篩選到50個候選基因。其中TCGA,ACRG和Singapore數據集的生存分析表明LINC01614是最重要的候選標志物(圖4C-4E)。大多數與預后有關的lncRNA在亞型L3中過表達,特征為總生存期較差,TP53突變頻率較高,染色質不穩定性和全基因組甲基化水平較低。LINC01614在亞型L1和亞型MSI中顯著高表達。

由于亞型L1與總生存期較好有關,作者根據LIN01614表達水平對亞型L1進行分層。結果表明,在亞型L1中LIN01614高表達的患者與總生存期較差有關(圖5A和5B)。在亞型L1中,LINC01614高表達的患者總生存期較差,MSI富集,彌漫型組織學頻率較高和發現遠端轉移的可能性增加(圖5C-5E)。在TCGA和ACRG數據集中亞型L1中,LINC01614是一個獨立預后因子(圖5F和5G)。

6.實驗驗證LINC01614促進GC發展
實驗結果表明LINC01614在細胞株MKN28,MKN1,GES1和MGC803中異位表達,會導致細胞增殖,集落形成和遷移速度增加(圖6A-6D)。此外,作者對MKN28,MKN1和GES1細胞株敲除LINC01614,敲除LINC01614后的細胞株中細胞增殖減弱,集落形成減弱遷移速度減少(圖6E-6H),該結果強調了LINC01614在促進GC細胞生長和遷移中的致癌作用。

結論:
總的來說,作者基于FLORA流程鑒定TCGA數據集的lncRNA并進行分析,并提出基于lncRNA的胃癌的分型模型。該模型可以準確穩健的分離高風險組。作者對胃癌特異性lncRNA的表達水平和臨床相關性,并鑒定預后lncRNA,其中LINC01614可以作為潛在的生物標志物。最后,作者對LINC01614進行實驗驗證。
參考文獻:
Chen, Y., Cheng, W.Y., Shi, H. et al. Classifying gastric cancer using FLORA reveals clinically relevant molecular subtypes and highlights LINC01614 as a biomarker for patient prognosis. Oncogene 40, 2898–2909 (2021). https://doi.org/10.1038/s41388-021-01743-3