DLEU2L/TAOK1軸作為肝癌預后標志物的綜合分析

這篇文章發(fā)表在期刊: Molecular Therapy-nucleic Acids,該期刊文章在2021影響因子: 8.886比去年增長了1.854。在中科院大類: 醫(yī)學 2區(qū)。中科院小類: 2區(qū) 醫(yī)學:研究與實驗。筆者認為該篇文章為ceRNA相關的純生信分析文章,邏輯思維和作圖質量高,值得我們學習。
發(fā)現問題:
越來越多的證據強調了競爭性內源性RNA(ceRNA)調控網絡在各種人類癌癥中的關鍵作用。然而,肝細胞癌中ceRNA網絡的復雜性和行為特征仍不清楚。
背景知識:
肝細胞癌(HCC)是危害人類健康的最致命的惡性腫瘤之一。越來越多的證據強調了競爭性內源性RNA(ceRNA)調控網絡在各種人類癌癥中的關鍵作用。然而,肝細胞癌中ceRNA網絡的復雜性和行為特征仍不清楚。
結果:
作者在這里先給讀者提供一張流程圖(Figure 1),使本文的思路清晰明了。首先,通過對371例肝癌樣本中PTEN高表達和低表達兩組(PTENhigh 和 PTENlow)進行差異表達分析,再利用差異表達RNA構建了肝癌相關的lncRNA-miRNA-mRNA三重調控網絡。功能富集分析評估了該網絡在肝癌中的功能作用和潛在機制。然后,通過對三重調控網絡的RNA進行表達分析、生存分析和核質定位分析,確定了一個關鍵的ceRNA網絡。此外,作者還對這多個預測基因與PTEN進行了相關性分析,結果表明DLEU2L/TAOK1軸在肝癌中起著重要作用。最后進行Cox回歸分析,得出TAOK1在肝癌中的診斷和預后價值。利用基因本體論(GO)和京都基因與基因組百科全書(KEGG)分析TAOK1在肝癌中的可能功能(見附圖),并通過甲基化分析和免疫浸潤分析進一步研究TAOK1在肝癌中的潛在生物學功能。

Figure 1. Flowchart of construction and analysis of ceRNA
作者為了探討PTEN在肝癌中的可能作用,使用人類蛋白質圖譜(Human Protein Atlas,HPA)數據庫,發(fā)現了PTEN在正常肝組織中高表達,而在肝癌組織中低表達(Figures 2A)。HPA的免疫組化(IHC)染色也證實了PTEN表達有相似的調節(jié)(Figure 2B)。鑒于PTEN在腫瘤樣本中的異常低表達,作者隨后研究了PTEN在肝癌患者中的表達的臨床意義。根據Kaplan-Meier生存曲線,如Figure 2C所示,作者的數據表明PTEN的低表達與HCC隊列患者的總體生存率(OS)低呈顯著相關。此外,為了了解PTEN在肝癌中異常低表達的可能機制,作者分析了PTEN的基因組和拷貝數。OncoPrint圖顯示了TCGA HCC數據集中PTEN基因的缺失(圖2D)。超過三分之一的肝癌樣本含有PTEN缺失,而且,PTEN缺失的肝細胞癌組織的mRNA表達低于二倍體PTEN的肝癌組織(Figure 2E)。肝癌組織中PTEN拷貝數與mRNA表達呈正相關(Figure 2F)。綜上所述,這些數據表明PTEN在HCC中的表達下調,PTEN拷貝數的缺失可能是肝癌患者PTEN表達下調的主要機制之一。


Figure 2. The tumor suppressor role of PTEN in human hepatocellular carcinoma (HCC)
根據以上分析,與PTEN相關的ceRNA網絡可以作為預測肝癌患者預后的潛在模型。另外,作者還必須知道PTENhigh 和 PTENlow在癌組織和癌旁組織的表達水平是相反的意義何在。作者首先利用TCGA數據庫,以p<0.05和|log fold changeFC| >0.5為lncRNA閾值,p<0.05和|logFC|>0.3為miRNA閾值,p<0.05和|logFC|>0.7/0.5為mRNA閾值,鑒定出PTENhigh 和 PTENlow在肝癌和癌旁正常組織中的DElncRNAs、DEmiRNAs和DEmRNAs。在肝癌樣本PTENhigh 和 PTENlow 組中,共篩選出860個DElncRNAs(137個上調和723個下調)、54個DEmiRNAs(21個上調和33個下調)和1,871個DEmRNAs(195個上調和1676個下調)。此外,在HCC和正常肝組織中共檢測到3371個DElncRNAs(3041個上調和330個下調),420個DEmiRNAs(102個上調和318個下調)和8294個DEmRNAs(7059個上調和1235個下調)。作者用火山圖直觀地顯示DElncRNAs、DEmiRNAs和DEmRNAs。(Figures 3A–3C),作者還利用熱圖顯示了在PTENhigh 和 PTENlow的肝癌組織中以及在肝癌和正常組織中的重要的可變區(qū)基因(Figures 3D–3F)。


Figure 3. Volcano plots and heatmap plots of DElncRNAs, DEmiRNAs, and DEmRNAs between the expression of PTENhigh and PTENlow in HCC samples
為了建立肝癌組織中的lncRNA-miRNA-mRNA三重調控網絡,作者在PTENhigh 和 PTENlow組以及HCC和正常肝組織組中進行了聯合分析。首先,作者將DElncRNAs放入TarBase數據庫中,以確定針對lncRNAs的潛在miRNAs。在與54個DEmiRNAs相交后,從預測的miRNAs中選擇了4個。然后,作者使用miRDB和TargetScan的數據庫,參照4個DEmiRNAs來識別下游的靶mRNA。此外,作者尋找兩個數據庫共有的候選mRNA,這么做的目的是提高預測的準確性。結果表明,在8294個DEmRNA中鑒定出373個。最后,利用Cytoscape軟件,把5個lncRNA(4個上調和1個下調)、4個miRNAs(1個上調和3個下調)和372個mRNAs(326個上調和46個下調)做成了肝癌相關的lncRNA-miRNAmRNA三重調控網絡(Figure 4A). 作者又利用Cytoscape插件Cell Hubba確定中樞三重調控網絡。結果表明,共鑒定出3個lncRNA(DLEU2L、FAM99A和ARRDC1-AS1),4個miRNAs(miR-99a5p、miR-100-5p、miR-9-5p和miR-125b-5p)和6個mRNA(TAOK1、HS3ST3B1、RHOQ、AGO2、BAZ2A和NR6A1) (Figure 4B)。 作者通過Metascape的功能富集分析(包括GO和KEGG)進一步探索與三重調控網絡相關的潛在功能。(Figure 4C).

Figure 4. Construction and functional enrichment analysis of the lnRNA-miRNA-mRNA triple regulatory network
為了建立一個在HCC中具有重要預后價值的重要ceRNA,作者首先分析了PTENhigh 和 PTENlow的HCC樣本以及HCC和鄰近正常肝組織中三重調控網絡中RNA的表達水平。作者的結果顯示一共有一個下調的(DLEU2L)和兩個未分化的(ARRDC1AS1和FAM99A)lncRNA,一個上調的(miR-9-5p)和三個下調的(miR-99a-5p,miR-100-5p和miR-125b5p)miRNAs,三個下調的(TAOK1,HS3ST3B1和AGO2)和三個未分化的(RHOQ,BAZQ) (Figure 5A) 作者還發(fā)現了兩個上調的(DLEU2L和ARRDC1-AS1)和一個下調的(FAM99A)lncRNA,一個上調的(miR-9-5p)和三個下調的(miR-99a5p、miR-100-5p和miR-125b-5p)miRNAs,以及五個上調的(TAOK1、RHOQ、AGO2、BAZ2A和NR6A1)mRNAs(Figure 5B)。然后,為了確定這些RNA是否與HCC預后相關,作者使用Kaplan-Meier分析和log-rank檢驗對HCC患者進行OS分析。總之,發(fā)現1個DElncRNA(DLEU2L)、2個DEmiRNAs(miR-99a-5p和miR-100-5p)和3個DEmRNAs(TAOK1、HS3ST3B1和RHOQ)與預后有關(p<0.05)(Figure 6)。考慮到lncRNAs的細胞定位決定了潛在的機制,作者通過lncLocator分析了這三個DElncRNAs的亞細胞定位。如Figure 7A所示,DLEU2L主要分布在細胞質中,而另外兩個LncRNAs(FAM99A和ARRDC1-AS1)主要分布在胞質溶膠中。這些數據表明,DLEU2L可能通過海綿miR-99a-5p/miR-100-5p作為ceRNA促進TAOK1的表達(Figure 7B) 。TarBase和TargetScan預測DLEU2L和TAOK130UTR中的目標位點分別與miR-99a-5p和miR-100-5p (Figure 7C) 相關。此外,表達相關性分析表明,DLEU2L的表達與TAOK1的表達呈正相關(Figure 7D) 。因此,ceRNA網絡中的DLEU2L/TAOK1軸被選作下一步分析的潛在預測模型。

Figure 5. The distribution of 13 hub-RNA expression patterns from the triple regulatory network in TCGA HCC dataset

Figure 6. Overall survival analysis for the RNAs in the hub triple regulatory network

Figure 7. Construction and correlation analysis of the ceRNA network
為了確定DLEU2L和TAOK1的表達水平是否受臨床特征的影響,作者探討了DLEU2L和TAOK1的表達與臨床因素的相關性。作者進行了單變量和多變量Cox回歸分析,以確定OS相關特征。在DLEU2L和TAOK1的單因素Cox回歸模型中,TCGA隊列中肝癌患者的某些預后因素(TNM分期、腫瘤直徑、淋巴結轉移和遠處轉移)與OS密切相關。DLEU2L(風險比[HR]=1.572,p=0.011)和TAOK1(HR=1.537,p=0.016)過表達均與較差的預后顯著相關。然而,對DLEU2L的多因素Cox回歸分析顯示,DLEU2L的高表達與預后不良無關(HR=1.369,p=0.078)。因此,TAOK1可能成為肝癌患者的獨立預后因子。
為了更好地理解DLEU2L/TAOK1軸在肝癌中的作用,作者接下來詳細分析了TAOK1。首先,作者使用在線工具Cancer Cell Line Encyclopedia (CCLE) 并發(fā)現TAOK1在肝癌細胞系中高表達。此外,作者還對GEO數據庫中的GSE41804肝癌隊列中的20對肝癌樣本進行了TAOK1的差異分析,以進一步驗證TAOK1的表達。結果表明,TAOK1在肝癌組織中的表達明顯高于配對的非腫瘤性肝組織,這與作者從TCGA數據中得到的結果是一致的(Figures 5A and 6)。
作者為了進一步闡明TAOK1在肝癌組織中的異常上調機制,還用多種方法探討TAOK1的表達水平與其甲基化狀態(tài)的相關性。首先,對肝癌TAOK1high 和 TAOK1low組三種DNA甲基轉移酶(DNMT1、DNMT3a和Dnmt3b)進行差異表達分析,結果表明TAOK1high組DNMT1、DNMT3a和Dnmt3b的表達明顯高于TAOK1low組(Figure 8A)。其次, UALCAN分析表明,DNMT1在正常肝組織中的甲基化水平高于在肝癌組織中的甲基化水平(p = 0.101, Figure 8B)。并且DiseaseMeth 2.0版分析表明,與肝癌組織相比,癌旁正常組織中TAOK1的甲基化水平顯著升高(p < 0.0001; Figure 8C) 。此外,作者在TAOK1的DNA序列中發(fā)現了兩個甲基化位點(cg16008158和cg2570978),它們與其表達水平呈負相關(Figure 8D)


Figure 8. Methylation analysis of TAOK1
在一些腫瘤中,腫瘤浸潤性淋巴細胞(TIL)是前哨淋巴結(SLN)狀態(tài)和生存期的獨立預測因子。作者接下來使用TIMER研究肝癌組織中TAOK1表達與免疫浸潤水平的關系(也是熱點之一),首先,“SCNA”模塊分析顯示,肝癌中幾種免疫細胞浸潤水平似乎與TAOK1基因拷貝數改變有關,包括B細胞、CD4+T細胞、巨噬細胞和樹突狀細胞(DC)(Figure 9A) ?!癎ene”模塊分析顯示,TAOK1的表達與腫瘤純度無顯著相關性,但與肝癌組織中CD4+T細胞、巨噬細胞、中性粒細胞和樹突狀細胞的浸潤水平呈顯著正相關(Figure 9B)。最后,作者進一步評估了免疫浸潤對肝癌患者臨床預后的影響。結果表明,生存期小于24個月的肝癌患者,CD4+細胞、巨噬細胞和中性粒細胞水平高與預后不良有關(Figure 9C)。提示DLEU2L/TAOK1軸可能通過調節(jié)腫瘤浸潤性免疫細胞水平而影響HCC和臨床預后。

Figure 9. Correlation analysis of TAOK1 expression and immune infifiltration in HCC
本文小結:
作者建立了一個與肝癌預后相關的ceRNA(DLEU2L-hsa-miR-100-5p/hsa-miR-99a-5p-TAOK1)過表達網絡,更好地了解了lncRNA-miRNA-mRNA之間的相關性。此外,作者還發(fā)現基于ceRNA的DLEU2L/TAOK1軸可能是參與HCC的一個新的重要預后因子,該預后模型有助于探討HCC的發(fā)病機制。