目前隨著生物信息學的快速發展,許多生信相關的工具及數據庫已經被開發并建立。小編今天就給大家分享一篇發表在Cancers(IF:6.639)雜志上整合利用這些工具及數據庫的純生信范文,不那么擅長敲代碼的小伙伴們快get起來呀。文章的思路及方法都不難,但利用了很多生信工具及數據庫使其內容豐富,結果清晰,邏輯連貫。長話短說,小編這就帶大家一睹為快。
A Bioinformatics Evaluation of the Role of Dual-Specificity Tyrosine-Regulated Kinases in Colorectal Cancer
生物信息評估雙特異性酪氨酸調節激酶在結直腸癌中的作用
一、研究背景
結直腸癌(CRC)是全球第三大常見癌癥,也是癌癥相關死亡的第三大原因,其在年輕人群中的發病率也在不斷上升。研究發現雙特異性酪氨酸調節激酶(DYRK)家族與包括癌癥在內的多種疾病有關。然而,不同家族成員在調控CRC腫瘤發生中的作用和貢獻尚未不清楚。因此,文章利用公開的CRC患者數據集和生物信息學網絡工具進行計算分析,對DYRK家族成員的表達模式、預后價值以及在CRC腫瘤中的作用進行研究。最終揭示了不同DYRK家族成員在CRC中的作用及其潛在的預后價值。
二、數據及方法
1. Genotype-Tissue Expression(GTEx):為了測量正常結腸組織中DYRKs的表達水平,文章使用了基因組織表達(GTEx)工具,其提供了不同非病變組織中特定基因的表達數據。文章查詢了乙狀結腸和橫結腸組織的DYRKs成員表達。
2. GENT2:為了測量不同CRC亞型中DYRKs的表達水平,作者使用GENT2數據庫,通過亞型標簽研究了DYRKs在CRC分子亞型中的表達。
3. Gene Expression Profiling Interactive Analysis2 (GEPIA2):為了測量不同CRC分期的DYRKs表達水平,作者使用GEPIA2工具,通過分期標簽查詢每個DYRK基因,并使用該工具生成CRC患者DYRK的總生存K-M曲線,同時采用Cox回歸分析計算風險比。
4. cBioPortal:為了進一步分析腫瘤樣本中DYRKs的狀態,文章使用cBioPortal基因特異性查詢,對于每個DYRK基于z-score對樣本進行過濾。
5. GeneSet Cancer Analysis(GSCALite):Gene Set Cancer Analysis (GSCALite)可以預測癌癥相關通路的基因活性,作者使用該工具研究了來自TCGA的結腸腺癌(COAD)數據集中DYRKs在癌癥相關通路中的作用。
6. STRING:文章使用STRING工具預測了DYRKs的功能蛋白相互作用網絡,其中只選擇實驗蛋白、數據庫蛋白和共表達蛋白。
7. TIMER2:TIMER 2能夠使用多種算法分析和測量TCGA數據集中的腫瘤浸潤免疫細胞。該工具測量感興趣基因表達和免疫浸潤細胞豐度之間的相關性。作者利用這個工具來研究CRC中DYRKs與腫瘤浸潤免疫細胞的相關性。
8. UALCAN:UALCAN使用來自TCGA、MET500和CPTAC等癌癥數據庫的多組學數據,研究不同癌癥的表達、甲基化等基因狀態與生存的相關性。作者使用該工具研究了DYRKs在正常和腫瘤樣本中的表達,并研究了CRC TCGA數據集中DYRKs啟動子甲基化狀態。
三、主要內容及結果
1. DYRKs在結腸組織中的表達
文章第一部分作者使用GTEx研究了DYRKs在正常結腸組織中乙狀結腸和橫結腸兩個解剖部位的表達水平。結果發現如圖1所示,在結腸的兩個解剖部位,與其他DYRKs相比,DYRK1A在結腸組織中都有較高的表達水平。DYRK1B和DYRK2在結腸組織中呈中度表達,而DYRK3和DYRK4在結腸組織中低表達。

2. DYRKs基因在正常與結腸和直腸腺癌組織中的表達
接下來,作者評估了DYRKs在結腸和直腸腺癌(COAD)和直腸腺癌(READ)與正常組織的表達水平。作者使用UALCAN 工具中的TCGA RNA-seq數據集,發現DYRK1A和1B沒有顯著變化(圖2a,b),而DYRK2(圖2c)在COAD樣本中相比于正常組織有顯著的低表達。另一方面,與正常組織相比,DYRK3(圖2d)和DYRK4(圖2e)在COAD樣本中均發現顯著上調。如圖3所示,與正常組織相比,DYRK1A(圖3a)和DYRK2(圖3c)在READ腫瘤組織中的表達均顯著降低,而DYRK1B、DYRK3和DYRK4的表達無顯著變化。


3. DYRKs在CRC分子亞型中的表達水平
這一部分作者對結直腸癌主要病理分子亞型中DYRKs的表達水平進行了分析。第一組是微衛星不穩定組(MSI),第二組是微衛星穩定(MSS)。MSS CRC以APC、TP53、PIK3CA、KRAS和SMAD4等多個基因的高體細胞突變率為特征。為了研究DYRK成員在不同腫瘤亞型中的基因表達,作者使用了基于網絡的工具GENT2,結果發現MSI與MSS亞型相比,DYRK1A、DYRK3和DYRK4(圖4a、d、e)在MSI中均顯著升高,而DYRK2在MSS中顯著升高(圖4c)。DYRK1B在MSI和MSS中的表達無顯著差異(圖4b)。

4. DYRKs在CRC分期中的表達水平
接下來作者利用GEPIA2,探索了不同CRC分期的DYRKs成員的水平,結果如圖5所示,可以觀察到從IIIA到IVB期,DYRK1A在腫瘤晚期顯著上調(圖5a)。DYRK1B表達在CRC分期間無顯著差異(圖5b)。同樣,2類DYRKs表達在CRC分期中無顯著差異。這表明在DYRKs成員中,只有DYRK1A在CRC患者腫瘤晚期過表達,提示DYRK1A可能在疾病晚期發揮作用。

5. 結直腸癌中DYRKs的臨床特點
在這一部分,作者進一步探索DYRK成員表達水平和CRC臨床特征之間的關系。作者首先使用cBioPortal基于DYRK成員表達過濾樣本。接著分析了DYRKs和組織學癌癥亞型之間的關系。結果發現與從UALCAN觀察到的一致,DYRK3和4的表達水平在大多數腫瘤樣本中都很高,且作者也發現DYRK1A高表達樣本與粘液性結直腸腺癌顯著相關(圖6a)。
DYRK4也得到了類似結果如圖6d所示。另一方面,DYRK1B在非粘液性COAD中的表達高于粘液性COAD亞型(圖6b)。對于DYRK3,其在所有三個組織學亞型中的表達均無顯著變化(圖6c)。此外作者也分析了DYRKs和轉移,淋巴結分期及治療后新腫瘤事件的關系。結果如圖7所示,與正常組織相比,DYRK1A在CRC中低表達,但DYRK1A高表達的腫瘤樣本在轉移和淋巴結晚期富集(圖7a,b)。對于其他DYRKs成員,其表達與轉移及淋巴結分期之間無統計學差異(圖7c-h)。此外,腫瘤樣本中DYRK1A水平越高,初始治療后腫瘤復發越高(圖8a)。而其他DYRKs成員均未出現任何顯著變化(圖8b-d)。這些結果表明,DYRK1A可能作為CRC疾病晚期的潛在腫瘤生物標志物。



6. CRC中DYRKs的突變和啟動子甲基化
由于先前分析發現CRC中DYRKs在正常與腫瘤中有差異表達。作者為了確定這種表達變異是否與特定突變有關,使用cBioPortal分析了TCGA中的DYRKs突變。結果發現如圖9所示,DYRKs在CRC中一般未發生突變,部分樣本存在DYRK1B、DYRK3、DYRK4的擴增突變。對于DYRK1A,存在一個意義未知的錯義突變。總的來說,作者發現DYRKs的差異表達與mRNA水平有關。接下來作者使用UALCAN研究不同腫瘤分期中DYRKs基因啟動子的甲基化情況。結果發現在COAD中DYRK1A的甲基化水平沒有明顯變化(圖10a),而在READ中,與正常樣本相比,3期的甲基化水平明顯降低(圖10b)。與正常的COAD相比,DYRK1B的甲基化在1、2和3期顯著增加(圖10c),在READ中,與正常樣本相比,甲基化在1期顯著增加,在第4期顯著降低(圖10d)。且DYRK2僅在COAD的4期甲基化水平較低(圖10e),而在READ中未觀察到顯著變化(圖10f)。作者研究正常與腫瘤樣本的mRNA表達,也發現在COAD中DYRK3(圖10g)和DYRK4(圖10i)的甲基化水平明顯低于對照組。在READ中,只有DYRK4在1和4期中甲基化水平較低(圖10i)。這些結果表明,正常與腫瘤中DYRKs表達的差異可能與表觀遺傳調控有關,而不是基因突變。


7. DYRKs在CRC中癌癥相關通路中的活性
這一部分,在探索了DYRKs在CRC臨床特征中的狀態后,作者使用GSCALite預測DYRKs在COAD中的分子功能(圖11)。結果發現1類DYRKs (1A和1B)和DYRK4與細胞周期抑制相關。然而,DYRK1B也與凋亡抑制、DNA損傷反應和PI3K/AKT通路激活相關。DYRK2與抑制DNA損傷反應相關,而DYRK3與上皮間質轉化和雌激素通路正相關。這些表明DYRKs可能在多個癌癥相關通路中發揮重要作用。為了進一步預測DYRKs在癌癥中的功能,作者使用STRING來預測DYRKs的相互作用對,發現DYRK1A與參與細胞周期抑制的DREAM復合體相互作用。此外,它與參與DNA損傷反應的泛素連接酶RNF169相互作用。作者也發現DYRK1B與信號誘導增殖相關,這預測了它在DNA損傷中的作用。DYRK1B的另一個相互作用因子是LZTS2,它是β - catenin的負調控因子,提示它與結直腸癌有關。最后,作者發現所有DYRK成員都與DCAF7有功能關聯。

8. CRC患者DYRKs與腫瘤浸潤免疫細胞的相關性研究
接下來作者使用TIMER 2來探索CRC 中DYRKs表達和腫瘤浸潤的免疫細胞之間潛在的相關性。結果發現如圖12所示,DYRK1A與CD4+ T細胞、巨噬細胞和髓樣樹突狀細胞呈顯著正相關,與CD8+ T細胞和B細胞無顯著相關。對于DYRK1B,只發現與CD4+ T細胞和巨噬細胞有顯著正相關。雖然DYRK2在MSS亞型中表達較高,但其表達與CD8+ T細胞、CD4+ T細胞、巨噬細胞、髓樣樹突狀細胞呈正相關。此外,DYRK3也被發現與CD8+ T細胞、CD4+ T細胞、巨噬細胞和髓樣樹突狀細胞呈正相關。DYRK4與免疫浸潤細胞無顯著相關性。綜上所述,可以發現只有DYRK1A和DYRK3在MSI亞型中表達上調,且其表達與免疫浸潤細胞呈正相關。

9. 無進展生存率(PFS)
這一部分作者基于來自cBioPortal的Pan TCGA數據進行分析,發現DYRK1A高表達的CRC樣本PFS顯著較低(圖13a)。然而,對于其他DYRKs,未觀察到PFS的顯著變化(圖13b-d)。這些結果與上述一致,進一步支持了DYRK1A在晚期CRC腫瘤中的表達可能反映患者預后不良的觀點。

10. 總體生存(OS)
在最后一部分,作者為了進一步證實在cBioPortal中的發現,對總生存期進行了Kaplan-Meier分析。結果觀察到DYRK1A表達較高的CRC患者總生存期明顯較低(圖14a),而其他DYRK成員與總生存期沒有任何顯著相關性(圖14b-f)。這表明DYRK1A的表達不同于其他DYRK成員,可以預測CRC中的癌癥生存期。

到這里這篇文章的主要內容就介紹完了,文章從DYRK家族入手,整合并利用多個工具及數據庫,結合甲基化、突變、表達等數據分析了DYRK與CRC的預后、臨床特征等的關系。同時文章也涉及了DYRK與免疫及功能等相關分析,文章的內容豐富,角度全面,條理清晰,這種思路及方法非常值得我們學習借鑒,選對角度利用好這些工具及數據庫,不用怎么敲代碼也可以發6+,簡直是生信小白的福利呀。
參考文獻
A Bioinformatics Evaluation of the Role of Dual-Specificity Tyrosine-Regulated Kinases in Colorectal Cancer.