今天跟大家分享的是今年11月底發表在Genomics(IF: 5.736)上的一篇文章,主要是對I期、II期和III期胃癌和正常組織進行轉錄組測序,識別胃癌分期特異性的差異表達基因(DEGs)、單核苷酸多態性(SNPs)和轉錄因子(TFs)。并基于分期特異性的標志基因,構建包含DEGs和TFs的相互作用網絡。
本文是一篇比較套路的生物信息學文章,小編也猶豫很久到底要不要分析,最終還是決定分享給大家。分享不是為了讓大家借鑒學習,更多的還是想給大家避雷,希望大家都能夠避免這種套路重復的工作,找到自己的創新點。
Identifcation of stage-specifc differentially expressed genes and SNPs in gastric cancer employing RNA-Seq based transcriptome profling
基于轉錄組測序識別胃癌分期特異的差異表達基因和SNPs
1.RNA測序
研究者從當地醫院共收集到2例I期、2例II期和2例III期胃癌腫瘤組織及其相應的遠端正常組織樣本,并對其進行RNA測序分析,序列比對等,最終獲取其轉錄組,SNPs等信息。
2. 識別差異表達基因
首先,基于FPKM的基因表達值識別胃癌不同分期腫瘤和正常組織對之間的DEGs。共檢測到差異表達基因2207個,其中上調基因972個,下調基因1235個。其中,在I期有326個上調基因,621個下調基因;在II期有381個上調基因,425個下調基因;在III期有265個上調基因,189個下調基因。不同分期的特異性基因有一定程度的交疊,其中I期和II期共有106個交疊基因,41個基因在II期和III期之間交疊,58個基因在I期和III期之間交疊。DPT、CYP2C9、HRASLS2等基因在胃癌的三個階段均發生差異表達(圖1A)。差異表達基因在人類各染色體上的頻率分布如圖1B所示。結果表明,在1號和2號染色體上發生差異表達的基因最多,在13、18和21號染色體上識別到的DEGs數量相對較少。

圖1. 差異表達基因的分布
3. 基因的功能富集分析
分別對不同分期上下調的基因進行GO和KEGG富集分析,可以富集到免疫,代謝等與癌癥相關的多個通路。
4. 基于DEGs的蛋白質-蛋白質相互作用網絡
基于STRING數據庫分別預測各腫瘤分期差異表達基因在蛋白水平上的潛在相互作用,并基于Cytoscape中的MCODE算法識別網絡中的密集連接區域(圖2)。KEGG通路富集分析顯示,I期中的基因簇主要包括細胞周期、DNA復制等相關生物學過程的基因;II期中的基因簇主要由剪接體和氧化磷酸化相關基因組成; III期中趨化因子信號通路和VEGF信號通路顯著富集。

圖2. 基于DEGs的蛋白質-蛋白質相互作用網絡
5. 轉錄因子篩選及網絡分析
在I、II、III期的患者中共鑒定出39個發生差異表達的轉錄因子。在I期有14個差異表達的轉錄因子(7個上調,7個下調),在II期有16個轉錄因子(9個上調,7個下調),在III期有10個轉錄因子(4個上調,6個下調)。研究者進一步構建三個階段患者中轉錄因子及其下游基因的相互作用網絡(圖3)。


圖3. 轉錄因子及其靶基因之間的相互作用網絡
6.不同分期胃癌患者的SNP分析
基于對人類染色體上不同胃癌分期患者基因的SNP信息進行分析,研究者發現 SNP分布在23條染色體上,其中主要在19號,17號和22號染色體上富集,在X染色體上4號等染色體上的SNP數量最少。
通過GATK分析預測SNP基因,并進行KEGG富集分析,發現其顯著富集到凋亡、MAPK等癌相關信號通路。
為進一步了解SNP基因的功能,研究者還進行GO富集分析,可以顯著富集到免疫系統,細胞周期等相關生物學過程(圖4)。

圖4.SNP基因的功能富集分析
今天的內容就是這些,內容很套路,很流程,簡單來說就是三步,識別差異,構建網絡和富集分析。舊瓶裝新酒可以,舊瓶裝舊酒就大可不必啦。希望大家都能認真思考,找到自己工作的創新點哦~
參考文獻:
Identifcation of stage-specifc differentially expressed genes and SNPs in gastric cancer employing RNA-Seq based transcriptome profling