基于公共數(shù)據(jù)的非腫瘤疾病研究,由于數(shù)據(jù)受限等種種原因,想發(fā)7+的文章相對來說還是比較困難的。腫瘤研究至少有TCGA等數(shù)據(jù)庫支撐,就算想發(fā)10+也是有可能的。今天跟大家分享一篇非腫瘤領(lǐng)域的純生信文章,一起來看看7+是如何做到的。
文章基于多套類風(fēng)濕性關(guān)節(jié)炎公共數(shù)據(jù),通過生物信息學(xué)方法鑒定了關(guān)鍵免疫細(xì)胞類型和基因,探索了類風(fēng)濕性關(guān)節(jié)炎免疫分子機(jī)制,確定了四個疾病診斷標(biāo)志物,以及參與疾病發(fā)生發(fā)展的重要基因-細(xì)胞軸,為類風(fēng)濕性關(guān)節(jié)炎的診斷和免疫分子機(jī)制提供了新的視角。
文章八月份發(fā)表在Frontiers in Immunology(IF: 7.561)。
Identifying Immune Cell Infiltration and Effective Diagnostic Biomarkers in Rheumatoid Arthritis by Bioinformatics Analysis
在類風(fēng)濕性關(guān)節(jié)炎中通過生物信息學(xué)分析識別免疫細(xì)胞浸潤和有效診斷標(biāo)志物
背景
類風(fēng)濕性關(guān)節(jié)炎 (RA) 是一種慢性全身性自身免疫性疾病,其特征是炎癥細(xì)胞浸潤,導(dǎo)致持續(xù)性滑膜炎和關(guān)節(jié)破壞。RA的發(fā)病機(jī)制尚不清楚。本研究旨在通過生物信息學(xué)分析探索RA的免疫分子機(jī)制。
材料方法:
5套GEO芯片數(shù)據(jù)作為訓(xùn)練集,一套GEO RNA-seq數(shù)據(jù)作為驗證;CIBERSORT計算免疫細(xì)胞比例;Wilcoxon和LASSO識別顯著差異細(xì)胞類型;兩種方式識別差異表達(dá)基因;GO和KEGG進(jìn)行功能分析;Cytoscape挖掘hub基因;ROC衡量診斷效能;Spearman評估基因與免疫細(xì)胞相關(guān)性
結(jié)果:
1.RA和正?;そM織免疫細(xì)胞浸潤
首先將5套GEO數(shù)據(jù)合并去除批次效應(yīng),基于CIBERSORT計算22種免疫細(xì)胞比例。其中,Tfh cell與memory activated CD4+ T cell,M1 macrophage顯著正相關(guān),而M2 macrophage與na?ve B cell顯著負(fù)相關(guān)。通過兩種方法,篩選得到RA與正常間顯著差異的細(xì)胞類型,包括M1 macrophage,Tfh cell等10種細(xì)胞類型。


2.差異表達(dá)基因DEG識別
基于5套GEO訓(xùn)練數(shù)據(jù),首先使用去除批次效應(yīng)的合集計算DEG;其次,5套數(shù)據(jù)分別計算DEG,使用‘RobustRankAggreg’獲取DEG。兩種方式overlap得到202個差異表達(dá)基因。

3.功能相關(guān)分析
基于202個DEG,進(jìn)行GO和KEGG富集分析,發(fā)現(xiàn)DEG主要與免疫細(xì)胞相關(guān)的信號通路相關(guān),例如趨化因子信號通路,原發(fā)性免疫缺陷,總體上來說,DEG與免疫細(xì)胞顯著相關(guān),這也就與文章前期分析的免疫細(xì)胞建立了很好的聯(lián)系。

4.識別與驗證Hub基因
基于STRING數(shù)據(jù)庫的蛋白互作數(shù)據(jù),構(gòu)建DEG衍生的PPI網(wǎng)絡(luò),作者利用10種方法在網(wǎng)絡(luò)種挖掘hub基因,最終得到了包括CXCR4, CCL5, CD8A, CD247和GZMA在內(nèi)的5個基因。此外,利用RNA-seq獨立數(shù)據(jù),對hub基因表達(dá)水平進(jìn)行驗證。


5.RA生物標(biāo)志物診斷效能
鑒于RNA-seq獨立數(shù)據(jù)樣本較大,作者利用這套數(shù)據(jù)分析所識別到的hub基因診斷效能,定義AUC大于0.8的作為潛在的診斷標(biāo)志物,發(fā)現(xiàn)CCL5, CXCR4和CD247三個基因具有較好診斷效能。此外,作者將hub基因進(jìn)行組合,發(fā)現(xiàn)CCL5+CXCR4和GZMA+CD8A同樣具有非常好的診斷效能,可以作為RA和早期RA的診斷標(biāo)志物。

6.RA中生物標(biāo)志物與差異免疫細(xì)胞相關(guān)性
為了探索識別到的生物標(biāo)志物與免疫細(xì)胞的調(diào)控機(jī)制,也為了和文章開頭建立聯(lián)系,作者計算了標(biāo)志物與前文識別到的差異免疫細(xì)胞的spearman相關(guān)性。其中,CCL5與M1 macrophage顯著正相關(guān);CXCR4與memory activated CD4+T細(xì)胞顯著正相關(guān);GZMA與Tfh顯著正相關(guān)。

總體上來看,文章雖然沒有構(gòu)建復(fù)雜的模型,但是對于已有的方法的使用非常靈活和頻繁。第一點,關(guān)鍵免疫細(xì)胞的識別使用了兩種方法,差異基因的識別同樣使用了兩種方法,hub基因的識別使用了十種方法,并且使用超過5套數(shù)據(jù)進(jìn)行分析,這一些列方式無疑都增加了文章結(jié)果的可信度。第二點,針對目前常見的免疫細(xì)胞的分析,作者在文章開頭進(jìn)行刻畫,文章中間DEG分析時將基因與免疫細(xì)胞聯(lián)系,文末生物標(biāo)志物刻畫時構(gòu)建了基因-細(xì)胞調(diào)控軸,整體上邏輯清晰,聯(lián)系緊密,杜絕了常見的將免疫細(xì)胞分析硬湊在文章中的尷尬局面。
如果能夠?qū)⑽恼碌膬蓚€優(yōu)點學(xué)到手,條件允許再加入適當(dāng)?shù)臐駥嶒烌炞C,相信文章水平最后肯定不會低。
優(yōu)選思路 盡在生信人
