GEO數(shù)據(jù)庫儲存了芯片、二代測序以及其他高通量測序數(shù)據(jù)等豐富的數(shù)據(jù)。學(xué)會獲取、分析GEO數(shù)據(jù)會讓我們的科研工作更加順暢,而今天小編介紹的生信人開發(fā)的在線分析工具easyGEO(https://www.easygeo.cn)則會讓我們?nèi)缁⑻硪怼?/p>
主界面:
進入網(wǎng)址主頁我們會清晰的新增的GEO數(shù)據(jù)集及相關(guān)數(shù)據(jù)信息,并且我們可以根據(jù)自己感興趣的方向在搜索框中輸入數(shù)據(jù)集編號或者疾病等相關(guān)信息來查詢數(shù)據(jù)。

(主頁)
例如:搜索關(guān)鍵詞breast cancer
同時我們還可以對樣本數(shù)進行限制,滿足數(shù)量要求

(關(guān)鍵詞搜索結(jié)果)
例如:搜索數(shù)據(jù)集編號GSE93798

(數(shù)據(jù)集編號搜索結(jié)果)
數(shù)據(jù)集詳情信息:
點擊具體數(shù)據(jù)集內(nèi)容即可進入到數(shù)據(jù)集的介紹頁面。主體包括下列信息:
1.數(shù)據(jù)集標題、概要、樣本信息等;
2.點擊數(shù)據(jù)ID可以鏈接到原GEO數(shù)據(jù)庫相關(guān)數(shù)據(jù)集界面;
3.點擊樣本ID可以鏈接到原GEO數(shù)據(jù)庫相關(guān)樣本界面;
4.點擊下載數(shù)據(jù)可以獲得數(shù)據(jù)集樣本信息;
5.點擊數(shù)據(jù)預(yù)處理可將探針的表達轉(zhuǎn)換為基因的表達。

(數(shù)據(jù)集信息)
其中,數(shù)據(jù)預(yù)處理部分需要注意:
若數(shù)據(jù)集不需要重注釋,則只需要確定“基因名稱所在列”和“探針合并方法”(包括:均值、中位數(shù)、最大值、最小值)即可。

(數(shù)據(jù)預(yù)處理信息界面)
若數(shù)據(jù)集需要重注釋(即注釋數(shù)據(jù)并沒有給出探針與基因的對應(yīng)關(guān)系),則需要確定“探針合并方法”(包括:均值、中位數(shù)、最大值、最小值)以及序列和基因組信息“探針所在序列”和“參考基因組”。

(數(shù)據(jù)預(yù)處理信息界面)
預(yù)處理完成后,我們可以通過點擊查看結(jié)果獲得數(shù)據(jù)預(yù)處理報告,并進一步獲得表達譜和臨床信息。隨后就可以在數(shù)據(jù)分析處選擇具體分析內(nèi)容“差異表達分析”和“核心基因流程”進行分析。
(注:必須先數(shù)據(jù)預(yù)處理完成才可以進行后續(xù)的分析呦~)

(數(shù)據(jù)預(yù)處理結(jié)果界面)
差異表達分析:
1.選擇數(shù)據(jù)集,下拉選擇已預(yù)處理后的GEO數(shù)據(jù)集進行差異表達分析;

(差異表達分析-選擇數(shù)據(jù)集)
2.選擇分組,對樣本劃分組別;
選擇分組時,若在輔助分組中有符合的明確分組可以采用“快速新建”確定樣本劃分;若在輔助分組中無符合的分組要求則采用新建分組,先確定分組名稱再將樣本勾選并加入到定義好的分組信息中。其中,若有數(shù)據(jù)不符合要求可在分組完成后選擇“刪除缺失數(shù)據(jù)”即可。

(差異表達分析-選擇分組)
3.選擇參數(shù),包括設(shè)置log2(FC),P值和矯正后P值等參數(shù);

(差異表達分析-選擇參數(shù))
4.差異表達分析報告,獲得詳細信息。
點擊查看結(jié)果即可獲得差異表達分析報告,進一步了解差異分析結(jié)果信息(如上下調(diào)基因數(shù)等)、火山圖、差異基因等。

(差異表達分析-結(jié)果界面)

(差異表達分析-分析報告部分內(nèi)容)
核心基因流程:
1.選擇數(shù)據(jù)集,下拉選擇已預(yù)處理后的GEO數(shù)據(jù)集進行差異表達分析;
2.選擇分組,對樣本劃分組別;
3.選擇參數(shù),包括設(shè)置log2(FC),P值和矯正后P值等參數(shù),并且需要生存信息;

(核心基因分析-選擇參數(shù))
4.核心基因分析報告,獲得詳細信息。
點擊查看結(jié)果即可獲得核心基因分析報告,除了包含差異分析結(jié)果信息,還包括了基于STRING數(shù)據(jù)庫構(gòu)建PPI?絡(luò),并?Cytoscape的MCODE插件進???挖掘獲取核心基因。并且,對核心基因采用生存分析進一步展示生存曲線。

(核心基因分析-結(jié)果界面)

(核心基因分析-報告內(nèi)容-PPI網(wǎng)絡(luò))

(核心基因分析-報告內(nèi)容-子網(wǎng)挖掘)

(核心基因分析-報告內(nèi)容-生存分析)
這么簡單易操作的在線分析工具easyGEO,生信分析小白還不趕快用起來~~~
生信人也會陸續(xù)推出更多分析工具,大家敬請期待!