一站式GEO數據分析平臺easyGEO
目前對于GEO等生物數據的挖掘會產生十分有價值的信息或成果,GEO2R等在線分析工具對于缺少編程經驗的人來說顯得尤為重要。目前針對于GEO數據挖掘的生信在線分析工具以檢索、數據可視化、差異表達分析為主,難以滿足日益增長的生信分析需求,比如生物網絡分析、模塊挖掘、生存預后分析等。
為了助力GEO數據分析、服務于廣大客戶,生信人全力打造了一站式GEO數據分析平臺easyGEO(https://easygeo.cn),集數據預處理及標準化、差異表達分析及火山圖可視化、蛋白質互作網絡構建及可視化、Hub基因識別及子網絡挖掘、生存分析(Kaplan-Meier?存曲線圖)等分析模塊于一體。用戶可以在超過25000套GEO數據集中進行自由探索,用別人的數據、別人的代碼、別人的服務器,建自己的idea、發自己的paper。接下來我們依次介紹每個模塊的功能:模塊一數據檢索,模塊二數據預處理,模塊三差異表達分析,模塊四核心基因挖掘,模塊五網站導航,模塊六工具寶典。
模塊一:數據檢索
easyGEO網站主頁展示了最新收錄的數據條目,方便用戶瀏覽和查詢數據,用戶也可以點擊查看更多進行高級檢索篩選。

高級檢索頁面可以依據疾病名稱、樣本數、發布時間、是否有生存數據進行檢索,選擇合適的數據進行探索。

模塊二:數據預處理
用戶選擇合適的數據之后,網站提供了全面的信息展示,并且可以鏈接到原GEO庫中,點擊數據預處理進行初步處理。

這里將相同基因的不用探針按照中位數進行整合。

點擊開始預處理進行操作,自動跳轉到任務界面并記錄運行信息。如果重復運行了相同一套數據,網站也會自動編號從而保證不同參數的結果存在。結束之后點擊查看結果進行下一步操作。

預處理的分析報告如下,可以下載整個表達譜及樣本信息。

模塊三:差異表達分析
進行差異表達分析有兩個入口,第一個是在任務中心頁面,選擇合適的數據集之后確定分析方法。

選擇差異表達分析,點擊下一步。

第二種進行差異表達分析的入口在網站的菜單導航欄數據分析入口。

點擊快速新建,從而選擇樣本的分組信息

在彈出的窗口中選擇樣本分組類型,這里以器官為例。

選中所有樣本,點擊下一步。

這里是差異表達的默認參數,可以修改,或直接生成報告。

差異表達分析的結果如下,在任務中心頁面也可以找到,提供了基因、log2FC、p值和校正p值,并且提供了火山圖。
模塊四:核心基因挖掘
類似于差異表達基因分析,進行核心基因分析。

選擇分組,同上。

點擊設置生存時間參數及事件。

實例設置如下,點擊生成報告。

核心基因分析的結果相當豐富,首先是差異表達分析的結果,這里不再贅述。

第二個結果,從差異表達基因中構建了蛋白質互作網絡,并且提供了網絡圖。


第三個結果是在蛋白質互作網絡中基于網絡測度識別hub基因,這樣再也不愁找不到靶點了。

第四部分結果是在hub基因的基礎之上,進行生存分析,KM曲線說明了hub基因表達水平對樣本生存預后情況的影響。

KM曲線如下圖。

模塊五:網站導航

模塊六:工具寶典
該網站有一系列兄弟網站,蘊含著豐富的工具與信息,值得大家去探索,包括文獻檢索下載、期刊查詢、科研繪圖等。
