8個NAR數據庫速覽:用好這些數據庫,文章讓你發到吐
生命科學研究始終離不開各種生物數據庫的發展,其中最著名的當屬NCBI。Nucleic Acids Research(IF=16.974) Database 專刊于2021年發表了一系列重磅數據庫,包括細胞藥物應答、癌癥藥物反應、癌癥miRNA、癌癥可變剪切等多種當下研究熱點,今天小編帶大家一起閱覽一下8個數據庫。
1.CeDR Atlas: 細胞藥物應答知識庫
訪問地址:https://ngdc.cncb.ac.cn/cedr
文章:CeDR Atlas:a knowledgebase of cellular drug response
數據庫簡介:基因組具有復雜的功能特征,因此藥物對許多疾病的反應與應答差異很大。人體組織,特別是腫瘤的細胞多樣性,是導致不同樣本藥物反應不同的主要因素之一。隨著單細胞RNA測序數據的積累,現有數據有可能在單細胞分辨率下研究藥物對不同治療的反應。作者展示了CeDR Atlas,報告了來自不同組織的數百種細胞類型的細胞藥物反應的計算推斷。作者利用了通過Connectivity Map資源(CMap)獲得的藥物誘導基因表達的高通量分析,以及涵蓋各種器官/組織、疾病和不同生理或病理條件下的數百個scRNA-seq數據。目前,CeDR Atlas涵蓋了人類、小鼠和細胞系的582個單細胞數據對象的結果,包括約140個表型和1250個組織細胞組合類型。所有的結果都可以通過藥物、細胞類型、組織、疾病和特征基因等關鍵詞進行探索和搜索。總的來說,在細胞分辨率上,CeDR Atlas精細地描繪了藥物反應,并闡明了組合治療、耐藥性甚至藥物副作用。

2.CTR-DB:一個與癌癥藥物反應相關的基因表達特征綜合數據庫
訪問地址:http://ctrdb.ncpsb.org.cn/
文章:CTR-DB, an omnibus for patient-derived gene expression signatures correlated with cancer drug response
數據庫簡介:到目前為止,只有部分癌癥患者能從化療和靶向治療中獲益,耐藥仍然是當前癌癥研究面臨的主要和具有挑戰性的問題。快速積累的與癌癥藥物反應相關的患者臨床轉錄組數據為探索藥物反應的分子決定因素帶來了機遇,但同時也對數據的管理、整合和重用提出了挑戰。作者提出了癌癥治療反應基因特征數據庫,供基礎和臨床研究人員訪問、整合和重復使用癌癥藥物反應的臨床轉錄組。CTR-DB收集并統一重新處理了83個患者來源的治療前轉錄組源數據集,其中包括28種組織學腫瘤類型、123種藥物和5139個患者樣本。這些數據是可瀏覽、可搜索和可下載的。此外,CTR-DB支持單數據集探索(包括差異基因表達、受試者工作特征曲線(ROC)、功能富集、致敏藥物搜索、腫瘤微環境分析)、多數據集組合比較以及生物標志物驗證功能。這為耐藥機制、預測性生物標志物的發現和驗證、藥物聯合和耐藥機制異質性提供了深入的見解。

3.CancerMIRNome:人類癌癥miRNA交互式分析與可視化數據庫
訪問地址:http://bioinfo.jialab-ucr.org/CancerMIRNome
文章:CancerMIRNome: an interactive analysis and visualization database for miRNome profiles of human cancer
數據庫簡介:miRNA在基因調控網絡中發揮著重要作用,已經成為人類癌癥診斷和預后的非常有前景的生物標志物,特別是在循環血液中分泌的miRNA以非常穩定的形式存在,并有巨大的潛力作為早期癌癥檢測的非侵襲性生物標志物。目前迫切需要新穎和用戶友好的工具來促進從癌癥基因組圖譜(TCGA)和大規模循環miRNA譜研究中的大量miRNA表達數據中進行數據挖掘。為了填補這一空白,作者開發了綜合的數據庫CancerMIRNome,用于miRNA表達譜的交互分析和可視化,基于來自33個TCGA項目的10554個樣本和來自40個公開流通miRNome數據集的28633個樣本。一系列尖端生物信息學工具和機器學習算法已被打包在CancerMIRNome中,允許對多個癌癥類型的感興趣的miRNA進行泛癌分析或對miRNome譜進行全面分析,以識別失調的miRNA,并開發診斷或預后特征。數據分析和可視化模塊將極大地促進有價值資源的開發,促進miRNA生物標志物在癌癥中的轉化應用。

4.Regeneration Roadmap:再生生物學多組學數據資源庫
訪問地址:https://ngdc.cncb.ac.cn/regeneration/index
文章:Regeneration Roadmap: database resources for regenerative biology
數據庫簡介:隨著細胞重編程、基因編輯、合成生物學、高通量測序等技術的快速發展,再生生物學進入前所未有的蓬勃發展時期,助力解決組織替代、功能修復、衰老干預、疾病治療等一系列生命醫學領域的重要科學難題。面對科學數據的爆炸式增長,亟需建立以再生生物學為核心的開放數據庫,以存儲世界范圍內的組學研究數據為基礎,推動再生相關的基礎研究和臨床轉化應用的不斷發展。Regeneration Roadmap從轉錄組、單細胞轉錄組、表觀基因組及藥物基因組等不同層面整合了再生相關數據集,涉及11個物種、36種組織類型,實現了不同條件下基因表達隨再生變化的匯聚融合,以及對不同層次組學數據的交互查詢和聯合比較分析。此外,數據庫收錄了基于已有文獻報道的再生相關基因集,使得用戶可以更加深入全面地了解特定基因或通路在再生生物學中的功能。

5.Gene Expression Nebulas:整合多物種的bulk與單細胞轉錄組數據庫
訪問地址:https://ngdc.cncb.ac.cn/gen/
文章:Gene Expression Nebulas (GEN): a comprehensive data portal integrating transcriptomic profiles across multiple species at both bulk and single-cell levels
數據庫介紹:轉錄組分析對于從轉錄和轉錄后方面揭示功能至關重要。可開放獲取的數據門戶Gene Expression Nebulas整合了各種生物背景下的轉錄組概況,GEN通過使用標準化的數據處理管道和結構化的管理模型,提供了高質量的bulk和單細胞RNA測序數據集的管理集合。目前,GEN儲存了來自323個數據集(157個bulk數據集和166個單細胞數據集)的基因表達譜,涵蓋了30個物種的50500個樣本和15540169個細胞,這些細胞進一步分為6個生物條件。此外,GEN為10個bulk數據集集成了表達、RNA編輯和選擇性剪接的完整的轉錄組譜,為用戶提供了在轉錄和轉錄后水平進行整合分析的機會。此外,GEN還提供了豐富的基因注釋,并提供在線數據分析和可視化服務。總的來說,GEN提供了跨多個物種的轉錄組譜的綜合收集,從而為更好地理解從組織到細胞的遺傳調控結構和功能機制提供了基礎資源。

6.OncoSplicing:人類癌癥中臨床相關的可變剪接數據資源庫
訪問鏈接:www.oncosplicing.com
文章:OncoSplicing: an updated database for clinically relevant alternative splicing in 33 human cancers
數據庫簡介:選擇性剪接(alternative splicing)是mRNA水平上調控基因表達的一種重要方法,有助于提高蛋白質的復雜性。據報道,異常剪接在包括癌癥在內的幾種疾病中發揮作用。OncoSplicing數據庫用于可視化生存相關的可變剪接事件。基于TCGA SpliceSeq項目中33種癌癥的122423例AS事件和TCGA SplAdder項目中32種癌癥的238558例AS事件,提供了OncoSplicing的更新版本,以綜合看待臨床相關的可變剪接。新版本的數據庫包含幾個有用的功能,如可變剪接相關轉錄本的注釋、基于中值和最佳截斷的生存分析、TCGA腫瘤樣本與相鄰正常樣本或GTEx正常樣本之間的差異分析、可變剪接的泛癌視圖、剪接差異和Cox'PH回歸結果、臨床指標相關和癌癥特異性剪接事件的識別、SplAdder項目中可下載的剪接數據。總的來說,OncoSplicing的基本更新版本是一個用戶友好且無需注冊的數據庫,用于瀏覽和搜索人類癌癥中臨床相關的可變剪接。

7.SPENCER:癌癥病人非編碼RNA編碼的生物活性短肽數據庫
訪問地址:http://spencer.renlab.org
文章:SPENCER: a comprehensive database for small peptides encoded by noncoding RNAs in cancer patients
數據庫簡介:隨著越來越多的非編碼RNA(ncRNA)被發現可以編碼腫瘤中的生物活性短肽,對ncRNA編碼的短肽(ncPEPs)的探索正成為癌癥研究的一個令人著迷的領域。SPENCER數據庫幫助研究ncPEPs的調控機制。目前,SPENCER已經從55項研究中收集了2806個質譜數據點,涵蓋1007個腫瘤樣本和719個正常樣本。使用基于MS的蛋白質組學分析管道,SPENCER在15種不同的癌癥類型中鑒定了29526個ncPEPs。具體來說,22060個ncPEPs在其他研究中得到了實驗驗證。通過比較腫瘤和正常樣本,將鑒定出的ncPEPs分為四個表達組:腫瘤特異性表達組、癌中上調表達組、癌中下調表達組和其他表達組。此外,由于ncPEPs是基于新抗原的癌癥免疫治療的潛在靶點,SPENCER還通過評估其MHC-I結合親和性、穩定性和TCR識別概率來預測所有已鑒定的ncPEPs的免疫原性。因此,有4497個ncPEPs被預測為免疫原性的。總的來說,SPENCER將是研究癌癥相關的ncPEPs的有用資源,并可能促進癌癥的進一步研究。

8.TISMO:腫瘤免疫同基因小鼠
訪問地址:http://tismo.cistrome.org
文章:TISMO: syngeneic mouse tumor database to model tumor immunity and immunotherapy response
數據庫簡介:同基因小鼠模型是由移植在具有相同遺傳背景的小鼠品系上的小鼠癌細胞產生的腫瘤,被廣泛應用于研究腫瘤免疫和在全功能的小鼠免疫系統背景下的免疫治療反應。盡管缺乏系統的收集和分析使得數據的重用具有挑戰性,但在不同的免疫治療下已經產生了大量的同基因小鼠腫瘤表達譜。TISMO是一個具有交互式可視化功能的同基因小鼠模型的廣泛收集的數據庫,包含來自23種癌癥類型的49個同基因癌細胞系的605個體外RNA-seq樣本,其中195個接受了細胞因子治療。TISMO還包括來自19種癌癥類型的68個同基因小鼠腫瘤模型的1518個體內RNA-seq樣本,其中832個來自免疫檢查點阻斷(ICB)研究。手工標注了樣本元數據,如細胞系、小鼠品系、移植部位、治療和應答狀態等,并統一處理和質量控制RNA-seq數據。除了數據下載,TISMO還提供交互式網絡界面,以研究特異性基因表達、途徑富集或免疫浸潤水平是否與差異免疫治療反應相關。
