單細胞測序技術作為近十年最偉大的科學進展之一,在很多科研領域均產生了深刻的影響。單細胞測序技術解決了很多在bulk測序上解決不了的在單個細胞尺度上的機制研究,這使其已經逐漸成為一種現象級研究手段。作為一種適應性很廣,功能多樣的測序手段,單細胞測序技術在研究腫瘤抑制性,免疫細胞和神經系統復雜性上有突出的優勢,除了迅速增長的單細胞測序數據,各種基于單細胞測序的生信分析工具也得以快速發展。雖然目前單細胞測序技術最常用于腫瘤研究,而近些年在非腫瘤領域也在迅速增長,考慮到大家有很多是在非腫瘤研究領域,而且腫瘤研究的單細胞數據庫都被介紹的很多了,今天小編就來系統整理了截止到2022年所有的非腫瘤單細胞數據庫。
以下對非腫瘤單細胞數據庫的介紹主要分為3種類型:第一種是大型綜合單細胞數據庫,這種數據庫多是多項重大研究成果的產物,其主要是作為單細胞數據儲存的數據庫;第二種是疾病特異性單細胞數據庫,這種非腫瘤單細胞數據庫收錄的數據就沒有第一種多,主要是針對具體的疾病類型進行數據整理;第三種是單細胞功能分析數據庫,這種數據庫是針對某一項科學問題,對單細胞數據進行功能分析的數據庫,我們可以使用這種數據庫完成對單細胞數據的某項具體的功能分析。
一.大型綜合單細胞數據庫
1.Human cell atlas(HCA):人類細胞圖譜計劃,迄今為止項目最龐大的單細胞測序項目成果。聚焦人正常組織,對人體各個組織器官的單細胞層面數據均可使用這個網站進行下載。
網址:https://data.humancellatlas.org/

2.SCXA:EBI旗下的單細胞數據庫,收錄了各種疾病類型的單細胞數據,而且這個網站持續更新。由于EBI旗下還有很多類使用bulk數據庫和功能分析數據庫,這個網站均可無縫連接到相應數據庫。
網址:https://www.ebi.ac.uk/gxa/sc/home

3.Single Cell Portal:目前收錄412個研究中的1800萬+的單細胞數據庫,而且持續更新,數據維護的很好,還可以進行簡單的在線分析。
網址:https://singlecell.broadinstitute.org/single_cell

4.SCPortalen:日本的單細胞測序數據庫,日本的生物醫學領域還是很先進的,很多諾貝爾醫學獎得主都是日本人。這個網站做的很精細,唯一的缺點是數據更新沒有前兩個數據庫快。
網址:http://single-cell.clst.riken.jp/

5.scRNASeqDB:另一大型單細胞數據庫,專門收集人類單細胞測序的數據庫,涵蓋200種細胞系和14000個樣本。除了數據龐大的特點,這個數據庫可以進行關鍵基因的在線分析。
網址: https://bioinfo.uth.edu/scrnaseqdb/

6.Tabula Muris:小鼠的單細胞轉錄組數據庫,包含了來自20個器官和組織的近10萬個細胞。這些數據允許對組織間共享的細胞類型的基因表達進行直接和受控的比較,例如來自不同解剖位置的免疫細胞。它們還允許對兩種不同的技術的單細胞數據進行比較:基于微流控液滴的3端測序:以相對較低的覆蓋率對每個器官的數千個細胞進行研究;和基于流式細胞儀的全長轉錄本分析:提供更高的靈敏度和覆蓋率。
網址:https://tabula-muris.ds.czbiohub.org/

7.SpatialDB:專門存放單細胞空間轉錄組數據的數據庫,單細胞空間轉錄組相對于普通的單細胞測序數據,其保留了樣本的各種細胞空間分布信息。這個數據庫可以下載多種疾病模型的單細胞空間轉錄組的數據。
網址:https://www.spatialomics.org/SpatialDB/

8.MCA: 浙大郭國驥老師團隊制作的小鼠單細胞圖譜數據庫,如果想得到小鼠正常組織的單細胞數據均可在這個數據庫中下載。
網址:http://bis.zju.edu.cn/MCA/

9.PlantscRNAd:光有動物的單細胞數據可不夠,還有做植物研究的小伙伴。但是我們知道植物細胞有細胞壁,做植物的單細胞測序難度是很高的,于是業界大佬浙江大學樊龍江團隊就專門構建了植物單細胞數據庫。
網址:http://ibi.zju.edu.cn/plantscrnadb/

二.疾病特異性單細胞數據庫
1. SC2disease:此數據庫主要用于各類疾病分析,其基于各種疾病和正常單細胞轉錄組基因表達譜數據,為研究者提供豐富的細胞特異性信息,如感興趣基因細胞特異性表達情況,特定細胞類型標記,多種疾病生物標志物,以及提供在疾病和非疾病狀態下各種類型細胞的表達譜差異性分析功能。
網址:http://easybioai.com/sc2disease/

2.BloodSpot:健康和血液病單細胞轉錄組數據庫,對于研究血液性疾病的小伙伴,這是一個寶貴的數據庫。這個數據庫雖然只收錄了循環系統的單細胞數據,但是功能強大,可使用這個數據庫進行多種在線分析,而且可以將分析結果以各種圖片的形式導出。
網址:http://servers.binf.ku.dk/bloodspot/

3. KIT:腎臟單細胞數據庫,收錄了各種腎臟組織的單細胞數據,對腎臟疾病進行研究的小伙伴可要將這個網址記住。
網址:http://humphreyslab.com/SingleCell/

4. VascularSingleCell:血管單細胞數據庫,這個數據庫收錄了人和小鼠的腦血管肺血管的單細胞數據,不同于上面講述的血細胞數據庫,這個數據庫只關注血管細胞。
網址:http://betsholtzlab.org/VascularSingleCells/database.html

5. iSyTE:專注于研究眼睛發育的單細胞數據庫。
網址:https://research.bioinformatics.udel.edu/iSyTE/ppi/index.php

6.DBTMEE:專門用于眼睛小鼠早期胚胎發育的單細胞數據庫。
網址:http://dbtmee.hgc.jp/

7.CeDR Atlas:CeDR Atlas數據庫基于文獻中人類、小鼠和不同細胞系的特異性藥物反應信息,綜合分析了細胞類型特異性藥物反應分析,涵蓋疾病狀態下的細胞類型和正常細胞類型,為細胞藥物反應譜提供直接參考。數據庫目前收錄超過582個人類、小鼠和細胞系的單細胞數據結果,包括約140個表型和1250個組織/細胞類型的約188,157個人類相關、42660個小鼠相關和10299個細胞系相關的細胞藥物反應信息。
網址:https://ngdc.cncb.ac.cn/cedr

8.Jingle Bells:數據來源為公開可用的數據(該數據庫只是把公開數據進行了整合) 數據來源相對集中,收集免疫(120個數據集)以及非免疫(183個數據集)該數據庫作為免疫相關數據的數據庫確實具有著把相關信息集中以便我們搜索和學習的作用,我們可以通過這個數據庫去了解免疫相關的數據以及文獻從而深化我們的課題進展
網址:http://jinglebells.bgu.ac.il/1.

9.Aging Atlas:衰老研究一直都是一個很熱門的領域,這個數據庫整理了多項專門研究衰老的單細胞數據,可以使用其進行衰老相關基因的研究。
網址:https://ngdc.cncb.ac.cn/aging/index

10.Gut Cell Atlas:腸道組織的單細胞測序數據庫,所有單細胞數據均公開可下載。
網址:https://www.gutcellatlas.org/

11.StemMapper:干細胞發育研究單細胞數據庫。
網址:http://stemmapper.sysbiolab.eu/

12.stemformatics:和StemMapper類似,同樣是針對干細胞構建的單細胞數據庫。
網址:https://www.stemformatics.org/expressions/gene_expression_graph

三.單細胞功能分析數據庫
1.HCL: 不同于人類圖譜計劃,這個數據庫在線分析功能強大。由浙江大學郭國驥教授開發,包括人類50種組織的超過70萬個細胞,劃分為102個cluster,可以查詢每種組織、每個cluster的marker基因。可以上傳和下載數據自行分析。
網址:https://db.cngb.org/HCL/

2.Cell Blast:Cell BLAST是一個自帶高質量參考數據庫的scRNA-seq數據檢索/注釋工具,能做細胞類型鑒定、發現新細胞類型、注釋連續細胞狀態。
網址:https://cblast.gao-lab.org/

3. PanglaoDB:來自瑞典卡洛琳學院的研究人員開發的PanglaoDB數據庫,用于探索小鼠和人類scRNA-seq數據,為單細胞組學研究提供公共scRNA-seq數據資源。相關研究成果2019年發表在《Database》。PanglaoDB數據庫收集并整合來自多個研究的數據,包括:小鼠的184種組織、1063個樣本、446W細胞;人的74種組織、305個樣本、112w細胞。網址:https://panglaodb.se/index.html

4.CellMarkrer:該數據庫包括來源于100000+已發表文獻整理出來的,人的158種組織/亞組織、467個細胞類型、13605個Marker基因;小鼠81種組織/亞組織、389個細胞類型、9148個Marker基因。用戶可以通過選擇物種、組織類型、細胞類型來查詢marker基因,也可以下載marker基因列表,還可以上傳自己的文章或數據。
網址:http://bio-bigdata.hrbmu.edu.cn/CellMarker/

5.scQuery:對比分析不同研究的單細胞轉錄組數據。
網址:https://scquery.cs.cmu.edu/

6.SCDevDB:單細胞深度組學數據庫,在線分析功能強大。
網址:https://scdevdb.deepomics.org/

7.LnCeCell:從GEO和CancerSEA收集了與癌癥相關的scRNA-seq數據集,確保質量,控制癌細胞數> 100,并且通過注釋將表達譜分為mRNA和lncRNA,使用GENCODE數據庫注釋(GRCh38,版本34)。最后得到源于25種癌癥的40個單細胞數據集,總共有94605個單細胞被用于構建LnCeCell。
網址:http://www.bio-bigdata.net/LnCeCell/

8.ColorCells:這個數據庫提供了一個友好的可視化界面,包括PCA和t-SNE算法應用于細胞集群在2d和3d空間中,開發一個工具來展示各種組織和細胞類型在人類和老鼠,建立一個超幾何分布的統計檢驗方法自動分配給細胞集群,基于SNN和pearson相關分析,構建蛋白- lncrna共表達網絡,從scRNA-Seq數據預測lncrna。
網址:https://rna.sysu.edu.cn/colorcells/

9.Virtual Cytometry:它為使用scRNA-seq數據的免疫細胞分化研究提供計算平臺,通過“發現模塊”和“假設測試模塊”分別識別和驗證參與免疫細胞分化的基因。
網址:https://www.grnpedia.org/cytometry/

10.SPICA:專注于研究病毒感染和腫瘤小鼠模型的單細胞數據庫。
網址:https://spica.epfl.ch/projects

11.GRNdb:轉錄因子及其下游靶基因形成的基因調控網絡(Gene Regulatory Network, GRN)數據庫,是一個免費訪問和用戶友好的數據庫,可以方便地探索和可視化由轉錄因子(轉錄因子)和下游靶基因(稱為調控)形成的預測調控網絡,基于大規模RNA-seq數據,以及已知的tf -靶標關系,適用于各種人類和小鼠條件。
網址:http://www.grndb.com/

12.SciBet:是一種利用單細胞RNA測序技術預測任意隨機測序細胞身份的計算工具。與其他有監督的單元類型識別方法相比,SciBet在精度、魯棒性、可擴展性和速度方面都具有優勢。在普通計算機上,對于包含10萬個cell的數據集,我們可以在1秒左右完成準確的特征選擇和分類分析。我們不僅提供了R語言的二進制包,還提供了來自多個數據集的大約100種訓練過的模式。此外,用戶可以在線使用SciBet上傳他們的定制數據集進行分類。
網址:http://scibet.cancer-pku.cn/index.html

13.CellPhoneDB:細胞間通訊網絡研究的必備研究工具,是由英國Wellcome Sanger Institute的Teichmann Lab和Vento-Tormo Lab開發,但是在線工具不是很穩定,需下載自行分析。
網址:https://www.cellphonedb.org/

14.scMetabolism:收集了KEGG,Reactom中的基因集,可自行上傳數據,完成對單細胞數據完成代謝通路的分析。
網址:http://www.cancerdiversity.asia/scMetabolism/

15.signatureDB: B cell數據庫,相應成果在2018年發表在新英格蘭雜志上,數據以表格的形式進行展示,僅供自行下載研究。
網址;https://lymphochip.nih.gov/signaturedb/

四.總結
小編可以負責任的和大家講,這是截止到目前,總結的最全面的非腫瘤單細胞數據庫的推文了。其實還有一個數據庫沒有提及,那就是GEO數據庫,這個數據庫是很多上述講到的數據庫數據的最初來源,大家也都知道GEO涵蓋了包括bulk, ATAC, Chip等各種數據,當然各大單細胞研究的數據也會優先上傳在這個數據庫上,小編在這里就不對其進行細說了。
各種單細胞數據庫是非常寶貴的資源,對已經發表的數據進行二次分析也逐漸成為一種常態,特別對一些經費不足的小課題組,分析已經發表的單細胞數據來研究自己的科學問題是一項非常具有重大意義的工作。運用這些數據庫進行數據挖掘時,首先是去綜合性數據庫下載數據,因為這些大型數據庫對數據的整理相對規范;其次針對自己的眼睛領域去找疾病特異性的單細胞數據庫;最后是利用可以進行在線分析的數據庫對具體細胞亞群的功能進行研究;最后,希望大家都能利用好這些非腫瘤數據庫資源,早早發表大paper.