單細(xì)胞測(cè)序技術(shù)作為近十年最偉大的科學(xué)進(jìn)展之一,在很多科研領(lǐng)域均產(chǎn)生了深刻的影響。單細(xì)胞測(cè)序技術(shù)解決了很多在bulk測(cè)序上解決不了的在單個(gè)細(xì)胞尺度上的機(jī)制研究,這使其已經(jīng)逐漸成為一種現(xiàn)象級(jí)研究手段。作為一種適應(yīng)性很廣,功能多樣的測(cè)序手段,單細(xì)胞測(cè)序技術(shù)在研究腫瘤抑制性,免疫細(xì)胞和神經(jīng)系統(tǒng)復(fù)雜性上有突出的優(yōu)勢(shì),除了迅速增長(zhǎng)的單細(xì)胞測(cè)序數(shù)據(jù),各種基于單細(xì)胞測(cè)序的生信分析工具也得以快速發(fā)展。雖然目前單細(xì)胞測(cè)序技術(shù)最常用于腫瘤研究,而近些年在非腫瘤領(lǐng)域也在迅速增長(zhǎng),考慮到大家有很多是在非腫瘤研究領(lǐng)域,而且腫瘤研究的單細(xì)胞數(shù)據(jù)庫(kù)都被介紹的很多了,今天小編就來(lái)系統(tǒng)整理了截止到2022年所有的非腫瘤單細(xì)胞數(shù)據(jù)庫(kù)。
以下對(duì)非腫瘤單細(xì)胞數(shù)據(jù)庫(kù)的介紹主要分為3種類(lèi)型:第一種是大型綜合單細(xì)胞數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)多是多項(xiàng)重大研究成果的產(chǎn)物,其主要是作為單細(xì)胞數(shù)據(jù)儲(chǔ)存的數(shù)據(jù)庫(kù);第二種是疾病特異性單細(xì)胞數(shù)據(jù)庫(kù),這種非腫瘤單細(xì)胞數(shù)據(jù)庫(kù)收錄的數(shù)據(jù)就沒(méi)有第一種多,主要是針對(duì)具體的疾病類(lèi)型進(jìn)行數(shù)據(jù)整理;第三種是單細(xì)胞功能分析數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)是針對(duì)某一項(xiàng)科學(xué)問(wèn)題,對(duì)單細(xì)胞數(shù)據(jù)進(jìn)行功能分析的數(shù)據(jù)庫(kù),我們可以使用這種數(shù)據(jù)庫(kù)完成對(duì)單細(xì)胞數(shù)據(jù)的某項(xiàng)具體的功能分析。
一.大型綜合單細(xì)胞數(shù)據(jù)庫(kù)
1.Human cell atlas(HCA):人類(lèi)細(xì)胞圖譜計(jì)劃,迄今為止項(xiàng)目最龐大的單細(xì)胞測(cè)序項(xiàng)目成果。聚焦人正常組織,對(duì)人體各個(gè)組織器官的單細(xì)胞層面數(shù)據(jù)均可使用這個(gè)網(wǎng)站進(jìn)行下載。
網(wǎng)址:https://data.humancellatlas.org/

2.SCXA:EBI旗下的單細(xì)胞數(shù)據(jù)庫(kù),收錄了各種疾病類(lèi)型的單細(xì)胞數(shù)據(jù),而且這個(gè)網(wǎng)站持續(xù)更新。由于EBI旗下還有很多類(lèi)使用bulk數(shù)據(jù)庫(kù)和功能分析數(shù)據(jù)庫(kù),這個(gè)網(wǎng)站均可無(wú)縫連接到相應(yīng)數(shù)據(jù)庫(kù)。
網(wǎng)址:https://www.ebi.ac.uk/gxa/sc/home

3.Single Cell Portal:目前收錄412個(gè)研究中的1800萬(wàn)+的單細(xì)胞數(shù)據(jù)庫(kù),而且持續(xù)更新,數(shù)據(jù)維護(hù)的很好,還可以進(jìn)行簡(jiǎn)單的在線(xiàn)分析。
網(wǎng)址:https://singlecell.broadinstitute.org/single_cell

4.SCPortalen:日本的單細(xì)胞測(cè)序數(shù)據(jù)庫(kù),日本的生物醫(yī)學(xué)領(lǐng)域還是很先進(jìn)的,很多諾貝爾醫(yī)學(xué)獎(jiǎng)得主都是日本人。這個(gè)網(wǎng)站做的很精細(xì),唯一的缺點(diǎn)是數(shù)據(jù)更新沒(méi)有前兩個(gè)數(shù)據(jù)庫(kù)快。
網(wǎng)址:http://single-cell.clst.riken.jp/

5.scRNASeqDB:另一大型單細(xì)胞數(shù)據(jù)庫(kù),專(zhuān)門(mén)收集人類(lèi)單細(xì)胞測(cè)序的數(shù)據(jù)庫(kù),涵蓋200種細(xì)胞系和14000個(gè)樣本。除了數(shù)據(jù)龐大的特點(diǎn),這個(gè)數(shù)據(jù)庫(kù)可以進(jìn)行關(guān)鍵基因的在線(xiàn)分析。
網(wǎng)址: https://bioinfo.uth.edu/scrnaseqdb/

6.Tabula Muris:小鼠的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫(kù),包含了來(lái)自20個(gè)器官和組織的近10萬(wàn)個(gè)細(xì)胞。這些數(shù)據(jù)允許對(duì)組織間共享的細(xì)胞類(lèi)型的基因表達(dá)進(jìn)行直接和受控的比較,例如來(lái)自不同解剖位置的免疫細(xì)胞。它們還允許對(duì)兩種不同的技術(shù)的單細(xì)胞數(shù)據(jù)進(jìn)行比較:基于微流控液滴的3端測(cè)序:以相對(duì)較低的覆蓋率對(duì)每個(gè)器官的數(shù)千個(gè)細(xì)胞進(jìn)行研究;和基于流式細(xì)胞儀的全長(zhǎng)轉(zhuǎn)錄本分析:提供更高的靈敏度和覆蓋率。
網(wǎng)址:https://tabula-muris.ds.czbiohub.org/

7.SpatialDB:專(zhuān)門(mén)存放單細(xì)胞空間轉(zhuǎn)錄組數(shù)據(jù)的數(shù)據(jù)庫(kù),單細(xì)胞空間轉(zhuǎn)錄組相對(duì)于普通的單細(xì)胞測(cè)序數(shù)據(jù),其保留了樣本的各種細(xì)胞空間分布信息。這個(gè)數(shù)據(jù)庫(kù)可以下載多種疾病模型的單細(xì)胞空間轉(zhuǎn)錄組的數(shù)據(jù)。
網(wǎng)址:https://www.spatialomics.org/SpatialDB/

8.MCA: 浙大郭國(guó)驥老師團(tuán)隊(duì)制作的小鼠單細(xì)胞圖譜數(shù)據(jù)庫(kù),如果想得到小鼠正常組織的單細(xì)胞數(shù)據(jù)均可在這個(gè)數(shù)據(jù)庫(kù)中下載。
網(wǎng)址:http://bis.zju.edu.cn/MCA/

9.PlantscRNAd:光有動(dòng)物的單細(xì)胞數(shù)據(jù)可不夠,還有做植物研究的小伙伴。但是我們知道植物細(xì)胞有細(xì)胞壁,做植物的單細(xì)胞測(cè)序難度是很高的,于是業(yè)界大佬浙江大學(xué)樊龍江團(tuán)隊(duì)就專(zhuān)門(mén)構(gòu)建了植物單細(xì)胞數(shù)據(jù)庫(kù)。
網(wǎng)址:http://ibi.zju.edu.cn/plantscrnadb/

二.疾病特異性單細(xì)胞數(shù)據(jù)庫(kù)
1. SC2disease:此數(shù)據(jù)庫(kù)主要用于各類(lèi)疾病分析,其基于各種疾病和正常單細(xì)胞轉(zhuǎn)錄組基因表達(dá)譜數(shù)據(jù),為研究者提供豐富的細(xì)胞特異性信息,如感興趣基因細(xì)胞特異性表達(dá)情況,特定細(xì)胞類(lèi)型標(biāo)記,多種疾病生物標(biāo)志物,以及提供在疾病和非疾病狀態(tài)下各種類(lèi)型細(xì)胞的表達(dá)譜差異性分析功能。
網(wǎng)址:http://easybioai.com/sc2disease/

2.BloodSpot:健康和血液病單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫(kù),對(duì)于研究血液性疾病的小伙伴,這是一個(gè)寶貴的數(shù)據(jù)庫(kù)。這個(gè)數(shù)據(jù)庫(kù)雖然只收錄了循環(huán)系統(tǒng)的單細(xì)胞數(shù)據(jù),但是功能強(qiáng)大,可使用這個(gè)數(shù)據(jù)庫(kù)進(jìn)行多種在線(xiàn)分析,而且可以將分析結(jié)果以各種圖片的形式導(dǎo)出。
網(wǎng)址:http://servers.binf.ku.dk/bloodspot/

3. KIT:腎臟單細(xì)胞數(shù)據(jù)庫(kù),收錄了各種腎臟組織的單細(xì)胞數(shù)據(jù),對(duì)腎臟疾病進(jìn)行研究的小伙伴可要將這個(gè)網(wǎng)址記住。
網(wǎng)址:http://humphreyslab.com/SingleCell/

4. VascularSingleCell:血管單細(xì)胞數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)收錄了人和小鼠的腦血管肺血管的單細(xì)胞數(shù)據(jù),不同于上面講述的血細(xì)胞數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)只關(guān)注血管細(xì)胞。
網(wǎng)址:http://betsholtzlab.org/VascularSingleCells/database.html

5. iSyTE:專(zhuān)注于研究眼睛發(fā)育的單細(xì)胞數(shù)據(jù)庫(kù)。
網(wǎng)址:https://research.bioinformatics.udel.edu/iSyTE/ppi/index.php

6.DBTMEE:專(zhuān)門(mén)用于眼睛小鼠早期胚胎發(fā)育的單細(xì)胞數(shù)據(jù)庫(kù)。
網(wǎng)址:http://dbtmee.hgc.jp/

7.CeDR Atlas:CeDR Atlas數(shù)據(jù)庫(kù)基于文獻(xiàn)中人類(lèi)、小鼠和不同細(xì)胞系的特異性藥物反應(yīng)信息,綜合分析了細(xì)胞類(lèi)型特異性藥物反應(yīng)分析,涵蓋疾病狀態(tài)下的細(xì)胞類(lèi)型和正常細(xì)胞類(lèi)型,為細(xì)胞藥物反應(yīng)譜提供直接參考。數(shù)據(jù)庫(kù)目前收錄超過(guò)582個(gè)人類(lèi)、小鼠和細(xì)胞系的單細(xì)胞數(shù)據(jù)結(jié)果,包括約140個(gè)表型和1250個(gè)組織/細(xì)胞類(lèi)型的約188,157個(gè)人類(lèi)相關(guān)、42660個(gè)小鼠相關(guān)和10299個(gè)細(xì)胞系相關(guān)的細(xì)胞藥物反應(yīng)信息。
網(wǎng)址:https://ngdc.cncb.ac.cn/cedr

8.Jingle Bells:數(shù)據(jù)來(lái)源為公開(kāi)可用的數(shù)據(jù)(該數(shù)據(jù)庫(kù)只是把公開(kāi)數(shù)據(jù)進(jìn)行了整合) 數(shù)據(jù)來(lái)源相對(duì)集中,收集免疫(120個(gè)數(shù)據(jù)集)以及非免疫(183個(gè)數(shù)據(jù)集)該數(shù)據(jù)庫(kù)作為免疫相關(guān)數(shù)據(jù)的數(shù)據(jù)庫(kù)確實(shí)具有著把相關(guān)信息集中以便我們搜索和學(xué)習(xí)的作用,我們可以通過(guò)這個(gè)數(shù)據(jù)庫(kù)去了解免疫相關(guān)的數(shù)據(jù)以及文獻(xiàn)從而深化我們的課題進(jìn)展
網(wǎng)址:http://jinglebells.bgu.ac.il/1.

9.Aging Atlas:衰老研究一直都是一個(gè)很熱門(mén)的領(lǐng)域,這個(gè)數(shù)據(jù)庫(kù)整理了多項(xiàng)專(zhuān)門(mén)研究衰老的單細(xì)胞數(shù)據(jù),可以使用其進(jìn)行衰老相關(guān)基因的研究。
網(wǎng)址:https://ngdc.cncb.ac.cn/aging/index

10.Gut Cell Atlas:腸道組織的單細(xì)胞測(cè)序數(shù)據(jù)庫(kù),所有單細(xì)胞數(shù)據(jù)均公開(kāi)可下載。
網(wǎng)址:https://www.gutcellatlas.org/

11.StemMapper:干細(xì)胞發(fā)育研究單細(xì)胞數(shù)據(jù)庫(kù)。
網(wǎng)址:http://stemmapper.sysbiolab.eu/

12.stemformatics:和StemMapper類(lèi)似,同樣是針對(duì)干細(xì)胞構(gòu)建的單細(xì)胞數(shù)據(jù)庫(kù)。
網(wǎng)址:https://www.stemformatics.org/expressions/gene_expression_graph

三.單細(xì)胞功能分析數(shù)據(jù)庫(kù)
1.HCL: 不同于人類(lèi)圖譜計(jì)劃,這個(gè)數(shù)據(jù)庫(kù)在線(xiàn)分析功能強(qiáng)大。由浙江大學(xué)郭國(guó)驥教授開(kāi)發(fā),包括人類(lèi)50種組織的超過(guò)70萬(wàn)個(gè)細(xì)胞,劃分為102個(gè)cluster,可以查詢(xún)每種組織、每個(gè)cluster的marker基因。可以上傳和下載數(shù)據(jù)自行分析。
網(wǎng)址:https://db.cngb.org/HCL/

2.Cell Blast:Cell BLAST是一個(gè)自帶高質(zhì)量參考數(shù)據(jù)庫(kù)的scRNA-seq數(shù)據(jù)檢索/注釋工具,能做細(xì)胞類(lèi)型鑒定、發(fā)現(xiàn)新細(xì)胞類(lèi)型、注釋連續(xù)細(xì)胞狀態(tài)。
網(wǎng)址:https://cblast.gao-lab.org/

3. PanglaoDB:來(lái)自瑞典卡洛琳學(xué)院的研究人員開(kāi)發(fā)的PanglaoDB數(shù)據(jù)庫(kù),用于探索小鼠和人類(lèi)scRNA-seq數(shù)據(jù),為單細(xì)胞組學(xué)研究提供公共scRNA-seq數(shù)據(jù)資源。相關(guān)研究成果2019年發(fā)表在《Database》。PanglaoDB數(shù)據(jù)庫(kù)收集并整合來(lái)自多個(gè)研究的數(shù)據(jù),包括:小鼠的184種組織、1063個(gè)樣本、446W細(xì)胞;人的74種組織、305個(gè)樣本、112w細(xì)胞。網(wǎng)址:https://panglaodb.se/index.html

4.CellMarkrer:該數(shù)據(jù)庫(kù)包括來(lái)源于100000+已發(fā)表文獻(xiàn)整理出來(lái)的,人的158種組織/亞組織、467個(gè)細(xì)胞類(lèi)型、13605個(gè)Marker基因;小鼠81種組織/亞組織、389個(gè)細(xì)胞類(lèi)型、9148個(gè)Marker基因。用戶(hù)可以通過(guò)選擇物種、組織類(lèi)型、細(xì)胞類(lèi)型來(lái)查詢(xún)marker基因,也可以下載marker基因列表,還可以上傳自己的文章或數(shù)據(jù)。
網(wǎng)址:http://bio-bigdata.hrbmu.edu.cn/CellMarker/

5.scQuery:對(duì)比分析不同研究的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)。
網(wǎng)址:https://scquery.cs.cmu.edu/

6.SCDevDB:單細(xì)胞深度組學(xué)數(shù)據(jù)庫(kù),在線(xiàn)分析功能強(qiáng)大。
網(wǎng)址:https://scdevdb.deepomics.org/

7.LnCeCell:從GEO和CancerSEA收集了與癌癥相關(guān)的scRNA-seq數(shù)據(jù)集,確保質(zhì)量,控制癌細(xì)胞數(shù)> 100,并且通過(guò)注釋將表達(dá)譜分為mRNA和lncRNA,使用GENCODE數(shù)據(jù)庫(kù)注釋?zhuān)℅RCh38,版本34)。最后得到源于25種癌癥的40個(gè)單細(xì)胞數(shù)據(jù)集,總共有94605個(gè)單細(xì)胞被用于構(gòu)建LnCeCell。
網(wǎng)址:http://www.bio-bigdata.net/LnCeCell/

8.ColorCells:這個(gè)數(shù)據(jù)庫(kù)提供了一個(gè)友好的可視化界面,包括PCA和t-SNE算法應(yīng)用于細(xì)胞集群在2d和3d空間中,開(kāi)發(fā)一個(gè)工具來(lái)展示各種組織和細(xì)胞類(lèi)型在人類(lèi)和老鼠,建立一個(gè)超幾何分布的統(tǒng)計(jì)檢驗(yàn)方法自動(dòng)分配給細(xì)胞集群,基于SNN和pearson相關(guān)分析,構(gòu)建蛋白- lncrna共表達(dá)網(wǎng)絡(luò),從scRNA-Seq數(shù)據(jù)預(yù)測(cè)lncrna。
網(wǎng)址:https://rna.sysu.edu.cn/colorcells/

9.Virtual Cytometry:它為使用scRNA-seq數(shù)據(jù)的免疫細(xì)胞分化研究提供計(jì)算平臺(tái),通過(guò)“發(fā)現(xiàn)模塊”和“假設(shè)測(cè)試模塊”分別識(shí)別和驗(yàn)證參與免疫細(xì)胞分化的基因。
網(wǎng)址:https://www.grnpedia.org/cytometry/

10.SPICA:專(zhuān)注于研究病毒感染和腫瘤小鼠模型的單細(xì)胞數(shù)據(jù)庫(kù)。
網(wǎng)址:https://spica.epfl.ch/projects

11.GRNdb:轉(zhuǎn)錄因子及其下游靶基因形成的基因調(diào)控網(wǎng)絡(luò)(Gene Regulatory Network, GRN)數(shù)據(jù)庫(kù),是一個(gè)免費(fèi)訪(fǎng)問(wèn)和用戶(hù)友好的數(shù)據(jù)庫(kù),可以方便地探索和可視化由轉(zhuǎn)錄因子(轉(zhuǎn)錄因子)和下游靶基因(稱(chēng)為調(diào)控)形成的預(yù)測(cè)調(diào)控網(wǎng)絡(luò),基于大規(guī)模RNA-seq數(shù)據(jù),以及已知的tf -靶標(biāo)關(guān)系,適用于各種人類(lèi)和小鼠條件。
網(wǎng)址:http://www.grndb.com/

12.SciBet:是一種利用單細(xì)胞RNA測(cè)序技術(shù)預(yù)測(cè)任意隨機(jī)測(cè)序細(xì)胞身份的計(jì)算工具。與其他有監(jiān)督的單元類(lèi)型識(shí)別方法相比,SciBet在精度、魯棒性、可擴(kuò)展性和速度方面都具有優(yōu)勢(shì)。在普通計(jì)算機(jī)上,對(duì)于包含10萬(wàn)個(gè)cell的數(shù)據(jù)集,我們可以在1秒左右完成準(zhǔn)確的特征選擇和分類(lèi)分析。我們不僅提供了R語(yǔ)言的二進(jìn)制包,還提供了來(lái)自多個(gè)數(shù)據(jù)集的大約100種訓(xùn)練過(guò)的模式。此外,用戶(hù)可以在線(xiàn)使用SciBet上傳他們的定制數(shù)據(jù)集進(jìn)行分類(lèi)。
網(wǎng)址:http://scibet.cancer-pku.cn/index.html

13.CellPhoneDB:細(xì)胞間通訊網(wǎng)絡(luò)研究的必備研究工具,是由英國(guó)Wellcome Sanger Institute的Teichmann Lab和Vento-Tormo Lab開(kāi)發(fā),但是在線(xiàn)工具不是很穩(wěn)定,需下載自行分析。
網(wǎng)址:https://www.cellphonedb.org/

14.scMetabolism:收集了KEGG,Reactom中的基因集,可自行上傳數(shù)據(jù),完成對(duì)單細(xì)胞數(shù)據(jù)完成代謝通路的分析。
網(wǎng)址:http://www.cancerdiversity.asia/scMetabolism/

15.signatureDB: B cell數(shù)據(jù)庫(kù),相應(yīng)成果在2018年發(fā)表在新英格蘭雜志上,數(shù)據(jù)以表格的形式進(jìn)行展示,僅供自行下載研究。
網(wǎng)址;https://lymphochip.nih.gov/signaturedb/

四.總結(jié)
小編可以負(fù)責(zé)任的和大家講,這是截止到目前,總結(jié)的最全面的非腫瘤單細(xì)胞數(shù)據(jù)庫(kù)的推文了。其實(shí)還有一個(gè)數(shù)據(jù)庫(kù)沒(méi)有提及,那就是GEO數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)是很多上述講到的數(shù)據(jù)庫(kù)數(shù)據(jù)的最初來(lái)源,大家也都知道GEO涵蓋了包括bulk, ATAC, Chip等各種數(shù)據(jù),當(dāng)然各大單細(xì)胞研究的數(shù)據(jù)也會(huì)優(yōu)先上傳在這個(gè)數(shù)據(jù)庫(kù)上,小編在這里就不對(duì)其進(jìn)行細(xì)說(shuō)了。
各種單細(xì)胞數(shù)據(jù)庫(kù)是非常寶貴的資源,對(duì)已經(jīng)發(fā)表的數(shù)據(jù)進(jìn)行二次分析也逐漸成為一種常態(tài),特別對(duì)一些經(jīng)費(fèi)不足的小課題組,分析已經(jīng)發(fā)表的單細(xì)胞數(shù)據(jù)來(lái)研究自己的科學(xué)問(wèn)題是一項(xiàng)非常具有重大意義的工作。運(yùn)用這些數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘時(shí),首先是去綜合性數(shù)據(jù)庫(kù)下載數(shù)據(jù),因?yàn)檫@些大型數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)的整理相對(duì)規(guī)范;其次針對(duì)自己的眼睛領(lǐng)域去找疾病特異性的單細(xì)胞數(shù)據(jù)庫(kù);最后是利用可以進(jìn)行在線(xiàn)分析的數(shù)據(jù)庫(kù)對(duì)具體細(xì)胞亞群的功能進(jìn)行研究;最后,希望大家都能利用好這些非腫瘤數(shù)據(jù)庫(kù)資源,早早發(fā)表大paper.