今天給大家介紹一個功能強大的數據庫,先貼上網址http://bioinfo.life.hust.edu.cn/EVAtlas。該數據庫針對細胞外囊泡(EVs)中的非編碼 RNA,有四個強大的功能:①瀏覽并比較24種條件和8種來源(血漿、血清、唾液、尿液、精子、母乳、原代細胞和細胞系)的EV中ncRNAs的分布;②根據條件相關組織中候選ncRNAs的表達情況,對其進行優先排序;③探索 24 種條件下 EV 中特異性表達的 ncRNA;④研究 ncRNA 功能、相關藥物、靶基因和 EVs 分離方法。
導讀
活細胞釋放的細胞外囊泡(EVs)是信號轉導和細胞通訊的重要載體,尤其是遠距離細胞之間的相互作用。從內體系統分泌的外泌體和從質膜脫落的微泡 (MVs)是 EVs 的兩個主要來源。EVs的內容物包括來自源細胞的多種生物分子,如脂質、蛋白質、代謝物、DNA和RNA。非編碼 RNA (ncRNA) 是 EVs 中經過充分研究的重要分子,可以傳遞到和調節靶細胞,并顯示出生理和病理特異性,可作為候選生物標志物。ncRNA作為重要的調控成分在生物過程中發揮著至關重要的作用,其表達譜在正常和疾病狀態下差異很大。 例如,微小RNA(miRNA)、小核仁RNA(snoRNA)和轉移RNA(tRNA)的失調是腫瘤發生中的常見事件。
在EVAtlas綜合數據庫中,研究者對2030 個 EVs smRNA-seq 數據集(1506 sEV和524 lEV數據集)的7種ncRNA(miRNA、snRNA、piRNA、snRNA、rRNA、tRNA和Y RNA)在24種條件和40多種疾病中的表達進行了整理和分析,并為在不同EV類型中的ncRNA提供了功能注釋和特異性表達分析。目前,EVAtlas是EV ncRNA表達最全面的資源,已成為該領域研究的關鍵資源。

EVAtlas數據收集和處理
1、數據收集
研究者使用關鍵字“((extracellular vesicle OR exosome OR microvesicle OR EV)AND(smRNA-seq OR miRNA-seq OR small RNA-seq))AND(Homo sapiens)”從NCBI GEO和SRA數據庫檢索人類EV相關smRNA-seq數據集。然后,手動審查研究設計或相關論文,根據確切的 EV 大小或類型描述用 sEV 或 IEV 標記每個數據集。用于區分特定樣本(sEV或IEV)歸屬的標準如下:
① 具有明確歸屬定義的樣本服從于原始樣本;;
② 詳細描述分離方法的樣品符合國際細胞外囊泡學會(ISEV)的標準;
③ 商業試劑盒提取的樣品按照制造商的介紹進行分類;
④ 根據“exosomes”或“microvesicles”的詞頻計數,將上述類別中的樣本定義為sEVs或leVs;不能分組的樣品被丟棄。
2、數據預處理
FastQC(v0.11.5)用于原始數據的質量控制(QC),trimmomatic(v0.36)用于適配器移除和低質量數據修整,以獲得用于進一步分析的高質量清潔讀數。 Bowtie(v1.2.1)用于將干凈讀數與人類參考基因組 GRCh38 對齊。 干凈讀數小于 500 萬或主要讀數超出 15-50 nt 范圍或對齊率小于 40% 的樣本被丟棄。 最后,從 57 項研究中獲得了 2030 個 smRNA-seq EV 數據集(1506 個 sEV 和 524 個 IEV 數據集)。
為了更好地進行薈萃分析,所有數據集都經過精心整理,分為24種人體組織、8種來源(血漿、血清、唾液、尿液、精子、母乳、原代細胞和細胞系)和40多種疾病。
3、ncRNA的讀取映射和表達估計
在讀取映射之前,從不同的權威數據庫獲得了7種ncRNAs的參考序列。然后,使用Bowtie軟件和Reads Dynamic Assignment Algorithm(RDAA)進行讀取映射。RDAA步驟如下:
① 每個樣本的干凈讀數同時映射(允許一個錯配)到七個 ncRNA 參考,并將所有 ncRNA 映射的讀數收集在一起以準備分配;
② 僅映射到一種 ncRNA 類型的 0 或 1 個錯配讀數用于計算 ncRNA 豐度;
③ 映射到一種 ncRNA 類型的 0 錯配讀數被視為置信讀數,用于計算 EV 中的 ncRNA 比例,這將被視為參考 ncRNA 豐度供以后分配;
④ 根據參考 ncRNA 豐度優先級,將具有 0 或 1 個錯配的多 ncRNA 映射讀數分配給確切的一種 ncRNA 類型;
⑤ 最終的 ncRNA 豐度由指定的 ncRNA 映射讀數決定。

4、特異性表達的 ncRNAs
為了檢測特異表達的 ncRNA,在給定條件下,ncRNA 的表達水平用其中位數表示。用 SEGtool 分別對 sEVs 和 IEVs中高表達的 ncRNAs 進行分析。
5、ncRNA 的功能注釋及其在癌癥中的表達譜
ncRNAs的功能注釋被整合到EVAtlas中,其中不同類型的ncRNAs有其不同的注釋。 從每個ncRNA類型的相應參考數據庫中提取基因定位和潛在功能等基本信息,并孵育到EVAtlas中。 例如,rRNA 的基本信息和功能是從 RNA 中心收集的。 對于 miRNA,EVAtlas 從 PubMed 收集它們的相關功能,從 FFLtool 收集 miRNA-targets 關系,從 SM2miR 收集藥物相關性,從 GSCALite 收集它們在癌癥中的表達譜。 對于snoRNA和tRNA,從SNORic和TRic收集它們的表達譜,并從snoDB和GtRNAdb收集它們的潛在靶基因。
EVAtlas數據庫使用說明
為了讓大家更好的了解EVAtlas數據庫,下邊將任務欄的功能進行一一介紹:
1、Home
在Home界面的檢索框中輸入要檢索的目標ncRNA,例如“hsa-miR-21-5p”,即可獲得關于hsa-miR-21-5p的相關的信息。

2、Samples
在Samples界面下,顯示的是在24種情況和8種來源下數據集的分類匯總。點擊進入“如Adipose(圖4)”即可獲得在某一特定條件下的數據集sEV 和 IEV 情況(圖5)。


3、RNA Expression
在RNA Expression界面下,可以通過在檢索框直接輸入目標ncRNA進行檢索。也可以通過數據庫分類對目標ncRNA進行查找。

4、Specific Expression
在Specific Expression界面,用戶可以 獲得24 種條件下 EV 中特異性表達的 ncRNA,點擊某一特定條件即可獲得相應條件下特異性表達的ncRNA。

5、Document/Contact和EVmiRNA(old version)
① 通過Document界面可以了解EVAtlas數據庫的詳細信息,包括數據的收集與整理、EV的分離技術等等。用戶還可以在Document 頁面查看數據概況及下載數據,
② 通過Contact界面可以獲得EVAtlas數據庫開發者的聯系方式。
③ 通過EVmiRNA(old version)可以鏈接到以前的舊版本。


6、目標ncRNA界面解讀
為了讓大家更好的了解EVAtlas數據庫數據庫,小編在最后對“目標ncRNA”界面的內容進行詳細的標注解讀(圖10)。以“hsa-miR-21-5p”為例:

參考資料:[1]http://bioinfo.life.hust.edu.cn/EVAtlas/#/
[2]EVAtlas: a comprehensive database for ncRNA expression in human extracellular vesicles