張曉艷課題組建立病毒突變、整合及順式效應數據庫ViMIC——用于病毒介導的發病機制研究
2021年9月,同濟大學生命科學與技術院張曉艷課題組在Nucleic Acids Research(中科院JCR分區1區,IF=16.971)雜志上發表文章ViMIC: a database of human disease-related virus mutations, integration sites and cis-effects,建立了病毒突變、整合及順式效應數據庫ViMIC(http://bmtongji.cn/ViMIC/index.php)。

病毒的發病機制十分復雜,涉及與宿主相互作用的多個方面。研究表明,病毒可以通過將其基因組整合到人類染色體中來發揮順式效應。病毒區域或基因突變也可能增加疾病進展和耐藥性的風險。此外,某些病毒突變可能通過增加或減少病毒DNA整合到宿主細胞的發生率,在促進疾病發生方面發揮重要作用。目前,PubMed上有數百萬篇與病毒相關的研究,也已有相關的數據庫收集相關信息,如病毒整合站點數據庫VISDB、Dr.VIS、RID和ISDB,然而現有的數據庫沒有包含對公共資源中病毒突變和病毒整合位點進行綜合、標準化和功能上的注釋。因此,如何快速瀏覽、可視化和利用已有的知識來研究病毒與宿主之間的相互作用,是研究人員面臨的挑戰。
目前為止,ViMIC數據庫從Pubmed、Cistrome data Browser、VISDB、NCBI Nucleotide和GEO數據庫收集了涵蓋了77種人類疾病的8種病毒(HBV,HPV,EBV,AAV2,MCV,HTLV1,HIV,XMRV)信息,包括31,712個病毒突變條目、105,624個整合位點、16,310個病毒靶基因和1,110,015條病毒序列信息。同時,ViMIC可通過組蛋白修飾、轉錄因子結合與病毒整合位點上的染色質可及性來探索病毒-宿主相互作用的順式效應,共包括了78個組蛋白修飾和1,358個轉錄調控因子的結合位點(表1)。
表 1

ViMIC包含三個主要模塊:病毒突變位點模塊(virus mutation site)、病毒整合位點模塊(viral integration site)和靶基因模塊(target gene)。病毒突變位點模塊包括突變位點注釋和序列信息統計。對每一個病毒突變位點,ViMIC提供了突變水平、病毒基因/蛋白/區域、病毒相關疾病、基因型/亞型、是否免疫逃逸/耐藥、文獻支持證據等注釋信息。病毒整合位點模塊對病毒整合片段-Cistrome因子的重疊數進行了計算,用于探索病毒整合位點是否參與宿主基因組的一個功能區域。對于每個病毒整合片段,如果與Cistrome因子存在重疊(重疊總和>0),ViMIC將給出詳細的結果,包括重疊數和每個Cistrome樣本相應的GSMID、細胞系、細胞類型、組織類型和因子名稱的注釋。ViMIC使用熱圖和直方圖統計了人類染色體上所有的病毒整合位點和Cistrome因子的重疊情況。靶基因模塊提供了病毒插入或受病毒基因/蛋白質/區域影響的靶基因信息,包括基因名、全名、別名、轉錄本、基因類型、基因位置信息、基因功能、基因id和相關藥物等信息。對于每個基因,ViMIC收集了部分病毒相關疾病患者的基因表達數據,可查看其表達與免疫細胞浸潤的關系。圖1為ViMIC數據庫的示意圖概述。

圖 1
在病毒突變界面首頁,用戶通過選擇任何感興趣的病毒突變數,可查看該病毒目前報道的所有致病突變,進一步選擇病毒基因或者疾病,可以查看該病毒基因或疾病相關的突變。
以HBV為例,用戶可在病毒突變概覽頁面中單擊帶有HBV VM編號的綠色按鈕,如圖2A所示。ViMIC將返回一個包含人工校對的HBV突變位點信息的表格。用戶可按基因/蛋白質/區域或疾病篩選突變,并在表格右上角的搜索框中輸入關鍵詞,點擊View按鈕查看搜索到的突變詳細信息。
此外,用戶可以單擊Sequence按鈕瀏覽來自全球不同地區的HBV基因組序列的統計數據。病毒突變模塊將幫助用戶獲得HBV相關的進展,并快速查找感興趣的突變。
在病毒整合界面首頁,假設用戶希望獲得一個VIS條目的詳細因素列表,用戶可按照圖2B中的步驟進行操作。
以HBV第5號染色體的1000606條目為例,用戶點擊chr5并搜索1000606條目后,ViMIC將顯示該VIS與三類Cistrome因子的重疊結果。通過單擊TFBS(轉錄因子結合位點)列中帶有數字的綠色按鈕并過濾生物來源,ViMIC顯示了與該VIS重疊的16個轉錄調節因子的排名。然后,用戶可通過點擊轉錄因子MYC的View按鈕查看Cistrome樣本,可發現三個樣本在5號染色體的位置(坐標:1295020,hg38)顯示了1000606和MYC之間的重疊。如果用戶想觀察VIS 1000606中是否存在突變,可點擊View VIS-VM association按鈕,在Mutation和Sequence面板中快速搜索DVID獲取關聯信息。
此外,用戶還可以在HBV的整合菜單中選擇chr5來查看5號染色體上三個因子和病毒整合片段的重疊分布。也可選擇因子瀏覽菜單來查看HBV VIS和MYC之間的所有重疊條目(圖2B)。由于TERT是VIS 1000606的靶基因,在病毒靶基因頁面,ViMIC還提供了基于CIBERSORT的TERT基因表達與22種免疫細胞之間的免疫分析。TERT的詳細信息頁面顯示了HBV感染疾病的熱圖和相關分析結果以及TERT基因的詳細信息,TERT基因表達分析結果進一步顯示與HBV+樣本中CD8+T細胞呈正相關趨勢(圖2C)。

圖 2
ViMIC是一個綜合的人類疾病相關病毒的資源。該數據庫界面簡潔友好,允許用戶快速查詢病毒突變、VIS-Cistrome相互作用、病毒序列、病毒感染性疾病中VIS-VM相關性及免疫細胞浸潤水平與受整合事件或病毒基因/區域/蛋白影響的基因表達的相關性,有助于病毒致病機制的探索。
同濟大學生命科學與技術院張曉艷教授為該論文通訊作者,上海東方肝膽外科醫院實驗診斷科王穎博士、同濟大學生命科學與技術院博士童袁桃、張澤宇為共同第一作者。
原文鏈接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab779/6368050