自從2006年全基因組關聯分析(GWAS)問世以來,已經經歷了多個世代,從單隊列時代(5000人左右)到多隊列meta分析時代(GWAS meta-analysis;1萬-10萬)和生物庫時代(如UK Biobank 50萬人)。如今,GWAS已經正式進入了全球多生物庫meta分析的新時代,人數也正式來到了百萬級別,各類Post-GWAS分析應運而生,是利用公開數據庫發表高影響因子文章的非常好的工具之一!如果說十年前Meta分析是大家追捧的對象,那么十年后必然是孟德爾隨機化(MR)的時代!
關于Post-GWAS分析的簡要介紹,已經在前期與大家分享過,今天我們來講一講可以用來對GWAS進行補充的——EWAS!即表觀基因組關聯分析,來看看表觀遺傳學變異如何聯合GWAS和MR分析關聯復雜疾??!
GWAS可以用來鑒定新的基因以及染色體區域,為復雜疾病的致病基因定位提供了強有力的手段,但是越來越多的研究表明,復雜疾病的致病原因是多樣化的,基因組遺傳信息的變異是導致復雜疾病的重要因素之一,除此之外,表觀遺傳學的變異在復雜疾病的發生發展中也起到很重要的作用。GWAS 所采用的研究策略僅僅局限于遺傳信息的變異,而無法在表觀遺傳學層面進行復雜疾病的解讀。表觀基因組關聯分析(EWAS)技術的出現彌補了 GWAS 的不足,將表觀遺傳學變異和復雜疾病進行關聯,在表觀遺傳學層面對復雜疾病的致病原因進行解讀,找到與致病原因相關的表觀遺傳學變異位點。
DNA甲基化(DNA methylation, DNAm)是最常見的表觀遺傳修飾,它調節基因的表達,具有動態的和組織特異性的特點,在調控染色質結構,基因表達調控和細胞命運決定等關鍵生物學過程中發揮著重要作用。DNA甲基化具有可塑性,對環境變化和衰老高度敏感,在調控染色質結構,基因表達和細胞周期調節起著關鍵作用,參與了人類發育、衰老、基因組印記和抑癌基因失活等多種關鍵生物學過程。
以甲基化發現為目標的多組學EWAS隊列研究的兩個方向:
EWAS可以檢測容易受環境因素影響的新的調控機制:
EWAS可以將在病例全基因組范圍內檢測出的甲基化變異位點與對照進行比較,找出所有的甲基化位點的變異頻率,從而避免了像候選基因策略一樣需要預先假設致病基因。同時,EWAS 研究也可以鑒定新的與疾病相關的甲基化位點,為復雜疾病的發病機制在表觀層面上提供了更多的線索。
EWAS利于探究對DNA序列變異和DNA甲基化之間關系:
大部分GWAS顯著關聯位點都落在基因組非編碼區。一種可能的解釋是,這些易感位點通過調節特定區域的甲基化水平,從而改變個體復雜性狀。如果某個位點既對復雜性狀有影響,又對甲基化水平有影響,那么該位點就很有可能符合上述解釋。共定位分析(Collocalization)正是試圖找出這些“共定位”位點。
傳統的GWAS是將全基因組范圍內的常見變異進行關聯分析,鑒定與表型相關的基因座,但鑒定出來的位點大多數位于基因間隔區,其如何通過基因或者通路影響表型很難被闡述,一種可能的解釋是,這些易感位點通過調節特定區域的甲基化水平,從而改變個體復雜性狀。如果某個位點既對復雜性狀有影響,又對甲基化水平有影響,那么該位點就很有可能符合上述解釋。共定位分析(Collocalization)正是試圖找出這些“共定位”位點。共定位分析方法,屬于Post-GWAS的一項重要工作,eQTL和mQTL是EWAS常用的共定位方法,旨在GWAS結果的基礎上鑒定與表型相關的eQTL和mQTL位點。SMR利用GWAS的summary數據和表達數量性狀基因座(eQTL)的數據,采用SMR和HEIDI方法,以測試基因表達水平與感興趣的復雜性狀之間的多效性關聯。
通過這種mQTL分析或者共定位分析,就能找到一些某基因甲基化水平顯著相關的SNP位點。這樣,以甲基化為中間橋梁,實現了SNP——甲基化——性狀的生物學模型。利于探究對DNA序列變異和DNA甲基化之間關系,為和調控中的分子網絡、基因變異與人類表型的潛在聯系提供了新的見解。同時,研究還揭示了多個新的調控網絡,這些發現為支持表型變異的生物學途徑提供信息基礎。同時,可以進一步行疾病易感性甲基化位點關聯分析,藥物敏感性甲基化位點關聯分析等。
公共數據庫,EWAS,GWAS和MR分析!每一個都是熱門的研究方向!這幾個學術界的“香餑餑”的會碰撞出怎么樣的火花呢?請關注下期內容吧~