Post-GWAS時代藥靶蛋白孟德爾隨機——兩次登頂Nature為新藥上市“保駕護航”
前期已經給大家介紹了全基因組關聯(lián)性分析(GWAS),孟德爾隨機化分析(MR),沒想到2023年才過去一個月,MR分析就已經兩次登頂Nature!

18 January 2023, https://doi.org/10.1038/s41586-022-05420-7

18 January 2023, https://doi.org/10.1038/s41586-022-05473-8
作為一個GWAS研究資深愛好者,本著大力出奇跡的原則,小編詳盡的研究了近期的高分文章,畢竟一個可以通過挖掘數(shù)據(jù)就能蹭上的大熱點,誰能不愛!終于,小編從中歸納總結出了“高分秘籍”,迫不及待地和大家分享~
另外,作為Post-GWAS的一項重要工作,共定位分析的詳細介紹,收錄在今天的第三篇推文,感興趣的小伙伴可以去一探究竟。
今天分享的文章,于2023/1 發(fā)表在Society of Biological Psychiatry(IF 12.8/Q1),題目為“循環(huán)蛋白影響精神疾病:孟德爾隨機化研究(Circulating Proteins Influencing Psychiatric Disease: A Mendelian Randomization Study )”。
藥靶標孟德爾聯(lián)合共定位分析
立即掃碼上車

大多數(shù)藥物會通過改變人體內蛋白質的水平來調節(jié)疾病性狀,蛋白質是其直接靶點。因此,構建蛋白質和人類疾病之間的因果關系,是藥物研發(fā)的核心問題之一。隨機對照試驗是構建藥物(蛋白質靶點)和疾病之間關系的黃金法則。但是其成本昂貴,耗時費力,然而,藥物研發(fā)的成功率卻不斷下降,超過50%的藥物沒有藥效,25%的藥物副作用過大;然而這些藥物卻都已經投入了昂貴的第三和第四期的隨機對照試驗。因此,有效的早期藥物靶點的篩選系統(tǒng)對降低藥物研發(fā)成本非常重要。
MR的核心是運用遺傳學數(shù)據(jù)作為橋梁,來探索暴露和結局之間的因果關系,一直被稱為“大自然創(chuàng)造的隨機雙盲試驗”。通過MR分析,可以很好的預測藥物隨機對照試驗的結果,進行藥物靶點的早期系統(tǒng)性篩選。并且,有孟德爾隨機化篩查證據(jù)支持的藥物靶點,其最終轉化為上市藥物的成功率有非常顯著的提高。
今天分享的文章中,作者利用已有的大規(guī)模蛋白質組學研究和GWAS薈萃數(shù)據(jù),揭示了10種復雜精神疾病中的7種可能的蛋白質與疾病的關聯(lián)。作者確定了可能影響幾種疾病(如TIMP4和ESAM)風險的強候選靶點。此外,作者發(fā)現(xiàn)ERLEC1對精神分裂癥的潛在因果效應可能是通過選擇性剪接獲得的。這些發(fā)現(xiàn)將促進對循環(huán)蛋白在精神疾病中的作用的探索,并指導疾病相關生物標志物的鑒定和新型藥物的開發(fā)。
以下是原文~
一、背景
據(jù)估計,精神疾病者占全球殘疾疾病負擔的7%。目前對大多數(shù)精神疾病的治療是有限的,因此,迫切需要新的治療方式。循環(huán)蛋白可以在外周血中獲取并測量,提供了治療的早期參考,可能是影響這些疾病的風險的因素和有利的干預靶點。
關于精神疾病循環(huán)蛋白的隨機對照試驗難以實施,而觀察性研究可能存在偏差和反向因果關系。通過孟德爾隨機化分析(MR)研究精神疾病中的循環(huán)蛋白作用,可以減少由于混淆和反向因果關系造成的偏倚。
最近在基于大樣本的與循環(huán)蛋白水平相關的遺傳變異,即蛋白質數(shù)量性狀位點(pQTLs)的研究,為識別與疾病結果有因果關系的靶蛋白提供了機會。MR已被用于評估循環(huán)生物標志物對一系列復雜疾病的因果影響,包括冠狀動脈疾病、缺血性中風和COVID-19結局等。
在這項研究中,作者使用了6項大規(guī)模的蛋白質組學研究和針對10種精神疾病的最大的全基因組關聯(lián)研究生物精神病學(GWASs)進行了兩個樣本MR,以確定影響這些精神疾病風險的循環(huán)蛋白。然后,通過系統(tǒng)篩選水平多向效應,進行共定位分析,并通過蛋白質改變變體檢查其他因果途徑,驗證了MR假設。研究結果強調了循環(huán)蛋白質可能在精神疾病風險中起因果作用。
二、方法
蛋白組學研究數(shù)據(jù)
來自6項大規(guī)模評估了循環(huán)蛋白水平與遺傳變異之間的關系全基因組蛋白質組學研究的GWAS薈萃分析數(shù)據(jù)。
精神疾病數(shù)據(jù)
來自精神基因組學聯(lián)盟(PGC)進行的大規(guī)模GWASs薈萃分析數(shù)據(jù)。確定了與10種復雜精神疾病的遺傳關聯(lián):注意力缺陷/多動障礙,神經性厭食癥,焦慮癥,自閉癥譜系障礙,雙相情感障礙,重度抑郁癥,強迫癥,創(chuàng)傷后應激障礙,精神分裂癥,圖雷特綜合征。
雙樣本的MR分析
1.雙樣本MR以分析蛋白質組學研究中所有循環(huán)蛋白對這10種精神疾病的潛在因果影響。在所分析的蛋白質的cis-pQTL (s)中鑒定了遺傳變異或其連鎖不平衡(LD)代理作為工具變量(IVs)。這些工具變量是位于相應蛋白質編碼基因轉錄起始位點1 Mb內的遺傳變異,并與測量的蛋白質水平表現(xiàn)出全基因組顯著相關性(p< 5*10-8)。
2.對于每種蛋白質,F(xiàn)HS和IMPROVE、AGES和KORA F4研究提供了1個在所有相關單核苷酸多態(tài)性(SNPs)中p值最先導cis-pQTL。同一蛋白質的cis-pQTL可能不同,或者可能具有不一致的關聯(lián)量。因此,作者在每個蛋白質組學研究中分別對每個SOMAmer/抗體結合蛋白進行MR,并對結果進行比較。對于精神疾病的每一種GWAS,當匯總統(tǒng)計中不存在先導cis-pQTL時,用LD( r 2 > 0.8)找到它的代理。
3.使用Two Sample MR R包進行了MR分析。每種蛋白質對每種精神疾病的潛在因果影響通過Wald比值檢驗和逆方差加權比值檢驗進行評估,對p值進行了Benjamini-Hochberg校正。對于至少有3種工具變量的蛋白質,使用加權中位數(shù)、懲罰加權中位數(shù)和加權模式方法進行敏感性分析。F統(tǒng)計量來評估MR結果是否存在弱工具變量,并采用MR Steiger法來評估結果是否存在反向因果關系
MR假設的驗證
評估MR是否滿足以下3個主要假設:1)工具變量應與暴露相關,即循環(huán)蛋白水平,據(jù)此,使用F統(tǒng)計量排除若工具變量;2)工具變量應僅通過其對循環(huán)蛋白水平的效應作用于結果,即精神疾病(無水平多效性)。據(jù)此,作者檢查了目標蛋白所選擇的cis-pQTL (s)是否同時是另一種疾病風險影響基因的順式或反式pQTL、剪接QTL(sQTL)或表達QTL(eQTL),還搜索了PhenoScanner數(shù)據(jù)庫中記錄的顯著SNP -性狀關聯(lián)以排除水平多效性;3)工具變量不與是與暴露-結果關聯(lián)的任何混雜因素相關。據(jù)此,作者研究了與cis-pQTL顯著相關的特征是否與相應的精神障礙已知相關。此外,使用至少3種工具變量對蛋白質進行MR-Egger回歸。
共定位分析
1.使用PWCoCo包進行了共定位分析,以評估與蛋白質水平和疾病結局的遺傳關聯(lián)是否由相同的SNP驅動,即在同一位點上的SNP可以通過單獨的生物學機制影響蛋白質和結果,并且通過LD相互聯(lián)系。
2.在具有顯著性的蛋白質與疾病的關聯(lián)中,將蛋白質分為3個目標組(圖1)。一級靶標蛋白:后驗概率PPH4>0.80,且不受任何已知水平多效性影響的具有強烈共定位證據(jù)的蛋白質。三級靶標蛋白:有證據(jù)表明不存在共定位或受潛在水平多效性影響的蛋白質。二級靶標蛋白:其余的蛋白質,包括那些沒有評估共定位或水平多效性的蛋白質。

圖1
SOMAmer/抗體結合效應的評估
由于SOMAmer或抗體在不同的蛋白質組學研究中可能針對不同的肽序列或蛋白質異構體,作者研究了這種潛在的SOMAmer/抗體結合效應。對于每個研究特異性的cis-pQTL,作者檢查了它是否也是變異的蛋白質變體(無義變體、錯義變體、外顯子跳過替代剪接變體等)或與變異的蛋白質變體具有高度的連鎖不平衡效應(r 2>0.8),并在不同的蛋白質組學研究中比較MR推斷的蛋白質與疾病的相關性。cis- pQTL (s)與同一基因轉錄本的選擇性剪接之間的顯著關聯(lián)可能指向剪接變異所賦予的因果效應。對于這些靶標,作者分別利用GTEx數(shù)據(jù)庫中確定的先導全血cis-eQTLs和先導全血cis-sQTLs重復了MR和共定位分析,因為信使RNA (mRNA)豐度的測量對肽序列的變化不敏感。
三、結果
1.估計循環(huán)蛋白水平對精神疾病的潛在因果影響
MR分析確定了9種蛋白質與疾病的關聯(lián),且有強烈的共定位證據(jù),不太可能受到水平多效性的影響(圖2);
確定了58個二級靶標和40個三級靶標,這些靶點需要額外的證據(jù)來驗證(圖1);
通過基于抗體的蛋白質圖譜在所有10個大腦區(qū)域檢測到所有一級靶標蛋白質,但DrugBank中沒有記錄到針對這些蛋白質的藥物或開發(fā)藥物的計劃,盡管已知與相應的疾病結局相關。

圖2
2.一級靶標蛋白質和SOMAmer/抗體結合效應的評估
在一級靶標蛋白中,循環(huán)TIMP4和ESAM在3項蛋白質組學研究中復制了關聯(lián)(圖2),共定位分析證實了在每種蛋白質-疾病關系中存在單一共享因果(圖3)。
循環(huán)ESAM也在與TIMP4相同的3個蛋白質組學研究中被描述。基因預測的循環(huán)ESAM水平每增加1個SD與精神分裂癥的估計相關性在INTERVAL和AGES研究之間是一致的(圖2),并顯示了共定位的有力證據(jù)(圖3)。然而,基于Fenland研究的MR得出了一個顯著減弱的效應量(圖2)。
FOLH1與雙相情感障礙、OLA1與雙相情感障礙、TMEM106B與重度抑郁癥、NPTXR與精神分裂癥之間的關聯(lián)可以在兩項蛋白質組學研究中得到復制(圖2)。
FOLH1 cis-pQTL周圍的遺傳結構很復雜(圖3),因為只有在PWCoCo進行條件和聯(lián)合分析后,F(xiàn)OLH1共定位的證據(jù)才很強。
DNPH1與雙相情感障礙和ACADVL與精神分裂癥之間的關系在Fenland研究中被確定(圖2),并得到了強有力的共定位證據(jù)的支持(圖3),但這2種循環(huán)蛋白在其他蛋白質組學研究中沒有被描述。

圖3
3.ERLEC1蛋白異構體的潛在因果效應
循環(huán)的ERLEC1僅在INTERVAL研究中被描述,是精神分裂癥的第2級靶標蛋白,被認為不太可能受到水平多效性的影響(圖4A)。
利用ERLEC1基因的先導cis eQTL工具變量(rs143112696),作者發(fā)現(xiàn)ERLEC1的總體mRNA豐度與精神分裂癥風險無關(圖4A),沒有證據(jù)表明ERLEC1 mRNA豐度和精神分裂癥存在共定位(圖4B)。相比之下,利用先導cis- sQTL工具變量(rs62137566),選擇性剪接的比例與疾病結果顯著相關(圖4A),這種cis- sQTL與精神分裂癥的遺傳關聯(lián)存在共定位證據(jù)(圖4C),降低ERLEC1- 201與ERLEC1-202的比例可能對精神分裂癥具有保護作用(圖4D)。

圖4
四、討論
在本研究中,作者進行了MR研究,系統(tǒng)地篩選可能在此類疾病病因學中發(fā)揮作用的循環(huán)蛋白,從而為治療開發(fā)提供了潛在可干預的靶點。作者確定了9種蛋白質與疾病的關聯(lián),涉及8種不太可能受到混雜效應或水平多效性影響的循環(huán)蛋白質。兩種循環(huán)蛋白,TIMP4和ESAM,在3項蛋白質組學研究中被復制。
TIMP4和其他TIMP蛋白是基質金屬蛋白酶抑制劑的重要抑制劑,后者負責維持突觸功能和血腦屏障的通暢。基質金屬蛋白酶抑制劑過表達或TIMP蛋白不足已廣泛涉及各種復雜疾病,包括神經精神障礙。正如預期的那樣,作者的結果提供了強有力的證據(jù),表明增加循環(huán)TIMP4可以預防神經性厭食癥、躁郁癥和重度抑郁癥,并提示它可以預防精神分裂癥。這些結果支持TIMP4和其他基質金屬蛋白酶抑制劑作為治療開發(fā)的候選藥物。
內皮細胞粘附分子ESAM促進血腦屏障的通透性,介導中性粒細胞外滲,并在內皮緊密連接和血小板上特異性表達。有人提出ESAM相關的早期免疫反應異常參與了精神分裂癥的發(fā)病機制。作者發(fā)現(xiàn)循環(huán)ESAM水平的降低與精神分裂癥風險的降低有關。然而,它已經在小鼠中被證明了,只有內皮緊密連接處的ESAM而不是血小板上的ESAM與中性粒細胞外滲有關。因此,有必要確定循環(huán)中ESAM水平的降低是否代表內皮緊密連接處功能ESAM數(shù)量的減少或增加,因為后者可能導致更有效的藥物靶點。
內質網(wǎng)凝集素ERLEC1通過選擇性結合不正確折疊的腔蛋白參與內質網(wǎng)質量控制,并參與轉移細胞對缺氧和內質網(wǎng)應激的反應。作者發(fā)現(xiàn)降低ERLEC1-201與erlec1 -202的比例可以預防精神分裂癥,而改變總體mRNA豐度似乎與疾病風險無關。雖然這兩種剪接變體在大小和構象上有所不同,但基于Ensembl數(shù)據(jù)庫,預測的甘露糖6-磷酸受體結構域和預測的蛋白質OS9樣結構域可以在ERLEC1-202中被截斷。考慮到ERLEC1的共定位證據(jù)弱于一級靶標蛋白,需要更多的研究來闡明這些剪接變異在精神分裂癥發(fā)病機制中的作用,并探索干預方案。
腦靶向藥物的另一個主要挑戰(zhàn)是有效地穿過血腦屏障。在這里,TIMP4和ESAM都在血腦屏障中起著至關重要的調節(jié)作用,ERLEC1的年齡依賴差異基因表達也與血腦屏障有關。綜上所述,這些循環(huán)蛋白可能指向有希望的藥物靶點或作為預測性生物標志物。
思路借鑒
1.本篇文章是MR分析+pQTL共定位為核心,以pQTL發(fā)現(xiàn)為目標的多組學臨床隊列研究的主要有以下四個方向,通過挖掘公共數(shù)據(jù)庫以及借鑒已經發(fā)表的研究的數(shù)據(jù),就可以輕松借鑒啦!
發(fā)現(xiàn)疾病的致病機制;
骨質疏松癥和類風濕關節(jié)炎的復雜遺傳結構:發(fā)現(xiàn)因果效應的途徑。文章于2022/5 發(fā)表在Human Molecular Genetics(IF 5.1 /Q2)上。類風濕關節(jié)炎(RA)和骨質疏松癥(OP)是兩種復雜炎性疾病,但可能具有共同的遺傳背景,作者旨在闡明RA和各種OP表型背后的遺傳結構,GWAS統(tǒng)計數(shù)據(jù),使用MR分析來檢測因果關系,共定位分析以確定CRP和OP表型之間共享的遺傳變異。共定位在CRP和OP之間建立了共享的基因組區(qū)域,包括GCKR和SERPINA1基因。富集分析發(fā)現(xiàn)這些基因具有相同分子功能,進一步的研究兩者的共享分子途徑,并為潛在治療方法的提供見解。

https://doi.org/10.1093/hmg/ddac061
發(fā)現(xiàn)新的藥物靶點;
1.可用于藥物治療的全基因組孟德爾隨機化確定了新冠肺炎的新機會,于2021年發(fā)表在Nature Medicine (IF 87.2 /Q1)。為了確定與COVID-19相關的治療靶點,作者進行了MR分析,利用公共數(shù)據(jù)庫數(shù)據(jù),基于已批準或藥物開發(fā)臨床階段藥靶蛋白的轉錄組學和蛋白質組學數(shù)據(jù),以順式eQTL和QTL作為工具變量,聯(lián)合共定位分析,發(fā)現(xiàn)與COVID-19住院共定位的藥靶蛋白IL10RB和IFNAR2。全現(xiàn)象關聯(lián)掃描(PWAS)和通路富集分析,進一步提示IFNAR2更有可能在COVID-19住院治療中發(fā)揮作用。以IFNAR2和ACE2作為優(yōu)先蛋白,進行藥物試驗,可能可以用于COVID-19的早期管理。

發(fā)現(xiàn)藥物的新治療適應癥;
1.血管緊張素轉換酶對阿爾茨海默病而不是其他神經退行性疾病的保護作用的遺傳證據(jù),于 2022/8發(fā)表于Neurol Genet。血管緊張素轉換酶(ACE)抑制劑是一種常用的處方藥,用于治療心力衰竭,高血壓和慢性腎臟疾病。然而,遺傳證據(jù)支持大腦ACE對阿爾茨海默病(AD)的保護作用。作者進行了MR聯(lián)合共定位分析,分析ACE表達對歐洲血統(tǒng)人群AD風險的影響以及其是否是通過血壓變化介導。結果提示遺傳證據(jù)支持大腦ACE表達對AD的保護作用,但不支持歐洲血統(tǒng)人群的其他神經退行性結果。

Neurol Genet 2022;8:e200014. doi:10.1212/NXG.0000000000200014
識別臨床相關的生物標志物。
1.整合基因組策略確定sRAGE是肺功能的因果性和保護性生物標志物,于2022年發(fā)表在Chest(IF 11.3/Q1),作者將sRAGE pQTL變異與肺部特征的GWAS變異進行整合。將sRAGE pQTL變異體與肺特征GWAS變異體進行共定位,并使用sRAGE順式-pQTL變異體進行孟德爾隨機化,旨在分析sRAGE作為肺功能的因果性和保護性蛋白質生物標志物的效能。結果提示sRAGE對肺生理功能具有保護作用,AGER/sRAGE靶向干預軸可能對炎癥相關肺部疾病的治療和預防有益。

https://doi.org/10.1016/j.chest.2021.06.053
除了MR分析+共定位這個核心思路以外,Post-GWAS還可以整合轉錄組、表觀遺傳等多組學數(shù)據(jù)對相關位點進行注釋,篩選潛在功能位點并對候選位點做進一步的功能注釋。如甲基化、組蛋白修飾、染色質開放程度等信息;預測遺傳變異是否影響轉錄因子結合等;還可以加做體內外實驗闡明風險位點的致病機制。如熒光素酶報告基因實驗、ChIP-seq、染色體構象捕獲技術、基因敲除等;此外,還可以聯(lián)合自測數(shù)據(jù),結合臨床研究,影像學數(shù)據(jù)等。
總之,Post-GWAS絕對是數(shù)據(jù)挖掘愛好者的福音!小編非常看好MR聯(lián)合共定位的思路,還苦于沒有科研思路的小伙伴,請聯(lián)系我們,一起捕獲這顆“新秀”吧~
藥靶標孟德爾聯(lián)合共定位分析
立即掃碼上車
