今天小編為大家?guī)硪黄衲臧嗽路莅l(fā)表在Nature genetics[IF :38.333]上的一篇關(guān)于映射基因型結(jié)構(gòu)到細(xì)胞類型的文章,利用GWAS研究疾病潛在機(jī)制和治療方法,闡明常用的降壓和腎保護(hù)藥物的作用機(jī)制,確定了腎臟疾病的藥物重置。
Mapping the genetic architecture of human traits to cell types in the kidney identifies mechanisms of disease and potential treatments

背景介紹
慢性腎病影響著全世界超過8億人。全世界范圍內(nèi),每60個(gè)人中就有一人死于腎臟疾病,因此迫切需要新的治療方法。在人類致病基因證據(jù)的支持下,正在研發(fā)的藥物靶點(diǎn)獲得批準(zhǔn)的可能性是其他藥物的兩倍,這凸顯了了解疾病遺傳學(xué)的重要性。
名詞解釋
- eQTL(expression Quantitative Trait Loci):表達(dá)數(shù)量性狀位點(diǎn)
- GWAS(genome-wide association studies):全基因組關(guān)聯(lián)研究
- LD( linkage disequilibrium):連鎖不平衡
- eGFR(estimated glomerular filtration rate):估算腎小球?yàn)V過率
- PT(proximal tubule):近端小管
- eQTL(cf):eQTL cell fraction
- eQTL(ci):‘cell-typeinteracting’ eQTLs
數(shù)據(jù)和方法
eQTL data:http://susztaklab.com/eQTLci/index.php
Figshare:https://doi.org/10.6084/m9.figshare.14718015.v1
RNA-seq and human kidney snATAC-seq data:GSE173343;GSE115098;GSE172008
http://susztaklab.com/HumanKidneysnATAC/
http://susztaklab.com/human_kidney/igv/
代碼:https://github.com/shengxin321/HumanKidney_eQTL_and_snATAC-seq
內(nèi)容和結(jié)果
一、顯微解剖人腎樣本的細(xì)胞組分eQTL
- 收集303個(gè)微量解剖的人腎小球和359個(gè)小管樣本的基因型和RNA-seq數(shù)據(jù)。利用CIBERSORTx反褶積估計(jì)細(xì)胞組分,然后使用體積和細(xì)胞分?jǐn)?shù)調(diào)整模型鑒定eQTL。最初的cis-eQTL分析分別在腎小管和腎小球樣本中鑒定了3599和5871個(gè)eGene(Fig.1a)。
- 接下來分析了359個(gè)近小管標(biāo)本中各類細(xì)胞的占比和303個(gè)腎小球標(biāo)本中各類細(xì)胞的分布。不出意料,近端小管(PT)細(xì)胞和腎小球內(nèi)皮細(xì)胞分別是兩類組織中最常見的細(xì)胞類型(Fig.1bFig.1c)。
- 最終的eQTL細(xì)胞分?jǐn)?shù)模型包括通過表達(dá)殘差因子的概率(PEER)估計(jì)來估計(jì)潛在變量調(diào)整。該分析在小管和腎小球樣本中分別鑒定了9,209和10,106個(gè)eGenes(Fig.1d,e)。
- 另外,觀察到在625個(gè)(功能編碼缺失)腎病基因中,有303個(gè)被鑒定為eGenes。
- GO分析表明,eGenes富集在代謝過程中。在eQTL研究中,對已發(fā)表的GTEx數(shù)據(jù)中的48個(gè)組織進(jìn)行的meta分析顯示,有大量共有的eGenes 39,但也有1309個(gè)小管特異性和1458個(gè)腎小球特異eGene(Fig.1fg)。

Fig.1 Cell-fraction-adjusted eQTLs of human kidney samples 二、定義細(xì)胞類型依賴的eQTLs
- 為了識別以細(xì)胞類型依賴的方式調(diào)控基因表達(dá)的細(xì)胞類型相互作用的eQTL,作者進(jìn)行了線性回歸分析,模擬了細(xì)胞組分和基因型之間的相互作用(Fig.2a)。例如,G等位基因劑量較高的個(gè)體的腎臟(SNP rs4968146)顯示,PT細(xì)胞組分與ABR表達(dá)呈負(fù)相關(guān),表明細(xì)胞類型依賴于基因類型-基因表達(dá)相互作用(Fig.2b)。
- 為了確定rs4968146重疊基因組區(qū)域(補(bǔ)充表9)在調(diào)節(jié)ABR表達(dá)中的作用,我們在培養(yǎng)的人類胚胎腎細(xì)胞(HEK293)中進(jìn)行了基于CRISPR的基因組編輯。該區(qū)域缺失后ABR表達(dá)明顯降低(Fig.2c)。
- 總之,在23種腎細(xì)胞類型中,通過評估基因型和細(xì)胞分?jǐn)?shù)相互作用的重要性,我們分別在腎小管和腎小球樣本中鑒定了1613和713個(gè)蛋白編碼的eQTL(ci)基因(Fig.2d)。
- 最后,為了描述eQTL(ci)的細(xì)胞類型特異性,作者使用多變量自適應(yīng)收縮方法檢測了腎臟細(xì)胞類型間的eQTL(ci)共享(Fig.2e)。
Fig.2 Cell-type-dependent activities of genetic variants on gene expression 三、人類腎臟的單細(xì)胞分辨率調(diào)節(jié)圖
- 為了在細(xì)胞分辨率上表征基因調(diào)控區(qū),我們利用高通量測序(snATAC-seq)信息對人類腎細(xì)胞轉(zhuǎn)座酶可及染色質(zhì)進(jìn)行了單核分析(Fig.3a)。
- 通過比較每個(gè)簇中啟動子區(qū)域的讀取密度,作者根據(jù)先前確定的細(xì)胞類型標(biāo)記將簇與已知的細(xì)胞類型相匹配(Fig.3bc)。
- 接下來,通過比較簇間的開放染色質(zhì)區(qū)域生成染色質(zhì)差異可及區(qū)域(DAR)列表,確定60661個(gè)細(xì)胞類型特異性峰(Fig.3d)。
- 估計(jì)相關(guān)細(xì)胞類型特異性開放染色質(zhì)區(qū)域中eQTL(ci)變異的富集(Fig.3e)。
Fig.3 Single-cell resolution regulatory maps for the human kidney 四、內(nèi)表型來源于相同的細(xì)胞類型
為了優(yōu)先考慮特定腎臟特征和疾病(如eGFR和高血壓)的潛在驅(qū)動細(xì)胞類型,首先根據(jù)scRNA-seq數(shù)據(jù)對每種細(xì)胞類型中每個(gè)基因的表達(dá)特異性進(jìn)行排序。
- 從每十分位基因的GWAS匯總統(tǒng)計(jì)數(shù)據(jù)中評估了分割遺傳力富集。隨著PT細(xì)胞基因表達(dá)特異性的增加,eGFR SNP遺傳力的增加(Fig.4a)。收縮壓(SBP)與遠(yuǎn)端曲小管(Fig.4b)、集合管主細(xì)胞和內(nèi)皮細(xì)胞(Fig.4c)之間也存在類似的正相關(guān)關(guān)系。
- 接下來,進(jìn)行基因組注釋多標(biāo)記分析(MAGMA)中實(shí)施的廣義基因集富集分析,以評估與腎臟相關(guān)表型的基因水平遺傳關(guān)聯(lián)是否隨著細(xì)胞類型特異性的增加而增加。作者分析了24種不同的GWAS性狀(Fig.4d)。
Fig.4 Single-cell annotation highlights cell type convergence of kidney endophenotypes 五、了解腎功能和血壓
- 對可能導(dǎo)致特定腎內(nèi)表型變異的基因進(jìn)行了優(yōu)先排序。利用貝葉斯共定位測試整合6個(gè)腎臟相關(guān)性狀和腎臟顯微解剖室eQTL(cf)數(shù)據(jù),作者在腎小管中鑒定了240個(gè)共定位蛋白編碼基因,在腎小球室中鑒定了230個(gè)基因。Fig.5a說明了eGFR和SBP優(yōu)先基因在整個(gè)基因組的腎小球和腎小管間隔中的分布。
- 使用6個(gè)腎臟相關(guān)性狀的GWAS匯總數(shù)據(jù)和eQTL(ci)數(shù)據(jù)重復(fù)進(jìn)行貝葉斯共定位分析。作者優(yōu)先考慮了61個(gè)可能的因果蛋白編碼基因,其中6個(gè)腎內(nèi)表型和細(xì)胞類型特異性基因調(diào)控的變異。通過GWAS的氣泡圖分析eGFR(上)和SBP(下)共定位的11個(gè)優(yōu)先細(xì)胞類型特異性eQTL(ci)基因(Fig.5b)。

Fig.5 Comprehensive gene prioritization provides new mechanistic insights into kidney function and blood pressure regulation 六、CKD和高血壓的治療見解
- 最近SBP GWAS在17號染色體rs4292上發(fā)現(xiàn)了一個(gè)遺傳信號。eQTL分析表明,在小管樣本中,同樣的SNP與ACE表達(dá)顯著相關(guān)。
- 對腎區(qū)室和46個(gè)GTEx組織中這種eQTL關(guān)聯(lián)的meta分析表明,rs4292對腎小管區(qū)室中的ACE(M=1)具有最顯著的eQTL效應(yīng)。此外,該信號與PT eQTL(ci)共定位,具有較高的可信度(Fig.6a)。
- 單細(xì)胞開放染色質(zhì)可及性分析突出了PT細(xì)胞ACE周圍rs4292開放染色質(zhì)區(qū)域之間的強(qiáng)相關(guān)性(Fig.6b)。
- 此外,使用基于缺口k-mer支持向量機(jī)的方法,計(jì)算量化這種變體可能的因果調(diào)節(jié)效應(yīng)。發(fā)現(xiàn)轉(zhuǎn)錄因子結(jié)合活性顯著高于T等位基因(Fig.6c)。
- 通過考慮ACE和AGE,作者識別了200多個(gè)腎臟功能和高血壓基因。這些基因的發(fā)現(xiàn)可以幫助識別潛在的藥物(Fig.6def)。
- 利用藥物基因相互作用數(shù)據(jù)庫,作者確定了54個(gè)基因,這些基因可以被已經(jīng)批準(zhǔn)的藥物靶向。

Fig.6 Multi-omic integrative annotation highlights the therapeutic targets for CKD and hypertension 結(jié)論和展望
在這項(xiàng)研究中,作者生成了一個(gè)全面的多組學(xué)數(shù)據(jù)集,并使用正交分析方法來注釋腎臟相關(guān)的表型。優(yōu)先考慮了182多個(gè)與腎功能有關(guān)的致病基因和88個(gè)與高血壓有關(guān)的致病基因,確定了腎臟中這些疾病的核心基因。功能注釋表明代謝在腎臟疾病和高血壓血管生成中可能的作用。最后,分析闡明了最常用的抗高血壓和腎臟保護(hù)藥物作用的關(guān)鍵基因基礎(chǔ),并強(qiáng)調(diào)了大量可能對高血壓和CKD有效的其他藥物。