基于ATAC-seq和RNA-seq預測子宮內膜非典型增生和子宮內膜樣癌患者黃體酮不敏感的潛在模型
子宮內膜樣癌(EEC)是婦科最常見的惡性腫瘤之一,每年新發癌癥病例和死亡人數呈上升趨勢。值得注意的是,EEC及其癌前病變,子宮內膜不典型增生(EAH)呈現出年輕化的趨勢,大約一半的年輕EEC和EAH患者在確診時是未分娩的。因此,保留生育能力的治療在臨床研究中受到越來越多的關注。目前,大劑量孕激素治療是主要的保守治療策略,達到約70%-80%的完全緩解(CR)率。然而,仍有大約20%-30%的病例對孕激素不敏感。
目前尚缺乏預測EAH或EEC患者孕激素敏感性的客觀指標。研究表明,孕激素受體(PR)在EAH和EEC組織中的陽性表達與保留生育治療的CR時間較短有關。能用于預測EAH和EEC病例孕激素反應的分子標志物的高質量證據較少。因此,仍然需要進一步的研究來探索預測EAH和EEC患者孕激素反應的有前景的模型。
為了構建EAH或EEC患者孕激素敏感的潛在預測模型,該研究基于EAH和EEC組織的ATAC-seq和RNAseq數據的綜合生物信息學分析,確定了候選基因,并在另外35例病例中進一步驗證了預測模型。該研究提供了預測EAH和EEC患者孕激素不敏感的潛在模型。
結果:
1. ATAC-seq數據比較PIS與PS患者染色質可及性
ATAC-seq分析基因組染色質的可及性(PIS,n=7和PS,n=7)。每組中有5名患者同時有ATAC-seq和RNA-seq數據。每組中剩下的兩名患者分別只有ATAC-seq數據或RNA-seq數據。在ATAC-seq結果中,根據功能和位置信息,每個樣本中所有讀取的比例與人類基因組中的元素相匹配。PIS組轉錄位點的可及性在啟動子區域更為豐富,而PS組在內含子和遠端基因間隔區的可及性更豐富。PIS組比PS組有更多的開放差示峰(圖1D)。通過系統聚類分析,PIS組較PS組有2773個開放峰和948個閉合峰(圖1E)。熱圖顯示,在PIS病例中,轉錄活躍的基因比例高于PS病例。每組6個樣本的基因峰按等級聚類成一組,說明了ATAC-seq數據的可靠性和準確性。

2. 應用RNA-seq技術比較PIS和PS的基因表達譜
為了比較PIS和PS的表達譜,通過層次聚類分析顯示DEG(圖2A)。與PS組相比,PIS組有4349個上調的DEG和2102個下調的DEG(圖2B)。GO和REACTOME富集分析確定PIS組中上調和下調的DEG的功能(圖2,C-D)。
BP:PIS組下調的DEGS主要在中性粒細胞相關活性、高爾基囊泡轉運、膜內系統組織、巨噬細胞自噬和細胞對化學應激的反應中豐富,而PIS組上調的DEGS主要豐富于膜電位和突觸信號相關功能。
CC:PIS組下調的DEG主要集中在顆粒腔、囊腔、細胞-底物連接和局灶性粘連,而PIS組上調的DEG主要集中在突觸膜和相關的轉運體。
MF:PIS組下調的DEGS富集在鈣粘素、核苷、GTP和泛素蛋白連接酶結合等,而PIS組上調的DEG富含通道、跨膜轉運體和神經遞質受體活性。
REACTOME通路:PIS組下調的DEGS顯著豐富于天冬酰胺N-連接糖基化、中性粒細胞脫顆粒、自噬和高爾基體與內質網(ER)之間的轉運等途徑,而PIS組上調的DEGS豐富于化學和突觸信號傳遞、成纖維細胞生長因子受體(FGFR)和G蛋白偶聯受體(GPCR)。

3. ATAC-seq和RNA-seq整合的GO和REACTOME分析
為了進一步確定與孕激素不敏感相關的特定功能和途徑,綜合ATAC-seq和RNA-seq結果進行進一步分析。通過重疊ATAC-seq和RNA-seq的結果,與PS組相比,PIS組在染色質可及性方面具有138個上調的DEG和92個下調的DEG,其中染色質可及性具有關閉的峰。相關分析表明,上述230個重疊區的表達譜與染色質可及性呈顯著正相關(圖3 A,B)
為了進一步了解這230個重疊的DEG是否參與了特定的功能和通路,我們進行了GO注釋和REACTOME通路(圖3C-D)。
BP:PIS組中重疊下調的DEGS主要影響細胞的輸入運輸、半胱氨酸型內肽酶活性的負調節、對活性氧的反應和脂肪細胞分化。
CC:PIS組中重疊下調的DEG位于谷氨酸能突觸、膜外成分、含膠原細胞外基質和胞內囊泡腔中,而PIS組中重疊上調的DEG位于糖蛋白復合體、鈉通道復合體、β-連環素-Tcf復合體和肌膜。
MF:PIS組中重疊下調的DEG在細胞外基質結合、鈣粘附素結合、轉錄輔因子結合和磷脂酰絲氨酸結合中豐富,而在PIS組中上調的DEG與bHLH轉錄因子結合、β-連環蛋白結合和鈉通道活性相關。
REACTOME通路:PIS組中這些重疊下調的DEG主要影響MAPK家族信號級聯、第二信使的細胞內信號轉導、PI3K/AKT網絡的負調控、G1中的細胞周期蛋白D相關事件以及FOXO?介導的細胞周期基因的轉錄;而PIS組中上調的DEG主要豐富于膽鹽和有機酸、金屬離子和胺化合物的運輸、微管蛋白的羧基末端翻譯后修飾、參與巨核細胞發育和血小板生成的因子以及動蛋白。
綜上所述,PIS組中重疊下調的DEGS主要負責信號傳遞、轉錄輔因子活性、DNA損傷、細胞凋亡和細胞周期,而PIS組中重疊上調的DEGS主要負責物質轉運和細胞骨架蛋白的調節。

4. 孕激素不敏感預測基因的篩選
為了進一步篩選預測孕激素不敏感的候選基因,利用HOMER軟件對調節230個重疊DEG表達的潛在轉錄因子進行了豐富。根據PIS組中69個下調的DEG,確定的TF包括CUX1、TBP、SOX5、FOXJ1、PRRX2、SOX9、FOXQ1、POU1F1、MECOM和NKX2-1,而根據PIS組中76個上調的DEG,僅識別出ZBTB18和CDC5L。此外,根據ATAC-seq和RNA-seq整合的結果,通過HOMER峰分析進行了基序富集化。生成超過20%的具有富含染色質區域的基序的靶序列的已知轉錄因子(PIS與PS)包括NANOG、TGIF2、NF1、HOXA9、FOXO1、SP2、SOX10、SOX3、TWIST2、SOX6、SOX21、KLF5、MAZ、TCF4、AP-1、BHLHA15R、NEUROG2、ATF3、SOX15和BATF。

此外,使用STRING和Cytoscape軟件分析了DEGS編碼的蛋白質之間的相互作用(圖4B)。根據連接的品系越多綜合得分越高的原則,篩選出潛在的候選基因或中心基因。前四位連接4條以上蛋白質分別由SOX9、CDH2、IRF4和TCF4編碼。PIS組下調區有8個蛋白質有4條以上連接線,分別由CD44、ACTB、KLF4、APOE、SNAI2、FYN、PAX2和FOXO1編碼。25個候選基因(SYTL2、SOX5、DMD、TCF4、PDGFC、SOX9、BNC2、CDH2、BCL11A、ANKS1B、PPP2R2B、DIO2、IRF4、FGF19、FOXO1、GATA6、IRS2、CD44、APOE、KLF4、ACTB、FYN、CNTLN、HOXA9和RXRA)。
5. 預測孕激素不敏感的潛在模型的建立
為了建立準確預測孕激素敏感狀態的模型,將35例患者進一步分為PS-C組(n=13)、sub-PS-C組(n=15)和PIS-C組(n=7)(圖5)。首先,用RT-qPCR方法檢測這35例患者中25個候選基因的表達。由于SYTL2、ANKS1B、PPP2R2B和FGF19基因的CT值超過35,表明基因表達水平低,分析不準確,因此這4個基因不包括在后續的分析中。

根據不同孕激素敏感條件,對其余21個基因的歸一化ΔCT值進行多項Logistic回歸分析,建立預測模型。圖6的結果顯示,對于PIS-C患者,總共生成了25個預測模型,預測準確率為100%,其中11個模型對于亞PS-C預測的預測準確率超過80%(P<0.01)。有3個模型的總體預測準確率超過90%,涉及9個候選基因(FOXO1、IRS2、PDGFC、DIO2、SOX9、BCL11A、APOE、FYN和KLF4)。

總結:
ATAC-seq和RNA-seq整合分析共獲得230個重疊的差異表達基因。進一步,基于GO分析、反應途徑、轉錄因子預測、基序豐富、細胞角蛋白分析,確定了25個可能與孕激素不敏感相關的候選基因。最后,使用擴展樣本進行數據驗證,并基于這些數據建立了包含9個基因(FOXO1、IRS2、PDGFC、DIO2、SOX9、BCL11A、APOE、FYN和KLF4)的預測模型,總體預測準確率在90%以上。這項研究提供了潛在的預測模型,可能有助于在保留生育能力的治療之前識別孕激素不敏感的EAH和EEC患者。