基于驅動基因突變對肝內膽管癌聚類,得到具有明顯的分子特征和治療脆弱性的臨床相關的類群

背景介紹
膽管癌是指膽管上皮細胞惡性增殖,形成的腫瘤。主要分為3種類型:肝內膽管癌、肝門部膽管癌和肝外膽管癌。肝內膽管細胞癌(ICC)又叫膽管細胞性肝癌,它在解剖學上與肝外膽管癌(ECC)不同,是僅次于肝細胞肝癌(HCC)的第二大常見原發性肝惡性腫瘤,發生率約10~15%,男性略大于女性。具有高侵襲性和轉移性,大部分ICC患者都在癌癥晚期時才被診斷出。外科手術是ICC的首選治療方法。目前對ICC的病因尚不完全清楚,可能與肝內膽管結石,病毒性肝炎、2型糖尿病(T2DM)、肝硬化、原發性硬化性膽管炎(PSC)、先天性膽道畸形等有關。此外,寄生蟲感染(肝吸蟲?。?、有毒有害物質的暴露、代謝異常(糖尿病和肥胖)也被認為是肝內膽管細胞癌的危險因素。部分ICCs來源于大膽管的成熟膽管細胞,與ECC主要相似;而其他亞型來源于黑林管的小膽管或祖細胞,甚至具有HCC的某些特征。其病因和細胞來源的多樣性表明ICC腫瘤發生的復雜機制。因此,迫切需要建立一套有效的ICC臨床分類系統。
基因組學特征層面而言,TP53、KRAS和SMAD4突變已被確定為東方國家ICCs患者中最多的突變,主要病原包括流行肝吸蟲、病毒性肝炎和肝內膽管結石。相反,患者中 IDH1/2、BAP1、PBRM1突變和FGFR2融合情況在西方國家更為普遍。從遺傳學角度來說,驅動基因突變之間存在潛在的功能依賴網絡,具有潛在的生物學和臨床影響。迄今為止,人類癌癥的大規?;驁D譜提供了證據,證明了特定致癌基因突變之間共發和互斥的非隨機模式,這為癌癥發展提供了深刻的啟示。

數據情況
1. 突變數據
研究隊列:2013-2020年期間發表的24篇相關文獻中的805例ICC患者數據。數據類型主要有STS、WGS和WES三種。
內部驗證集:225例ICC患者,包括腫瘤分期信息。
獨立ICC隊列:包括一個212例來自MSKCC的ICCs和158例來自cbioportal數據集的ICCs隊列和一個TIGER-LC和ICGC中的239例ICCs隊列。
生存分析數據集:來自TCGA和ICGC中的178例ECCs。
2. 基因表達數據:9個CCA的基因表達數據集。
3. 甲基化數據集(450K):GSE32079、GSE49656和GSE89803
結果
1. ICC中驅動基因突變的概覽
首先作者在圖1A中展示了本研究整體的一個流程設計。在本研究中,通過對505例WES/WGS和300例STS數據分析發現,有22個基因在至少70%的樣本中突變頻率大于2%。其中突變頻率最高的基因是TP53、KRAS、IDH1/2、ARID1A、 BAP1、PBRM1、FGFR2 融合、CDKN2A、SMAD4、PIK3CA和EPHA2(突變頻率> 5%)。所有這些基因都進行了一系列相關性的檢驗(如圖1B)。最后,在21個突變基因組合中發現了統計學上顯著的突變基因對(共同出現或互斥),包括12個正相關和9個負相關(圖1C-D)。

2. 通過七個驅動基因的成對相關性定義三個突變群
接下來,研究人員根據7個基因(TP53、KRAS、SMAD4、IDH1/2、FGFR2融合和BAP1)的高突變頻率和強成對相關性提出一個新的聚類方式。Cluster1至少有一個KRAS/TP53/SMAD4突變;至少有一個IDH/FGFR2-fus/BAP1突變且沒有KRAS/TP53/SMAD4突變的為Cluster2;而在Cluster3中上述基因均為野生型。根據上述策略,利用研究隊列中505例樣本的WES/WGS數據對堂本進行聚類。167例(33.1%)和117例(23.2%)分別攜帶Cluster1和Cluster2突變,同時這兩類之間具有很強的互斥性。具體所有的樣本的聚類情況如圖1D所示。

3. 在其他隊列中驗證聚類方式的可靠性
為了證明上述聚類方式是穩定可靠的,研究人員又將這種方式應用到了其他樣本數據中。在研究隊列的STS數據中也發現了Cluster1突變和Cluster2突變也傾向于相互排斥,同時,Cluster1和Cluster2基因的突變頻率分別為36.9%(97/263)和27.8%(73/263)。此外,他們在另外三個隊列中也得到了類似的效果。
4. 臨床因素對Cluster1和Cluster2突變互斥性的影響
既然本文的研究對象是臨床相關的腫瘤病人,那么通過上述聚類方式得到的cluster的臨床特征又是什么樣的呢?研究發現,Cluster1和Cluster2突變在不同性別(男性/女性)、年齡(≥65 / < 65)和病因之間具有相似的互斥優勢比(ORs)。值得注意的是,腫瘤分期對Cluster1和Cluster2突變的互斥性影響最大。III/IV期患者Cluster1和Cluster2突變的OR比I/II期患者高出3倍以上。在這些樣本中,有16例具有臨床分期信息的病例是Cluster1/2共突變類型的,其中14例為III/IV期(87.5%),這明顯高于僅具有Cluster1突變(66.2%)或Cluster2突變(55%)的病例。研究人員推測這種罕見的Cluster1/2共突變模式可能是腫瘤進化的結果。
5. 不同的突變群表現出不同的臨床病理特征
其次,研究人員比較了不同聚類的臨床病理特征。Cluster1突變在東方人群中更常見,而Cluster2突變在西方人群中更常見(圖2A)。從病因角度來說,Cluster2多見于無明確危險因素的ICCs和病毒性肝炎相關的ICCs,但在肝吸蟲感染或肝結石病例中很少發現。而Cluster1A和Cluster1B在病毒性肝炎、肝吸蟲感染和肝內結石等肝病病例中更常見(圖2B)。在圖2C中可以看到轉移性病例中Cluster1突變顯著富集。在原發性腫瘤和轉移性腫瘤之間,Cluster2突變的頻率相似,而Cluster3突變在原發性腫瘤中比轉移性腫瘤中更普遍。此外,Cluster1A ICCs的CA19-9水平最高,而Cluster2 ICCs的CA19-9水平遠低于Cluster1A和Cluster1B(圖2D)。與其他cluster相比,Cluster1A的ICCs在III/IV期患者中更富集(圖2E)。
根據組織學形態分類,ICC可分為小膽管型和大膽管型。因此研究人員還關注了內部驗證隊列中的94例ICC病例的不同突變cluster的組織學表型。值得注意的是,大多數Cluster1型ICCs,特別是Cluster1A型ICCs的組織形態主要表現為大膽管,而Cluster2型ICCs主要表現為小膽管(圖2F)。

6. 不同突變群的ICCs表現出不同的臨床特征
如圖3A所示,Cluster1突變與較差的總生存期(OS)和無復發生存期(RFS)顯著相關。相比之下,Cluster2突變的病例與Cluster3 ICCs相比,Cluster2的RFS相似,但OS相對較長。在Cluster1病例中,Cluster1A和1B ICC病例的預后同樣較差。此外,研究人員還發現Cluster1突變狀態在手術切除的ECS中沒有顯示顯著的預后價值。這表明觀察到的突變cluster的預后價值可能是ICC特異性的。
然后,研究人員還研究了不同突變cluster在接受治療的晚期ICCs中的預后價值。在來自MSKCC隊列的104例接受治療的轉移性/復發性ICCs中,與Cluster2/3的患者相比,Cluster1的患者在治療中進展率更高,OS相對更差,盡管其生存差異沒有統計學意義(圖3C)。

7. Cluster1突變與侵襲性和預后不良相關分子特征有關
分析完組織樣本數據,為了研究突變cluster之間預后差異,研究人員還分析了15個膽管癌細胞系的突變情況。利用基于238個基因富集評分的監督聚類方式,可以在5個獨立的基因表達譜數據集中將膽管癌病例分為3組 (圖3D)。結果發現Cluster1的ICCs和ECC病例大多富集在“預后不良”亞型,而Cluster2的ICCs大多集中在“預后良好”亞型。

8. 不同的突變群表現出不同的組織學和譜系相關的分子特征
利用目前已報道的膽管細胞分化基因表達標記(CD標記),可以將CCA樣本分成不同的三種CD表型(圖4A)。大多數Cluster2的ICCs屬于CD亞型,而Cluster1的ICCs和ECCs大多聚為非CD表型或混合表型(圖4A)。利用肝干細胞樣(HpSC)基因表達特征可以在上述三個隊列中將CCAs進一步分為三種亞型 (圖4B)。大多數Cluster2型ICC病例富集于HpSC亞型,而Cluster1型ICC和ECCs多分為非HpSC或混合表型。在DNA甲基化層面研究發現Cluster2的ICCs表現出明顯高于Cluster1的ICCs的DNA甲基化水平,在Cluster2的ICCs中,FGFR2融合或BAP1突變的ICCs(沒有IDH1/2突變)與IDH突變的ICCs表現出相似的DNA甲基化模式(圖4C)。此外研究人員還發現了不同的致癌基因表達標記在不同的cluster中。例如Cluster1在ICC中顯示了一系列此前已報道的轉移或進展相關基因的最高表達水平,如TMPRSS4、S100A4、S100P、PTEGS、MUC1、COX-2、IL-6和CEACAM6。

9. IDH/FGFR2融合/BAP1和TP53/SMAD4共突變模式進一步定義了兩種預后不同的HCC亞型
根據目前的研究報道,HCC、ICC和CHC這三種最常見的原發性肝癌(PLC)亞型有時會表現出重疊表型,如膽管癌樣HCC (CLHCC)亞型。使用CCA-like特征(CC signature)可以將407個TCGA-PLC(373個HCC、36個CCA和10個CHC)隊列分為一個連續性的肝癌譜系。其中175例HCC/CHC病例顯示類似CCA的特征,并與36例CCA病例聚集在一起,表明它們本質上與CCA分子特征相似(圖5A)。與之前的研究一致,CCA、CLHCC和經典HCC的預后不同(圖5B)。譜系特異性標志物(EPCAM、CD133、KRT19、CEACAM6、HNF4A和ALB)在這三種亞型中也是差異表達的(圖5C)。與分化良好的HCC的組織學形態相比,這些CLHCCs的顯微鏡下特征表現為“CCA-like型”(圖5D)。同時,研究人員還發現TP53/SMAD4突變和IDH/FGFR2-fus/BAP1突變的百分比顯著升高,而CTNNB1在CLHCC亞型中的突變率低于經典HCC亞型(圖5A)。與ICC一致,這兩類cluster也傾向于相互排斥(圖5E),與Cluster2 CLHCCs相比,Cluster1B CLHCCs的OS和RFS也明顯更短(圖5F)。

10. 具有不同聚類突變的ICC細胞對分子靶向治療表現出不同的敏感性
考慮到Cluster1和Cluster2 ICCs之間的分子差異,研究人員認為比較它們對分子靶向治療的響應可能也是不一樣的。一共篩選了六種ICC細胞系(包括兩種Cluster1A:兩種Cluster1B和兩種Cluster2A突變細胞系)進行研究。細胞活性檢測表明,沒有化合物可以選擇性地降低Cluster1A和1B突變ICC細胞的活性(圖6A)。與Cluster1A突變細胞相比,Cluster2A突變ICC細胞對Dasatinib、Vorinostat、JQ1、iBET、Olaparib和Niraparib表現出更高的敏感性(圖6A-B)。同時,JQ1和Vorinostat顯著抑制Cluster2A (IDH1突變)ICC細胞,但不抑制Cluster1A (KRAS/TP53突變)ICC細胞(圖6C)。這項分析表明,ICCs的分子亞型可能與特定靶向治療的獨特敏感性有關。研究人員還指出,基于ICC不同突變cluster的更大規模藥物篩選值得進一步研究。

11. 結合基因表達譜數據篩選ICCs的特異性生物標志物
綜上所述,Cluster1A和Cluster2 ICCs具有明顯的臨床特征。通過比較這兩類的基因表達數據得到了52個明顯差異表達的基因。在這些基因中,前兩個基因S100P和KRT17都是CCA生存特征和ICC復發特征的預后標記,同時也是CD特征的標記(圖7A)。研究人員構建了一個臨床病理評分(CP評分)系統,CP分數低(0和1)可以很好地定義Cluster2的ICCs,而Cluster1的ICCs大多富集于CP分數高的組中(圖7B)。該評分系統還可以將Cluster3病例分為兩個具有明顯臨床和生物學相關性的亞群(圖7C-D)。

總而言之,S100P和KRT17結合CA19-9可能作為譜系指示標記,有助于ICC突變cluster的鑒別。結合聚類突變和亞型特異性的生物標志物,研究人員最終提出了一種臨床適用的聚類策略,它可以指導ICC預后分層、分子分類和治療優化(圖8)。

結論
在本研究中,研究人員通過研究驅動基因突變的成對相關性或互斥性,揭示了ICC多樣性的突變基礎??偠灾?,研究人員人員對篩選出的7個突變基因的進行突變檢測,結合S100P/KRT17表達和CA19-9水平的評估,是鑒定臨床和生物學上不同亞型ICC的可靠生物標志物。此外,他們還發現不同的突變cluster具有不同的腫瘤發生機制,因此藥物反應性也不同,這將為惡性腫瘤的治療提供更精確的治療策略。