轉移性癌癥與患者預后不良相關,但其時間和空間發(fā)生趨勢在早期仍不可預測。在這里,研究人員開發(fā)了MetaNet,一個計算框架,整合了來自32176例原發(fā)和轉移性癌癥病例的臨床和測序數(shù)據(jù),以評估原發(fā)腫瘤的轉移風險。
MetaNet在鑒別乳腺癌和前列腺癌的轉移和原發(fā)灶方面具有較高的準確性。從預測中,研究人員識別了具有轉移特征的原發(fā)性腫瘤(MFP),這是一種具有基因組特征的原發(fā)性腫瘤的子集,在轉移中聚集,并證明其較高的轉移風險和較短的無病生存期。此外,研究人員識別了與器官特異性轉移相關的基因組改變,并利用它們將患者分層為具有不同轉移器官傾向的不同風險組。在前列腺癌中,這種嗜有機分層方法比標準的組織學分級系統(tǒng)具有更好的預后價值,特別是在骨MFP和肝MFP亞型的識別方面,具有指導后續(xù)器官特異性檢查的潛力。
轉移,即腫瘤細胞擴散到遠處的器官,是大多數(shù)癌癥相關死亡的原因。部分原因是由于轉移灶擴散超出臨床控制時診斷較晚。目前標準的TNM系統(tǒng)根據(jù)原發(fā)腫瘤大小(T)、淋巴結擴散(N)、一個原因是,轉移癌可能在遠端器官中播散,而不是在臨床上可測量的大小上成為顯性轉移。
以前的研究發(fā)現(xiàn),轉移瘤細胞一旦到達遠處的器官,就可以進入休眠狀態(tài)而不生長。到目前為止,根據(jù)標準的TNM指標,在明顯轉移前,很少有辦法定量評估原發(fā)腫瘤的轉移風險(例如,何時和何地轉移)。高通量技術使識別分子特征預測癌癥轉移和進展成為可能。2003年,Ramaswamy等人通過比較12個轉移性和64個原發(fā)腫瘤樣本,從微陣列數(shù)據(jù)中確定了一個與轉移相關的基因表達特征,并在279個原發(fā)實體腫瘤的獨立隊列中驗證了具有該特征的患者與轉移和不良臨床結果相關。臨床腫瘤DNA測序方法,如MSK-IMPACT和FoundationONE,已經(jīng)證明其在指導原發(fā)和轉移性癌癥治療選擇方面的臨床效用。
此外,拷貝數(shù)變異負荷是癌細胞的一個常見基因組特征,被證明是前列腺癌復發(fā)的高度預測因子。因此,研究人員假設原發(fā)腫瘤的基因組變異可以作為轉移風險評估的指標。為了可靠地估計明顯轉移的潛在時間,風險評估模型理想地從轉移前后縱向測序數(shù)據(jù)中學習潛在的腫瘤進展和轉移模式。然而,目前可用的基因組數(shù)據(jù)庫只有少量這樣的配對樣本,這不足以在更大的癌癥人群中分類出可靠的預后生物標志物。另一方面,橫斷面原發(fā)和轉移性腫瘤樣本有大量的大規(guī)模臨床DNA測序數(shù)據(jù),可以緩解縱向數(shù)據(jù)的不足。例如,最近對乳腺癌和結腸直腸癌的MSK-IMPACT數(shù)據(jù)的分析發(fā)現(xiàn)了顯著的預示治療反應和患者生存的生物標志物。通過從這些未配對的樣本中學習轉移前后的基因組差異,計算模型可以通過尋找原發(fā)腫瘤基因組中的轉移特征,自動評估其轉移風險。因此,即使是來自不同患者的未配對樣本數(shù)據(jù),仍可能是描述克隆進化和癌癥進展過程中腫瘤行為的寶貴資源。流行病學研究發(fā)現(xiàn),根據(jù)來源組織和其他因素,轉移瘤細胞傾向于在某些遙遠的器官上播種,這被稱為器官趨向性。例如,2010年至2015年的流行病學數(shù)據(jù)表明,大約80%的同步腦轉移源自肺原發(fā)灶15。來自同一組織但在不同器官定植的轉移可能導致不同的患者預后。例如,在大多數(shù)癌癥類型中,與其他轉移相比,肝炎轉移通常導致明顯較差的臨床結果。
在這項工作中,研究人員的目標是通過收集和分析總共32176例胰腺癌DNA測序樣本,開發(fā)一個轉移網(wǎng)絡模型來評估轉移風險和潛在的目的器官。利用這一大數(shù)據(jù)隊列,研究人員識別了與常見轉移和有機質性轉移相關的基因組生物標志物,并在早期階段使用機器學習模型來篩選一個可區(qū)分的亞型,即原發(fā)性轉移特征,驗證其在轉移風險評估中的效用。與傳統(tǒng)原發(fā)性患者相比,無病生存期更短。從與肺癌腦轉移相關的生物標志物中,研究人員發(fā)現(xiàn)了pi3k通路畸變的顯著富集,并使用研究人員的藥物基因組數(shù)據(jù)庫驗證了靶向MTOR在治療肺癌腦轉移中的有效性。利用嗜有機生物標志物,研究人員建立了一個計算模型,將原發(fā)性前列腺癌患者分層為具有骨轉移傾向或肝轉移傾向的亞組,以便在隨訪中進行器官特異性檢查。為了便于轉移風險評估和其他有機生物標志物的驗證,研究人員開發(fā)了一個MetaNet的web應用程序,可以在https://wanglab.shinyapps.io/ MetaNet上獲得。

為了全面描述轉移性癌癥的擴散模式,并提高識別潛在預后基因組生物標志物的統(tǒng)計能力,研究人員整合了來自4項研究的32176例原發(fā)性和轉移性癌癥樣本的臨床和基因組數(shù)據(jù):來自MSKIMPACT (MSK)的10,946個樣本,來自Foundation Medicine Inc. (FMI)的18,004個樣本,來自密歇根大學(MET500)的500個轉移性樣本,以及來自癌癥基因組圖譜(TCGA)的3,336個肺癌、乳腺癌、結腸癌和前列腺癌的原始樣本。研究人員將這些腫瘤樣本的起源組織和采樣位置劃分為一般解剖器官位置,并將次要和不明確的組織從下游分析中排除。接下來,研究人員構建了一個泛癌轉移的擴散圖(圖1a),起源于16個不同的原發(fā)部位,并向8個轉移部位轉移。除淋巴結作為局部轉移部位外,排在第一位的遠處轉移器官是肝、骨、肺和腦,這些器官特異性轉移都被深入研究。
為了研究常見的癌癥擴散模式,研究人員基于16種原發(fā)癌癥中轉移部位分數(shù)分布的相似性構建了原發(fā)癌癥網(wǎng)絡(PCN,圖1b)。通過網(wǎng)絡聚類分析,研究人員確定了兩類原發(fā)腫瘤,其中表現(xiàn)出相似轉移方向偏好的原發(fā)腫瘤器官來自同一功能系統(tǒng)。其中一組是嗜肝性癌癥,包括乳腺癌以及來自食道、胃、膽囊、胰腺和結腸等消化系統(tǒng)的所有癌癥。另一組主要是嗜肺性,包括皮膚、甲狀腺、肝臟、頭頸部和泌尿系統(tǒng)(腎、膀胱和前列腺)的癌癥。同樣,研究人員根據(jù)8個轉移部位接受的轉移癌類型的相似性構建了一個轉移部位網(wǎng)絡(MSN),發(fā)現(xiàn)4個常見的轉移器官,肝、肺、骨和腦,接受不同類型的原發(fā)癌。
為了研究介導這種復雜擴散模式的遺傳因素以及潛在的臨床影響,研究人員開發(fā)了MetaNet,這是一個計算框架,根據(jù)腫瘤的基因組譜和臨床數(shù)據(jù)預測腫瘤是否會擴散以及在何處擴散(圖1d)。總的來說,MetaNet包括兩個模型:模型1通過學習原發(fā)腫瘤和轉移瘤之間的基因組差異來預測原發(fā)腫瘤是否會轉移,模型2通過捕獲器官特異性轉移瘤之間的基因組特征來預測原發(fā)腫瘤將在何處定殖(圖1d)。通過基于模型的基因組譜對每個腫瘤的轉移能力和器官特異性進行評分,研究人員進一步評估從原發(fā)性轉移的預測準確性,并詢問哪些相關的遺傳因素有助于預測。最后,研究人員通過MetaNet將獨立的原發(fā)性腫瘤隊列劃分為不同的風險組,通過預后分析驗證了研究人員的模型。

為了識別與轉移相關的基因組變異,研究人員比較了16種原發(fā)和轉移期癌癥中每種突變、拷貝數(shù)改變(CNA)、染色體臂改變和10種致癌途徑畸變的比例。總的來說,轉移灶中顯著富集的變異比原發(fā)灶中富集的變異多(圖2a, b),表明從原發(fā)灶進化而來的轉移灶是一個選擇性的過程,在這個過程中,腫瘤通過其他變異獲得轉移能力。值得注意的是,轉移中最顯著富集的變異包括轉移性乳腺癌中ESR1(雌激素受體1)突變(FDR <1e6, z-test, Benjamini Hochberg (BH)校正)和AR(雄激素受體)突變和復制數(shù)擴增在轉移性前列腺癌(FDR <1e6, z測試,BH校正)。先前的研究報道,ESR1突變在對激素治療有耐藥性的復發(fā)性乳腺癌中普遍可見。同樣,AR變異也被證明是抗雄激素消耗治療的分子機制。此外,研究人員還觀察到轉移瘤基因組中拷貝數(shù)和染色體臂改變數(shù)量增加(圖2b),這與之前報道轉移瘤基因組結構高度不穩(wěn)定的研究一致。在這些重要的CNAs中,研究人員發(fā)現(xiàn)MYC擴增是兩種不同癌癥類型:轉移性前列腺癌和胰腺癌的唯一變異,表明其在促進腫瘤轉移中的共同作用。
考慮到原發(fā)和轉移基因組圖譜的差異(圖2a、b),研究人員建立了MetaNet Model 1,這是一個基于xgboost的機器學習模塊,采用梯度增強樹模型,利用腫瘤基因組圖譜將原發(fā)腫瘤患者分層為不同的轉移風險組(圖1d)。特別是,研究人員首先訓練該模型,利用腫瘤的臨床、組織學和基因組特征,從四種常見癌癥類型(乳腺癌、肺癌、結腸癌和前列腺癌)的原發(fā)腫瘤中識別轉移性腫瘤。了解原發(fā)腫瘤和轉移性腫瘤之間的不同特征后,該模型就能夠估計一個腫瘤轉移的可能性,稱為Metascore。使用交叉驗證,研究人員表明,相對于基線模型訓練的臨床和組織學特征沒有基因組數(shù)據(jù),genomics-based模型可以準確地識別主要的轉移性腫瘤在乳腺癌和前列腺癌(接受者操作特征曲線下面積,AUROC祝辭0.8),而不是肺癌和結腸癌(圖2c)。這一結果表明,原發(fā)性和轉移性乳腺和前列腺腫瘤的基因組不同,而肺癌和結腸癌的基因組相似,這與研究人員在基因組譜比較中的觀察結果相似(圖2b)。從進化的角度來看,這表明不同于肺癌和結腸癌,乳腺癌和前列腺癌可能遵循特定的進化模式,在這種模式下,只有能夠抵抗激素治療的新克隆才能在轉移中茁壯成長。就臨床意義而言,乳腺癌和前列腺癌患者的無病生存期通常比肺癌和結腸癌患者長28,在恒定突變率的假設下,乳腺癌和前列腺癌的轉移比肺癌和結腸癌的轉移有更長的時間進化和獲得更多的變異。
為了進一步了解哪些基因組變異用于轉移風險預測模型,研究人員使用SHapley Additive explance(SHAP)值,通過可視化基因對乳腺癌轉移風險的貢獻來理清基于樹的模型(圖2d)。SHAP值為正值表明基因組特征對轉移風險有積極貢獻,而負值代表對轉移風險有消極影響。與研究人員對原發(fā)性和轉移性乳腺癌的基因組比較一致, ESR1突變的平均SHAP值被發(fā)現(xiàn)是轉移性乳腺癌的最預測性特征,其次是FGFR4突變、SOX2擴增、ERBB2突變和FGFR1突變(圖2d)。ERBB2突變通過與ESR1突變不同的機制被發(fā)現(xiàn)與激素治療的耐藥性相關。相比之下,乳腺癌低轉移風險的最高預測變量是DAXX、MCL和GATA3擴增。有趣的是,先前的一項研究發(fā)現(xiàn),GATA3通過誘導靶向一組前轉移調(diào)控因子的microRNA-29b表達,在乳腺癌轉移中發(fā)揮抑制作用。
盡管基于基因組學的模型在區(qū)分轉移性乳腺癌和原發(fā)性乳腺癌和前列腺癌方面分別獲得了0.82和0.8的AUROC,但誤分類率是不可忽視的。檢查Metascore分布在真正的原色和轉移性樣本類別,研究人員表明,誤分類率主要是由假陽性率高(圖2 e)在乳腺癌和前列腺癌,這表明該模型高估了初級腫瘤轉移的一個子集。這種被高估的原發(fā)腫瘤子集,即使被標記為原發(fā)腫瘤,也可能攜帶轉移豐富的特征,這使得它們在基因上更類似于原發(fā)腫瘤以外的轉移瘤。因此,基于Metascore截斷值為0.5(圖2e),研究人員將這一組原發(fā)腫瘤視為具有轉移特征的原發(fā)腫瘤(MFP) (n = 382,圖2f),將另一組原發(fā)腫瘤視為常規(guī)原發(fā)腫瘤(n = 1255,圖2f)。為了說明MFP腫瘤是否確實具有轉移豐富的特征,研究人員計算了MFP、CP和轉移性(M)乳腺癌中最高預測變異的比例(圖2d)。研究人員一致發(fā)現(xiàn),與CP腫瘤相比,MFP腫瘤具有更多的轉移富集特征,如ESR1和ERBB2突變(圖2g)。相反,與CP腫瘤相比,MFP腫瘤攜帶更少的原始富集特征,如MCL1和GATA3擴增(圖2g),這表明,在研究人員的Metascore定義的基因組規(guī)模上,更多的轉移富集特征和更少的原發(fā)富集特征共同將MFP腫瘤從傳統(tǒng)的原發(fā)轉移轉移到真正的轉移(圖2f)。

為了探索MFP腫瘤的生物學和臨床意義,研究人員收集了TCGA乳腺癌隊列(32,33,包括1079個原發(fā)性乳腺癌樣本)的基因組、轉錄組學和臨床數(shù)據(jù)。將來自TCGA樣本的臨床、組織學和基因組數(shù)據(jù)的相同特征輸入訓練模型,研究人員通過計算其Metascore來估計每個TCGA樣本的轉移風險。在訓練階段確定的頂級預測基因組特征(圖2d)對每個TCGA樣本的轉移性風險估計貢獻了類似的預測能力(圖3a),突出了這些預測特征的魯棒性,無論是否存在由批效應和其他協(xié)變量引起的變化。特別是7個攜帶ESR1突變的TCGA原發(fā)乳腺癌樣本均被認為是MFP腫瘤,突出表明ESR1突變是一個顯著的特征,可以為原發(fā)腫瘤患者提供高轉移風險的早期預警信號,但其轉移灶尚未檢測到。事實上,ESR1突變已被用于通過液體活檢監(jiān)測激素治療的耐藥性,即測量癌癥患者血液中的細胞游離DNA 。
為了了解具有轉移特征的原發(fā)腫瘤的功能后果,研究人員隨后研究了基因表達數(shù)據(jù)。由于不同受體定義的乳腺癌亞型表現(xiàn)出不同的表達模式,研究人員將TCGA乳腺癌樣本分為4個經(jīng)典亞型:luminal A、luminal B、her2+和基底樣,然后比較每個亞型中MFP和CP腫瘤之間的轉錄組譜。值得注意的是,研究人員發(fā)現(xiàn)在MFP腫瘤中上調(diào)的基因在HER2富集型和基底樣亞型的上皮間質轉化(EMT)中顯著富集,而下調(diào)的基因在細胞周期增殖相關功能中顯著富集,如G2M檢查點和E2F目標(圖3b, c)。這種模式不是GSEA發(fā)現(xiàn)的另外兩個hormonerelated亞型和乳腺癌一般。一項研究觀察了EMT之間相同的反模式,通過調(diào)節(jié)細胞增殖是攜帶者表達mda - mb - 468,三陰性乳腺癌細胞系,這在一定程度上支持了研究人員的觀察。為了驗證MFP腫瘤是否具有較高的轉移風險,研究人員比較了MFP組和CP組患者的臨床結果。利用TCGA中可用的生存數(shù)據(jù)篩選樣本,研究人員發(fā)現(xiàn)MFP腫瘤患者的無病生存期(DFS)明顯短于CP腫瘤患者(圖3d)。同樣,MFP前列腺癌和MFP肺癌患者的臨床結果更差,DFS更短,這共同表明MFP腫瘤比CP腫瘤更進行性。
為了驗證研究人員對轉移風險的基因組評估Metascore是疾病進展的獨立預測因子,研究人員比較了每一種乳腺癌亞型中MFP腫瘤患者和CP腫瘤患者的DFS,發(fā)現(xiàn)四種亞型中MFP組的DFS均較差(圖3e)。此外,研究人員使用多變量Cox回歸綜合評估乳腺癌亞型和meta - core定義的MFP/CP分層的預測能力。引人注目的是,MFP對CP的危害比為3.9(2.2 7.0,95%置信區(qū)間),顯著高于1的基值,且與亞型無關(圖3f)。盡管先前的研究表明,基底樣乳腺癌的總體生存率明顯低于激素陽性亞型,但是,與研究人員的基于基因組的分層相比,這些亞型對疾病進展的預測能力并不強(圖3f)。總之,研究人員證明了研究人員的乳腺癌轉移風險的基因組分層是非常強大的,并且獨立于傳統(tǒng)的基于激素的乳腺癌亞型。

為了探索癌癥轉移的擴散偏好,研究人員從MSK (n = 2919)和FMI (n = 4100)隊列中收集了兩個大規(guī)模且獨立的轉移癌數(shù)據(jù)集,以研究這種器官特異性轉移(即轉移性器官趨向性)是否是一種統(tǒng)計上穩(wěn)健的表型。比較兩個獨立隊列中16個起源組織的8個轉移部位的轉移癌的分數(shù)差異,研究人員發(fā)現(xiàn)了一個顯著的相關性(圖4a)。最相關的轉移癌類型是胰腺癌的肝轉移(180例MSK患者中有143例轉移,329例FMI患者中有263例轉移)。總的來說,16種癌癥中有15種(前列腺癌除外)在MSK組和FMI組之間表現(xiàn)出轉移部位分布的顯著相關性(圖 4a),研究人員從大數(shù)據(jù)的角度得出結論,在大多數(shù)轉移性癌癥的傳播方向是強有機性的,統(tǒng)計上是可靠的,這意味著有機性轉移是高度非隨機的,部分由某些潛在因素驅動,包括起源組織、血管模式、遺傳背景和適宜的微環(huán)境。
為了進一步明確每種癌癥類型中哪個器官是主要的轉移目的地,研究人員通過將歸一化部分投射到一個四面體空間(圖4b),比較了四個常見的遠處轉移器官:骨、腦、肝和肺的癌癥樣本的分數(shù)。有趣的是,研究人員發(fā)現(xiàn)了兩種癌癥:一種是肝型,另一種是肺型,這與原發(fā)腫瘤網(wǎng)絡的發(fā)現(xiàn)一致(圖1b)。嗜肝組包括消化系統(tǒng)的五種癌癥(膽囊、胰腺、胃、結腸和食道),這部分是由于血管結構和解剖學上的接近。嗜肺型包括頭頸癌、甲狀腺癌、子宮癌、皮膚癌、腎癌等,大部分位于肺附近。這兩組研究的確解釋了原發(fā)腫瘤網(wǎng)絡中的簇形成(圖1b)是由于肝臟和肺中主要的單器官傾向。此外,研究人員觀察到廣泛報道的器官向性,包括前列腺癌骨轉移和肺癌腦轉移。其他類型的癌癥包括膀胱癌、卵巢癌和肝癌,并沒有位于任何單一的角落,這表明它們的轉移性器官取向并不是由單個器官主導的。
考慮到轉移性嗜器官性是一種穩(wěn)定的生物學現(xiàn)象(圖4a),研究人員進一步研究其潛在的臨床價值,即不同器官的轉移是否影響患者的生存。使用總生存期(OS)數(shù)據(jù)在MSK的人群中,研究人員比較了操作系統(tǒng)差異的四種常見的四種常見癌癥擴散轉移器官根據(jù)卡普蘭Meier陰謀下的面積的度量(同樣是意味著生存)而不是生存不能計算中值長期存在癌癥,比如前列腺癌。一般而言,在所有四種癌癥類型中,轉移性前列腺癌患者的生存期明顯短于原發(fā)癌患者(圖4c)。特別是,轉移性前列腺癌患者在肝臟的生存期明顯差于在骨骼的生存期(圖4c),這表明預測潛在的轉移部位可以為前列腺癌患者提供預后價值。出乎意料的是,腦轉移并不總是意味著比其他轉移的生存期更差:在乳腺癌和結腸癌中,腦轉移的生存期比肝轉移的生存期更差,而在轉移性肺癌中,這種觀察結果正好相反(圖4c)。
接下來,研究人員研究遺傳變異是否有助于轉移性器官嗜性。考慮到大量的拷貝數(shù)和染色體臂改變在轉移性癌癥中顯著富集(圖2b),研究人員進一步研究這些改變是均勻分布于所有轉移部位,還是在某一轉移部位特異性富集。使用基因組改變(FGA)估計的分數(shù)MSK-IMPACT study,研究人員發(fā)現(xiàn)大幅增加腦轉移的FGA相比non-brain轉移和10的16的主要腫瘤癌癥類型(圖4d),特別是在肺癌、乳腺癌、結腸癌(圖4 d),這些都是腦轉移的首要來源。先前的研究表明,以高FGA為特征的染色體不穩(wěn)定性是通過細胞質DNA反應發(fā)生轉移的驅動因素。最近的一項研究發(fā)現(xiàn),特別是在使用患者源性異種移植小鼠模型的肺癌腦轉移中需要MYC擴增,這啟發(fā)研究人員從基因角度進一步表征每個器官特異性轉移。

為了在研究人員精心策劃的大規(guī)模數(shù)據(jù)集中全面識別與轉移性器官趨向性相關的變異,研究人員選擇了位于骨、腦、肝和肺的轉移樣本,并篩選了在四個轉移部位的分數(shù)顯著偏離轉移瘤平均分數(shù)的變異。使用假發(fā)現(xiàn)率控制,研究人員共鑒定了93個嗜器官趨向性變異型和特征,在某些轉移位點的分數(shù)偏倚顯著偏離平均值,其中大多數(shù)發(fā)現(xiàn)于源自結腸(n = 19)、乳腺(n = 15)和肺部(n = 13)的轉移癌。幾乎三分之二的器官趨向性變異型(93個中的59個)在腦轉移中有一定程度的富集,而只有6個變異在肺轉移中富集,5個在肝轉移中富集。在這59個嗜腦性變異體中,有15個是CNAs,這表明這些改變的基因可能是腦轉移中豐富的CNAs的關鍵因素(圖4d)。
通過15個器官趨向性變異型在乳腺癌中,10個最豐富的腦轉移,在肝轉移,3和2在骨轉移。每個變體的organspecific濃縮形象化,研究人員計算的優(yōu)勢比變體部分在一個轉移性網(wǎng)站,網(wǎng)站,稱為有機優(yōu)勢比(OGTOR),并將歸一化OGTOR投影成一個四面體,四個角代表四個轉移位點。未發(fā)現(xiàn)任何變異位于肺轉移角附近,而肺轉移中最豐富的變異和特征,如p53、Ras和Myc通路(67%、56%和20%),在腦轉移中更為豐富(80%、73%和37%)。OGTORs投射到三角空間(圖5),而不是和變體分數(shù)大于5%,突顯出變異羅斯福小于0.05,研究人員清楚地表明,liver-tropic變體的乳腺癌是ESR1突變,bone-tropic變體是攜帶者突變,和brain-tropic變異包括TP53突變,CDK12,和ERBB2放大。特別是,ESR1突變極大地改變了轉移性乳腺癌終點的分布,肝臟的轉移率急劇上升(從52%上升到75%),同時腦和肺的轉移率也有所下降(圖5b)。進一步檢查乳腺癌樣本中每個ESR1突變,研究人員發(fā)現(xiàn)肝臟轉移濃縮實際上是主要由四個熱點位置位于配體結合域:D538, Y537, L538 E380 (圖5c),所有這些在空間上彼此接近,并已被證明可以引起雌激素獨立的下游信號通路激活,促進細胞增殖。CDH1突變在骨轉移中富集,被認為是侵襲性小葉癌中一種功能缺失突變,導致細胞與細胞粘附的失調(diào),具有松散的表型。事實上,TP53突變和ERBB2擴增在三陰性乳腺癌和her2富集乳腺癌中分別富集。之前的一項流行病學研究表明,除基底樣亞型外,乳腺癌骨轉移在所有亞型中都很常見,而肝轉移在激素陽性亞型中富集,腦轉移在her2富集和三陰性亞型中富集。所有這些都與研究人員的器官趨向性變異型富集分析高度一致。
在肺癌的13個器官趨向性變異型中,10個在腦轉移中最為豐富,3個在骨轉移中最為豐富(補充資料3)。由于樣本數(shù)量少(n = 32),且缺少關于區(qū)域復發(fā)或從肺一個部位到另一個部位的遠處轉移的注釋,因此研究人員排除了肺轉移。在腦轉移中發(fā)現(xiàn)了顯著高的突變負擔(大于20個突變/兆堿基),以CREBBP和EPHA5突變富集為特征(圖5d)。STK11突變在骨轉移中顯著富集,其參與的PI3K通路的畸變顯著增加了腦轉移的比例(圖5e)。有趣的是,盡管STK11突變在骨轉移中更豐富,但在伴有PI3K通路畸變的肺癌腦轉移樣本中,STK11突變是最豐富的變異。前期研究表明,STK11是一種抑癌因子,其功能缺失突變參與了腺癌向鱗癌的形態(tài)改變,進而促進肺癌轉移。通過分析研究人員之前的藥物基因組數(shù)據(jù)集,從462個患者源性細胞株(PDCs)中篩選了60種抗癌藥物,研究人員發(fā)現(xiàn),對于23個肺癌腦轉移(LUBM)患者源性細胞株(PDCs), 5種pi3k通路抑制劑位列7種最有效藥物之列。五種PI3K通路抑制劑中有三種(gedatolisib、依維莫司和vistusertib)靶向于PI3K通路的下游效應子MTOR51。進一步比較23個LUBM PDCs和其他439個PDCs的藥物療效,發(fā)現(xiàn)三種MTOR抑制劑具有顯著的高特異性(圖5f)。總的來說,這一結果證實了異常激活的PI3K通路的富集及其在肺癌腦轉移中的臨床作用。
在結腸癌的19個器官性變異中,腦轉移中有11個最豐富,骨轉移中有7個最豐富,肝轉移中有1個最豐富。肺轉移中未發(fā)現(xiàn)明顯的變異。除了肝臟轉移中富集的TGF-β通路畸變,以SMAD4突變和缺失為特征,其他顯著的變異主要是位于13q染色體的擴增,以及以KRAS突變?yōu)樘卣鞯腞as通路激活(圖5g)。在這些嗜腦性擴增中,最顯著的是CDK8擴增,它使腦轉移率從2%小幅增加到11% (圖5h)。盡管CDK8與其染色體鄰居FLT1和FLT3一起被擴增,但研究人員從TCGA52中收集了轉錄組數(shù)據(jù),表明只有CDK8的擴增,而不是FLT1和FLT3的擴增,通過相應的表達上調(diào)具有功能。先前的研究已經(jīng)證明了CDK8在結腸癌細胞增殖中的致癌作用,作為WNT通路中β- catenin驅動轉化的正向中介。在最近的兩項研究中,使用來自同一患者的原發(fā)結腸癌和腦轉移結腸癌成對樣本,研究人員證明了CDK8擴增在腦轉移中不是新出現(xiàn)的事件,而是從原發(fā)腫瘤中遺傳而來的。比較CDK8擴增的原發(fā)性結腸癌TCGA和非擴增病例的轉錄組譜,研究人員發(fā)現(xiàn)CDK8擴增實際上與促進上皮間充質轉化有關和細胞增殖下調(diào),提示CDK8擴增在結腸癌遠處轉移中的作用。此外,研究人員利用TCGA的臨床數(shù)據(jù)表明,CDK8擴增的結腸癌患者診斷出的淋巴結擴散更多, DFS顯著縮短(圖5i)。總的來說,所有的證據(jù)都明確指出,帶有CDK8擴增的結腸癌更具進行性,有很強的向大腦遠處遷移的潛力。鑒于結腸癌轉移遵循一個連續(xù)的級聯(lián)從結腸、肝、肺,研究人員推斷腦轉移的結腸癌也遵循這個級聯(lián)由血液從肺部血管,遷移到心臟,最終通過頸動脈進入大腦。原發(fā)、肝、肺和腦轉移中的CDK8擴增部分呈顯著增加趨勢(圖6g),提示級聯(lián)過程中CDK8擴增陽性選擇。
盡管研究人員只識別了一種有機性變異,即前列腺癌肺轉移中的MSH6突變,但研究人員從生存分析中觀察到(圖4c),原發(fā)性前列腺癌骨轉移患者,在40個月的隨訪中,肝轉移患者的平均生存時間分別減少了33個月、24個月和13個月(圖4c和6a)。這三組之間的兩兩比較都產(chǎn)生了顯著的差異(圖6a),與以往的流行病學統(tǒng)計數(shù)據(jù)一致。受到這一事實的啟發(fā),研究人員開發(fā)了MetaNet模型2(圖1d),這是一個基于器官嗜性的預后系統(tǒng),根據(jù)轉移目的地的傾向將患者分層為不同的風險組。使用序回歸模型框架,研究人員使用MSK和FMI前列腺癌隊列的聯(lián)合數(shù)據(jù)集對MetaNet預后模塊進行訓練(圖6b),在三級預測任務中獲得了64.3%的準確率。接下來,研究人員應用MetaNet模塊獨立的預后主要從TCGA55前列腺癌患者,并分層分為三組(圖6 b)風險:傳統(tǒng)初級(CP, n = 237),骨初級轉移性主特征(BoneMFP, n = 174)、和肝轉移性主特征(LiverMFP, n = 83)。引人注目的是,這三個風險DFS組有類似的下降趨勢,和兩兩比較三組之間的DFS產(chǎn)量顯著差異:在CP和Bone-MFP, Bone-MFP vs Liver-MFP,和 CP和Liver-MFP(圖6 c)。這提示嗜器官性分層可以提示臨床醫(yī)生在高危患者隨訪期間進行器官特異性檢查。
為了展示研究人員基于基因組學的分層模型的機制,研究人員展示了預測變異在每個分層組中的對應部分(圖6d)。總的來說,在每個危險組中,這些預測變異的比例從CP到骨和肝MFP組都呈現(xiàn)增加的趨勢,其特征是細胞周期、p53和PI3K通路的畸變,表明惡性腫瘤的順序過程與生存模式一致(圖6c)。特別是,研究人員注意到FGA超過5%是CP的高分辨特性(31%)和骨-(88%)和liver-MFP(99%)患者,連同兩個特色CNAs: CDKN1B刪除和基于“增大化現(xiàn)實”技術的放大(圖6 d),這與先前的研究一致僅僅使用FGA預測cancer前列腺癌患者的生存。骨性mfp組較肝臟mfp組的預測變異為SPOP突變,且顯著豐富,已發(fā)現(xiàn)代表不同的前列腺癌亞型互斥的常見E26轉換(ETS)轉錄家庭fusions。CDK12突變,盡管在所有三組中比例都很低(CP為0%,骨MFP為2.8%,肝MFP為5.9%),也已被證明增加了前列腺癌的基因組不穩(wěn)定性和侵襲性。
目前標準的前列腺癌分級體系主要依賴于基于兩處病變組織學圖像形態(tài)學特征的Gleason評分。研究人員將基于基因組的有機生物分層與TCGA隊列中的Gleason分級進行了比較,發(fā)現(xiàn)在每個Gleason分級中,研究人員的基因組分層的中位數(shù)分數(shù)嚴格遞增,表明利用基因組學和組織學分析,兩個獨立系統(tǒng)之間具有高度的一致性(圖6e)。特別是,研究人員的基于基因組學的系統(tǒng)將更多的CP患者劃分為低gleason分級組,更多的肝臟MFP患者劃分為高gleason分級組。這表明整合轉移性前列腺癌的基因組圖譜來分層原發(fā)性前列腺癌患者的轉移風險可以為更精確的診斷和預后提供額外的維度。
Jiang, B., Mu, Q., Qiu, F. et al. Machine learning of genomic features in organotropic metastases stratifies progression risk of primary tumors. Nat Commun 12, 6692 (2021). https://doi.org/10.1038/s41467-021-27017-w