很多研究都聚焦于開發疾病分類預測模型,除了對模型進行效能評估外,還可以從哪些角度為模型加分,提高工作質量呢?今天小編給大家分享一篇2022年12月發表在Cancer Cell(IF:38.585)雜志上使用多組學數據進行乳腺導管原位癌分型的文章,相信小伙伴們看完應該能找到一些答案。文章開發了一個預測DCIS復發的分類器,并對復發相關的通路、表達模式及免疫細胞組成進行了全面分析。文章內容豐富,邏輯清晰,感興趣的小伙伴們不要錯過呀!
Molecular classification and biomarkers of clinical outcome in breast ductal carcinoma in situ: Analysis of TBCRC 038 and RAHBT cohorts
基于TBCRC038和RAHBT隊列分析乳腺導管原位癌的分子分類和臨床結局生物標志物
一.研究背景
癌前病變是侵襲性疾病的前體,研究癌前病變對探索癌癥發展的分子過程和進化動力至關重要。研究發現導管原位癌(DCIS)是浸潤性乳腺癌(IBC)中最普遍的早期病變,具有不同的進展傾向。此外,DCIS也由不同的病變組成,具有很強的異質性及較高的進展風險。因此研究DCIS可能的進展,能夠減少婦女不必要的治療。
二.文章摘要
研究對來自轉化乳腺癌研究聯盟038研究(Translational Breast Cancer Research Consortium;TBCRC 038)和檔案乳腺組織資源(Resource of Archival Breast Tissue; RAHBT)隊列的542位患者的774例DCIS樣本的多組學數據進行了分析。結果研究識別了812個與治療后5年內同側復發相關的基因,并基于這些基因開發了一個預測DCIS復發的分類器。此外,研究也對復發相關的通路、表達模式及免疫細胞組成等進行了分析。
三.研究的主要內容及結果
1. 研究的主要流程及隊列
文章首先對研究的主要流程及隊列進行了介紹。研究納入了RAHBT及TBCRC兩個回顧性隊列,隊列中包括對照組及病例組,而病例組中的患者最初被診斷為DCIS,有的后續發生了同側乳腺病變(iBE, 包括DCIS 或 IBC),有的未復發。RAHBT隊列有97例患者用于結果分析,而TBCRC隊列則包括216例患者,表1對RAHBT和TBCRC隊列進行了概括。圖1則展示了本研究的隊列和主要的分析流程。


2. 預測早期復發的預后分類器
這一部分研究對構建的預測早期復發的分類器進行了介紹。作者首先識別了TBCRC隊列中復發與非復發樣本的差異表達基因,來識別與臨床結局相關的基因(圖2A)。接著研究使用這些差異基因在TBCRC中訓練了一個隨機森林分類器,并在RAHBT隊列中對分類器進行了驗證(圖2B)。研究觀察到分類器能夠顯著預測兩個隊列中的iBE(圖2C)。此外,研究也發現在整個隨訪時間內,該分類器也是iBE的顯著預測因素(圖2D和2E)。接下來,作者使用多因素分析發現在兩個隊列中該分類器都具有顯著的預后價值(圖2F和2G)。接著為了進一步分析樣本通路的激活狀態,研究進行了基因集變異分析(GSVA),結果發現MYC和mTORc1信號在病例組中增加,并具有強相關性(圖3A-3C)。


3. DCIS RNA聚類識別驅動臨床結局的模塊
在這一部分研究對驅動臨床結局的模塊進行了識別。研究使用非負矩陣分解(NMF)對兩個隊列進行聚類識別了三個亞群。研究發現在這兩個隊列中亞群1與亞群2和3相比,ERBB2表達顯著升高,而ESR1表達顯著降低(圖4A和4B)。研究將這三個亞群分別命名為ERlow、quiescent和ERhigh。接下來為了進一步對這些亞群進行刻畫,作者進行了差異分析,將每個亞群與其他兩個亞群進行比較,結果觀察到ERhigh組和ERlow組間雌激素反應存在差異(圖4C)。接下來作者對患者的MIBI蛋白表達進行了分析,結果發現quiescent亞群和ERhigh亞群中ER+腫瘤細胞的頻率明顯高于ERlow亞群,而HER2+腫瘤細胞在ERlow亞群中顯著升高(圖4D)。此外,研究也觀察到quiescent亞群與ERhigh和ERlow相比具有較低的增殖能力和代謝活性(圖4D和4E),且ERhigh組的肌上皮鈣粘蛋白明顯高于ERlow和quiescent組(圖4F)。

4. DCIS中復發的IBC具有高危特征的擴增
接下來作者對參與DCIS復發的拷貝數變異(CNA)進行了分析。研究首先在兩個隊列中識別了29個與復發相關的CNAs(圖5A)。接下來,研究分析了基因組拷貝數改變比例(PGA)在5年臨床結局組或分類器風險組中的分布是否有偏倚,結果沒有發現顯著的差異(圖5B-5C)。研究也在TBCRC和RAHBT隊列使用基于CNA的無監督NMF聚類,識別了8個亞群(圖5D),其中CNA亞群1具有chr20q13.2擴增的特征(圖5E)。接著研究對這8個CNA亞群的富集通路進行了分析,結果發現亞群6和7富集到了多個復發相關的通路,而亞群8 則相反(圖5F)。

5. DCIS具有不同的免疫和成纖維細胞狀態
在文章的最后一部分研究對腫瘤微環境的表型進行了刻畫。研究使用RNA數據進行了聚類識別了4個DCIS基質亞群(圖6A),并篩選了差異基因(圖6B)。此外,研究也進行了通路分析(圖6C),同時研究了MIBI蛋白表達和細胞類型分布(圖6D)情況,并進一步刻畫了亞群中細胞的分布情況(圖6E)。結果研究發現成纖維細胞狀態和免疫細胞密度具有強相關性,其中CD4+ T細胞、髓系細胞和漿細胞樣樹突狀細胞(pDC)、單核細胞、巨噬細胞的水平與對照組相比顯著升高(圖6G)。

到這里這篇文章的主要內容就介紹完了。文章聚焦于乳腺導管原位癌,構建了一個預測其復發的分類器,并結合多組學數據對乳腺導管原位癌復發的分子特征及臨床結局進行了詳細刻畫。文章的核心是構建分類器,并從功能及免疫等多個角度對結果進行全面深入的解析,這種寫文章的角度十分值得小伙伴們參考學習。