大家好!今天給大家介紹一篇2021年發表在frontiers in Cell and Developmental(IF:6.684)上的文章。作者使用免疫細胞浸潤水平和隨機森林構建了可以準確鑒別骨相關惡性腫瘤的診斷模型。

Application of Immune Infiltration Signature and Machine Learning Model in the Differential Diagnosis and Prognosis of Bone-Related Malignancies
使用免疫浸潤特征和機器學習鑒定骨相關惡性腫瘤的診斷和預后特征
摘要:
骨相關惡性腫瘤,如骨肉瘤(OS),尤文氏肉瘤(EW),多發性骨髓瘤(MM)和骨轉移癌癥(MM)具有類似的組織學特征,但他們的起源和生物學行為不同。作者認為四種最常見的骨轉移相關惡性腫瘤具有相似的免疫浸潤微環境,可以用于腫瘤診斷和預后。作者對22個公開數據集進行ssGSEA分析研究腫瘤免疫微環境,使用隨機森林構建診斷模型,準確率高于97%。對骨肉瘤和尤文氏肉瘤患者的免疫微環境進行統計學分析發現骨相關腫瘤的免疫微環境存在顯著差異。尤文氏肉瘤中多種免疫細胞的高浸潤水平與患者預后較差有關。骨肉瘤中巨噬細胞和B細胞高浸潤水平與患者預后較好有關,而效應記憶CD8 T細胞和2型T輔助細胞與患者化療反應和腫瘤轉移有關。作者的研究表明,基于免疫浸潤微環境的隨機森林診斷模型可以準確診斷骨相關惡性腫瘤。骨肉瘤和尤文氏肉瘤的免疫浸潤微環境與患者預后有關。
材料與方法:
1.基因表達數據預處理:本研究共包括從GEO數據庫和TARGET數據庫下載的22個基因表達和臨床數據集。從數據集中過濾掉細胞系樣本,重復樣本和正常樣本,僅保留原發骨腫瘤和骨轉移樣本。隨后,對表達數據進行歸一化和批處理。
2.免疫浸潤微環境:對基因表達數據進行ssGSEA分析,研究28種免疫細胞的浸潤水平。
3.構建診斷模型:將本研究數據集分為訓練集,測試集和驗證集,訓練集包括998例樣本,測試集包括386例樣本,驗證集包括74個樣本。使用R包RandomForest對訓練集建模,ntree參數取值為10-500,mtry參數取值為0-15,并為參數進行優化。使用測試集和驗證集驗證模型性能并繪制ROC曲線。
4.統計和生存分析:使用R包stats進行t-test和ANOVA 檢驗。使用單因素Cox分析和KM分析對TARGET OS,GSE21257,GSE16091,GSE29055,GSE17618和GSE63157數據集進行預后分析。
結果:
1.免疫細胞浸潤水平
1459個樣本的28種免疫細胞富集打分如圖1A所示,結果表明這四種腫瘤中均存在28種免疫細胞并且相同腫瘤內和不同腫瘤中存在相同的富集趨勢。為研究不同腫瘤中各個免疫細胞浸潤水平的差異,作者進行ANOVA分析(圖1B)。MM樣本中B細胞的ES打分顯著升高,CD56 dim NK細胞,巨噬細胞和Treg細胞富集于OS樣本中,BM樣本中T細胞,B細胞和漿細胞樣樹突細胞的浸潤比例較高。不同腫瘤中免疫細胞的相關性分析如圖1C所示。OS和EW樣本中大部分免疫細胞正相關,而MM樣本中免疫細胞相關性較差,BM樣本的免疫細胞相關性較為復雜。此外,根據各個樣本的ES打分繪制配對圖,根據激活B細胞和未成熟B細胞的富集打分可以區分MM樣本和其他樣本(圖2)。以上結果表明,這四種腫瘤的免疫浸潤微環境存在顯著差異,可以根據免疫微環境進行差異診斷。


2.開發診斷模型
作者使用隨機森林和998例訓練集樣本構建多類別的診斷模型。為檢驗分類模型的性能繪制MDS圖,結果表明基于免疫浸潤水平可以區分大部分樣本(圖3A)。隨后,對模型參數進行優化,當ntree=150,mtry=5時,診斷模型的性能較好,OOB錯誤率為2.3%(圖3B和3C)。當繼續增加ntree時對模型性能沒有顯著影響,而增加mtry會降低模型精度。為進一步確定模型中起到關鍵作用的因素,繪制變量重要性直方圖(圖3D)。在28種免疫細胞的富集打分中,單核細胞,CD56dim NK細胞和活化B細胞對模型準確性的貢獻最大。

4.診斷模型驗證
作者使用測試數據集中的387例樣本進行內部驗證,準確度為97.42%,對BM,EW,MM和OS的敏感性為0.828,0.954,1和0.992,靈敏度為1,0.997,0.996和0.970。RF模型和5個免疫細胞ES打分的ROC曲線如圖4A-4D所示,其中RF模型的性能較好。此外,使用74個樣本的驗證集對RF模型進行驗證(圖4E-4H),精確度為98.65%,BM,EW,MM和OS的靈敏度為1,1,0.941和1,特異性為1,0.984,1和1。表1為訓練集,測試集和驗證集的F1值,精確度和召回率。


5.OS和EW的免疫浸潤打分的預后價值
作者對包含生存數據的6個數據集進行Cox回歸分析,OS和EW樣本的免疫細胞打分的單因素Cox值如圖5A所示。將ES打分中位數作為閾值,對6個數據集進行KM分析。4個OS數據集中,巨噬細胞與患者生存期有關(圖5B1-圖5B4),而對于活化B細胞來說,僅GSE39055數據集的KM具有顯著差異(圖5B1-圖5B4),CD56dim NK細胞與生存期的關系如圖5D1和圖5D2所示。對OS全部數據集進行KM分析,巨噬細胞和活化B細胞的ES打分與OS患者生存期正相關(圖5E和5F),而對EW患者來說有17種免疫細胞與EW患者生存期負相關(圖5G)。

為進一步研究免疫浸潤打分與患者臨床特征的相關性,作者對不同亞組進行t檢驗。結果表明,在男性患者和女性患者中CD4 T細胞浸潤水平存在差異而其他免疫細胞浸潤水平沒有顯著差異。根據患者年齡將患者分為青年組和老年組,青年組中有26種免疫細胞浸潤水平較低。此外,根據腫瘤壞死率90%將患者分為Huvos Ⅰ/Ⅱ組和Ⅲ/Ⅳ組,Ⅲ/Ⅳ組中CD8 T細胞,肥大細胞和2型Treg細胞浸潤水平較高(圖6)。

結論:
本研究表明基于免疫細胞浸潤水平的隨機森林診斷模型可以準確診斷骨相關惡性腫瘤。骨肉瘤和尤文氏肉瘤的免疫浸潤微環境對患者預后具有重要影響。抑制尤文氏肉瘤的高炎性環境和促進骨肉瘤巨噬細胞和B細胞浸潤水平有可能成為一種新的輔助治療手段。本文以免疫細胞浸潤水平為切入點并使用隨機森林構建診斷模型,此外還鑒定到了與患者預后相關的免疫細胞,本研究的分析方法和分析內容都十分簡單,值得小伙伴借鑒~