今天小編要和大家分享一篇今年9月發表在 Briefings in Bioinformatics (IF:11.622)雜志上關于干性的預后分析文章。
Characterization of gastric cancer stem-like molecular features, immune and pharmacogenomic landscapes
胃癌類干性分子特征、免疫及藥物基因組學圖譜
一.研究背景
癌癥干細胞(CSCs)假說定義其為腫瘤細胞的一個亞群,該亞群通過分化和自我更新來維持腫瘤異質性,從而促進腫瘤生長和治療耐藥,這可能會對預后和免疫治療產生重要影響。然而,目前針對胃癌類干性細胞(GCSC)微環境圖譜的認識還有待于進一步的提高。因此今天小編和大家分享的文章就針對胃癌的類干性分子特征、免疫及藥物基因組學圖譜進行了分析。
二.數據及方法
1. 數據的收集及處理:研究中作者收集了五個原發性胃癌的隊列,包括來自GEO的四個芯片數據集及TCGA的RNA-seq數據集。作者也回顧性的分析了來自六個數據集的免疫治療基因表達譜。以及包括GSE91061、GSE78220、PRJEB25780及PRJEB23790的轉錄組數據,研究也收集了IMvigor210隊列以及 MGSP。研究也收集了來自武漢大學中南醫院的96例根治性胃癌切除術患者的原發性胃癌組織樣本及手術數據。同時研究也收集了三個具有正常和類干性特征的癌細胞系的隊列:GSE112631、GSE36821和GSE130575。作者也獲取了相關數據的臨床數據及腫瘤突變負荷、新抗原負載、同源重組修復以及雜合缺失等數據。
2. 選擇候選基因及構建GCSC相關得分:研究利用一類邏輯回歸(OCLR)評估每個胃癌樣本表達譜的mRNAsi,其能夠用來衡量樣本的干性程度。使用KM分析評估預后。使用加權基因共表達網絡分析(WGCNA)識別與mRNAsi相關的基因模塊。接下來應用Cox回歸模型及LASSO構建預后模型,最終識別到五個基因構建了GCScore得分。
3. 功能及通路富集分析:分析中使用clusterProfiler對基因進行GO及KEGG注釋。同時也進行了GSEA及GSVA分析確定不同組的上調及下調通路。
三.研究的主要內容及結果
1. 評估mRNAsi及識別最顯著基因
在文章的第一部分作者首先介紹了研究的流程(圖1A),接著使用一類邏輯回歸算法(OCLR)評估了GSE62254隊列的mRNAsi,如圖1B所示,可以觀察高mRNAsi患者傾向于晚期,且與更差的預后及微衛星穩定(MSS)亞型有關。接著作者使用KM分析評估了mRNAsi的預后價值如圖1C所示。 作者也使用WGCNA確定了CSC相關基因,這些基因被聚類到27個模塊,作者選擇了與mRNAsi最相關的模塊,并識別mRNAsi組中的關鍵基因。

2. 在胃癌隊列中構建及驗證基于五個基因的GCScore
在文章的第二部分,作者對前面識別的關鍵基因應用LASSO COX及十倍交叉驗證來產生預測基因,并評估了每個模塊的頻率,如圖2A所示最終得到的最優模塊包含五個基因。接著作者基于這五個hub基因通過無監督聚類將TCGA STAD隊列分成兩類(圖2B)。作者通過K-M分析發現這兩類的OS具有差異(圖2C),這也證明了這五個基因對于胃癌的預后能力。接下來作者收集了獨立的正常及類干性癌細胞系的基因表達數據集,并基于這五個基因評估了每個樣本的CSC得分。結果發現具有干性特征的樣本展示出了更高的CSC得分(圖2D)。這些結果也暗示了這五個基因的魯棒性。作者將最終構建的signature命名為GCScore,其是由這五個GCS相關基因的mRNA表達水平及風險系數得到的。接下來作者將GSE62254隊列基于GCScore分成兩組,同時其他隊列作為獨立測試集。圖2E展示了訓練集中這五個基因與GCScore的相關性網絡。作者發現在訓練集中,高GCScore組有更差的預后(圖3A)。圖3B展示了患者的GCScore分布及其與生存時間的相關性,圖3C則展示了ROC曲線。接著作者又進行多因素分析對風險得分的獨立性進行了驗證(圖3D)。圖3E展示了GCScore在測試集中的效能,同時在中南隊列中GCScore也展示出了預后效能(圖3F,G)。


3. GCScore相關的腫瘤分子特征
在文章的第三部分,作者為了刻畫GSE62254隊列中預后不良的高GCScore組相關的表型,作者對高的分組相對于低的分組基因排序執行了GSEA分析(圖4A)。接著作者為了驗證GCScore的準確性,選擇了一些代表性的CSC markers,結果發現GCScore與它們的表達水平相關(圖4B)。接下來作者選擇top1000的差異基因進行GO及KEGG分析,發現富集結果與CSC相關(圖4C)。圖4D的熱圖展示了高GCScore組與CSC激活更相關。接著作者對TCGA-STAD隊列高低組進行了富集分析,結果如圖4E,F所示。

4. 高低GCScore患者之間的免疫細胞浸潤
研究已經發現TME中的免疫浸潤細胞可以調控腫瘤表型。因此在文章的第四部分作者對高低GCScore患者之間的免疫細胞浸潤進行了分析。研究使用ESTIMATE評估所有GSE62254樣本的基質及免疫細胞浸潤。結果發現高GCScore組展示出更低的基質及免疫細胞豐度,這揭示了GCScore與腫瘤純度相關(圖5A)。接著作者為了進一步刻畫免疫細胞,使用CIBERSORT算法推斷GSE62254隊列中高低GCScore患者的細胞豐度,結果觀察到高GCScore組與高水平的激活適應性免疫細胞及如M2巨噬細胞等免疫抑制細胞有關(圖5B,C)。

5. 浸潤邊緣的CD206+ TAMs增強了胃癌細胞干細胞特征
在這一部分作者為了進一步探索能夠影響CSC特征和預后的M2巨噬細胞亞型,分析了GSE622545隊列中GCScore及M2巨噬細胞的代表性markers之間的關系,結果發現GCS與CD206顯著相關。接下來作者為了進一步確定TME中能夠影響干細胞比例的不同TAMs分布,首先在中南隊列結合免疫組化實驗驗證蛋白質水平,結果發現在浸潤邊緣(IM)區域高GCScore指向一個更高CD206+TAM比例,而在腫瘤區域沒有觀察到這個現象,作者接著使用關聯分析進一步驗證這一現象。
6. GCScore與內在免疫逃逸機制的關聯
在這一部分,作者對免疫逃逸機制與GCScore之間的關聯進行了分析。首先作者使用IPS得分評估不同GCScore組中免疫治療的免疫系統激活,結果與ESTIMATE結果一致,高GCScore組展示出更高的抑制細胞得分及更低的抗原呈遞得分(圖6A)。接下來作者進一步比較高低GCScore組中癌癥免疫相關panel基因的表達水平(圖6B)。作者分析也發現CD276、VISTA及PDL2展示出與GCScore得分顯著相關(圖6C)。接下來作者探索了GCScore和TCGA隊列中包括腫瘤突變負荷、新抗原負載、同源重組缺陷、雜合缺失及CT抗原水平在內的腫瘤免疫原性之間的關系,結果如圖6D所示。

7. GCScore能夠預測治療應答
在這一部分,作者進一步探索GCScore是否能夠預測患者的免疫治療獲益,作者將接受免疫治療的五個隊列患者分為高低GCScore組,結果發現高GCScore組的預后更差(圖A,B)。接下來作者評估了不同免疫治療應答組中GCScore得分的分布發現應答差的患者中得分更高(圖7C),作者也觀察到TMB及TNB結合GCScore會提高免疫應答預測率(圖7D)。此外,GCScore的預測值也遠超PD-L1(圖7E),作者也驗證了GCScore的預后預測價值。在IMvigor210及MGSP隊列中也觀察到高GCScore組展示出TAAS組表達更低(圖7G),而GCScore高的組中PD-L1表達也更低(圖7 H)。作者還分析了已知的免疫治療相關基因發現高CSC表型與EMT狀態、CD8+ T細胞減少和增加TAMs浸潤密切相關(圖7I)。

8. GCScore相關的潛在藥物靶點和治療化合物
在文章的最后一部分,作者為了識別高GCScore患者的治療靶點,收集了2250個相關的化合物靶點并進一步結合關聯分析識別了1215個潛在靶點(圖8A)。接著作者通過胃癌細胞系分析了CERES得分及GCScore的相關性進一步識別靶點(圖8B)。這兩步分析作者識別到了四個潛在的治療靶點。接下來作者分析CTRP、GDSC及PRISM數據庫識別候選藥物,圖8C展示了CTRP相關的化合物,圖8D展示了PRISM相關的化合物,而圖8E展示了GDSC相關的化合物。作者也分析了這些化合物的信號通路及治療靶點結果如圖8F所示。此外作者也在細胞系中進行了藥物敏感性實驗進一步驗證(圖8G)。

到這里這篇文章的主要內容就介紹完了,文章中構建了干性相關風險得分,盡管是經典的預后模型思路,但文章納入了多套數據集,并結合免疫、藥物等多個角度對風險得分進行刻畫,使文章內容充實。可見在預后模型中結合多角度刻畫使工作豐富會非常加分呀。