腫瘤微環境研究一直是腫瘤研究的熱點,一些研究發現腫瘤微環境可能會影響結直腸癌的分類及藥物敏感性。因此,今天小編要和大家分享的是今年2月份發表在npj Precision Oncology(IF:8.25)雜志上的一篇將腫瘤微環境與耐藥相結合分析的文章,最終作者識別出了預測結直腸癌患者化療耐藥的腫瘤微環境特異性基因表達特征。腫瘤微環境加耐藥又一個癌癥分析新思路,小伙伴們一起get起來吧!
A tumor microenvironment-specific gene expression signature predicts chemotherapy resistance in colorectal cancer patients
預測結直腸癌患者化療耐藥的腫瘤微環境特異性基因表達特征
Jing PMID: 33580207 2021/02/12 npj Precision Oncology(IF:8.25)
一、研究背景
研究已經發現結直腸癌(Colorectal cancer, CRC)是一種異質性很強的疾病,它具有獨特的分子發病機制、組織發生和藥物敏感性。此外,也有研究表明,腫瘤微環境(TME)與結直腸癌(CRC)的藥物敏感性和分類密切相關。然而,目前使用TME特異性基因特征來識別具有獨特臨床相關性的CRC亞型的分析比較少。因此,今天小編和大家分享的文章將腫瘤微環境與耐藥相結合,來對結直腸癌患者進行分型及多角度分析。
二、研究數據及方法
1. CRC數據收集和候選基因選擇:作者從TCGA及GEO收集公開數據集。使用GSE39395、GSE39396和GSE62080三個數據集構建SFM特征。研究中使用五個scRNA-seq數據用于SMF驗證,包括CCR的GSE81861,HNSCC的GSE103322,黑色素瘤的GSE72056,以及BRCA的GSE75688。此外,研究中也使用了一些數據集探索藥物反應,包括合并GSE19860, GSE28702和GSE69657分析FOLFOX反應;用GSE104645和GSE72970分析FOLFOX或FOLFIRI反應;以及使用GSE5851和PRJEB34338對cetuximab的反應進行分析。接下來利用GSE39395、GSE39396和GSE62080三個數據集進行差異表達分析,構建了可區分TME并與FOLFIRI敏感性相關的SFM特征。在GSE39395和GSE39396中,使用FACS分別從8個和6個樣本中分離了細胞亞群。GSE62080數據集包含9個FOLFIRI應答者和12個無應答者的轉錄組數據。作者也對GSE39395和GSE39396的兩個細胞群進行了差異表達分析。GSE39396也采用了類似的策略。對于GSE62080,直接在FOLFIRI有應答者和無應答者之間進行差異表達分析。最后,將這三個數據集之間的差異表達基因取交集,進一步稱為SFM基因特征。GSE39582由566個CRC樣本組成,作為發現數據集。為了構建大數據集進行驗證,將GSE14333、GSE17536、GSE17537、GSE33113和GSE37892作為一個單元,即5個GEO batch數據集。另外,作者直接從CRCSC下載了577份TCGA CRC基因表達譜。這個TCGA數據被用作第二個驗證數據集。另53例CRC樣本來自仁濟醫院。研究中的臨床數據直接從相應的GEO網站下載或相關文獻的補充資料獲取。TCGA CRCs的臨床信息從數據庫CRCSC中下載,免疫相關特征從最近的一項公共研究中下載。
2. 使用K-means聚類算法識別SFM亞型:作者首先在SFM的基礎上,利用K-means聚類算法對GSE39582數據集進行SFM亞型識別。在這些聚類中,k = 6是最好的。然后作者評估了SFM亞型間的相似性和表達差異。為了驗證SFM亞型的魯棒性,作者進一步在驗證數據集中進行了相同的分析。
3. SFM亞型的功能及通路富集:為了發現SFM亞型間的信號通路異常,作者對每個SFM亞型與發現隊列中的其他亞型進行了差異表達分析,并選擇2000個上調和下調表達的基因在每個SFM亞型中進行進一步分析。即將這些基因應用于ClueGO和CluePedia插件。這兩個插件可以提取一組基因的非冗余生物信息。研究采用Cytoscape對基因腫瘤學(GO、BP、CC、MF、免疫系統過程)和KEGG進行功能富集分析。
4. NTP 實現及特征應用:使用GenePattern執行基于NTP的分類。NTP采用最近鄰方法計算基因表達譜與參考基因表達特征的相似性。然后通過對基因空間進行隨機子抽樣來評估相似性系數的零分布。最后,將由給定基因特征得到的相似系數與零分布進行比較。接下來作者也評估了SFM亞型與一組基因特征的關聯。來自以前發表的論文的基因特征列表為:腸道干細胞特征、結腸隱窩特征、鋸齒狀CRC特征、EMT特征、FOLFIRI應答特征、FOLFOX應答特征和VEFG/EGFR抑制劑特征。
5. 細胞浸潤評估:研究使用CIBERSORT算法來估計CRC樣本中的免疫細胞浸潤。此外,作者還使用微環境細胞群(MCP)計數算法來估計基質細胞和內皮細胞的比例。
6. 生存分析:研究中生存分析采用Kaplan-Meier算法。采用log-rank檢驗計算SFM亞型間差異的P值。Cox比例風險回歸構建單變量和多變量Cox模型。
7. 單樣本基因集合富集分析:在本研究中,作者采用了ssGSEA在3個數據集中評估了SFM亞型的EGFR基因集活性。EGFR基因集由EGFR通路相關的配體或受體組成。此外,作者還在4個單細胞數據集中對TGF -beta應答、耗竭的T細胞、熱腫瘤、IPRES特征和SFM基因特征等進行了類似的分析。
8. Oncotype DX:基于12 mRNA的Oncotype DX結腸癌復發評分是基于1851例II期和III期結腸癌的轉錄組數據建立的。它已經被認為是CRC的一個獨立預后因素。為了證實SFM亞型的預后價值,作者提出在單因素和多因素Cox回歸模型中,將SFM亞型Oncotype DX與DFS聯系起來。結果發現所有病例證實了Oncotype DX與DFS的相關性。
9. 采用PathSeq算法進行微生物檢測:PathSeq算法可以根據人體組織RNA測序和WGS的深度測序數據來識別微生物。通過PathSeq方法,作者獲得了429份CRC樣本中1093個微生物的相對豐度,其中415個樣本進行了SFM亞型注釋并進行分析。
三、研究的主要內容及結果
1. 與TME相關的化療耐藥基因特征
在文章的第一部分,作者對TME相關的化療耐藥基因特征進行了分析。研究共納入2269例結直腸癌患者的整體基因表達譜。作者首先確定了涉及FOLFIRI應答的896個探針集,接著識別了在TME成分中具有顯著區別性表達的基因。將差異探針重疊后,獲得了317個探針,它們與250個獨特基因相對應(圖1a),并將此基因特征稱為“與FOLFIRI耐藥和微環境相關的特征”(SFM)。為了證實SFM特征可以區分TME,作者將SFM特征應用于4個scRNA-seq數據集。結果t-SNE圖顯示,在所有4個scRNA-seq數據集中,SFM形成了對應于不同細胞類型的不同簇,表明SFM具有普遍的分辨TME的能力(圖1b-e)。此外,作者還發現不同來源的惡性細胞也能形成不同的簇,而非惡性細胞無論來源如何都能聚集在一起,這表明正常細胞的SFM表達在患者間沒有很強的異質性。接下來,研究評估了9個發表的基因特征與SFM的重疊,發現其中一些基因特征有很大的重疊(圖1f)。然而,SFM與其他基因特征的重疊非常有限(圖1 g)。

2. CRC亞型的k-均值聚類
這一部分作者檢驗SFM是否能夠對CRC亞型進行分類,使用k-means聚類算法對發現數據集(GSE39582)使用SFM進行分類。確定了6個亞型,并將其稱為從SFM-A到SFM- F的CRC SFM亞型。并對SFM分類的魯棒性在其他隊列驗證??梢杂^察到,在三個大數據集中,每個亞型的比例是相似的(圖1h)。
3. SFM亞型的主要特性
接下來作者刻畫了SFM亞型的主要特性。分析發現SFM亞型與獨特的臨床病理、分子和表型特征以及基因特征和信號通路的特異性富集有關,例如可以發現在每個SFM類中II和III階段的比例高于I和IV階段(圖1i);SFM - E和SFM-F中IV期比例較高;TP53在SFM-B和SFM-D中突變頻率更高,而KRAS突變多發生在SFM-A中等。在致癌突變方面,作者進一步聚焦TCGA數據集中的95個CRC驅動突變,發現SFM-C和SFM-D有超過7個驅動基因突變的樣本比例更高。SFM亞型中有53個基因突變狀態存在顯著差異。接下來作者利用先前報道的基因特征,基于NTP算法來識別SFM亞型的細胞和前體起源。此外,作者還分析了每個SFM亞型中異常調節的信號通路。對每個SFM亞型的2000個上、下調基因進行分析。
4. SFM亞型預測化療反應
在這一部分作者對SFM亞型預測化療反應進行了分析。由于SFM特征與來自GSE62080的FOLFIRI敏感性相關,作者首先在GSE62080數據集中使用SFM特征進行K-means聚類,以檢驗SFM亞型是否與藥物反應相關。結果顯示,21例GSE62080病例可分為四種SFM亞型(圖2a)。分析發現SFM-E和SFM-F對FOLFIRI均有應答。SFM-A和SFM-B對FOLFIRI均有抗性。為了全面比較SFM亞型之間的藥物反應差異,作者使用NTP算法將先前的藥物基因特征應用于基因表達譜,包括FOLFIRI、FOLFOX和血管內皮生長因子(VEGF)或表皮生長因子受體(EGFR)抑制劑。結果發現SFM亞型間藥物敏感性差異顯著(圖2c)。此外,作者發現大多數SFM-A和SFM-B顯著性與EGFR抑制劑相關(圖2 c),其他藥物也可觀察到類似的結果。接下來作者納入KRAS野生型樣本,以進一步驗證西妥昔單抗對SFM亞型的敏感性。結果再次發現SFM-A-B-E可以預測西妥昔單抗的反應(圖2d)。此外,一些與EGFR通路活性相關的基因被認為與西妥昔單抗反應有關。同樣,該特異性基因集在SFM-A-B-E亞型中表現出較高的表達(圖2e、f)??傊?,這些發現表明,無論KRAS表型如何,SFM亞型都具有西妥昔單抗應答的預測價值。

5. SFM亞型中不同的TME
由于SFM特征可以區分TME,作者這一部分比較了SFM亞型之間的TME。首先,作者利用CIBERSORT方法研究了SFM亞型間的細胞組分。結果發現SFM亞型顯示不同的免疫細胞的數量(圖3)。研究也發現SFM-C-F中檢查點生物標志物高表達,包括CD274、PDCD1和CTLA4(圖3l,n)。這表明SFM-C-F具有抑制T細胞的作用。SFM-C和F均為熱性腫瘤,對IFN-γ反應有應答(圖3o, p)。而SFM-F富含天然抗PD1抵抗(IPRES)基因特征(圖3q, r),表現出較高的IPRES評分,這意味著SFM-F具有免疫治療無應答的特征。以上結果表明,雖然SFM-C和-F對T細胞具有抑制作用,但它們對免疫治療的反應不同。這可能是因為SFM-C富集MSI表型,免疫抑制劑可阻斷免疫抑制,而SFM-F富集基質/EMT表型,也可導致免疫抑制,但免疫抑制劑不能逆轉。

6. SFM亞型是CRC的獨立預測因子
這一部分作者檢測了SFM亞型與生存的關系,以檢驗其預后價值。結果發現SFM亞型與DFS或OS顯著相關(圖4a-d),且SFM-E和SFM-F的預后較差。作者將SFM-E和SFM-F作為一個單獨的高危組與其余4個進行對比來證實這一點,結果二分類器如預期的那樣顯示出很強的預后價值。此外,作者根據現有的放化療信息劃分發現SFM亞型在非放化療患者中具有顯著的預后價值,但在放化療患者中沒有。接下來作者使用二元分類器進行類似的分析,發現非放化療患者中高危組預后更差,而放化療組沒有。由于Oncotype DX復發率評分被認為是結腸癌的預后分類器,作者在聯合數據集中評估了其預后價值,然后比較SFM亞型與Oncotype DX分類器的亞型比例,結果發現,經Oncotype DX分類器識別的多數高危病例和中危病例可歸為SFM高危組(圖4 g,h),這表明SFM亞型具有良好的預后價值。此外,在單變量Cox回歸分析中,大多數分類器至少有一個具有顯著差異的亞型,然而,當對每個分子亞型進行多變量Cox回歸分析時,根據年齡、性別等進行調整,SFM、CMS、CCS亞型仍有顯著差異。CCS3亞型有最強的預后價值,其次是SFM-F和SFM-E。

7. SFM亞型間不同的腸道微生物組模式
最后作者分析了SFM亞型間不同的腸道微生物模式。作者在TCGA隊列中執行了PathSeq算法。在415個CRC亞型注釋的病例中,獲得了物種水平上1093種微生物的相對豐度值,發現幾乎每個SFM亞型都有不同的細菌群落(圖5)。

這篇文章的主要內容就介紹完了,總結一下,分析中作者結合多個公共平臺數據,構建了一個新的CRC分類器,將其分為6個分子亞型,這個SFM特征能夠區分TME,并與藥物反應相關。此外,這種基因特征可以解析CRC的異質性,而這些SFM亞型有助于提高CRC的精準治療。總的來看,研究對多平臺大樣本的結直腸癌樣本進行分析,聚焦腫瘤微環境與耐藥特征進行純生物信息分型分析,這種將腫瘤微環境與耐藥相結合的研究角度及涉及到的分析方法,小伙伴們可以學習參考呦。