腫瘤分型對于惡性腫瘤生物學(xué)行為和預(yù)后評估至關(guān)重要,同時(shí)也有助于個(gè)體化治療,因此一直是腫瘤研究的一個(gè)熱點(diǎn)方向。在分型研究中,選好關(guān)注角度,對后續(xù)研究,以及結(jié)果刻畫至關(guān)重要。生信人也介紹了多個(gè)腫瘤分型相關(guān)的文章及思路,小編今天就再和大家分享一篇今年7月8日剛剛發(fā)表在Genome Medicine(IF:15.266)雜志上的關(guān)于肺鱗癌分型與免疫治療的文章。文章采用的分型方法是經(jīng)典的非負(fù)矩陣分解(NMF),但關(guān)注了免疫治療耐藥性,并結(jié)合多組學(xué)數(shù)據(jù),使文章思路新穎,內(nèi)容豐富。做分型的小伙伴一定不要錯(cuò)過這篇文章呀。
Identifcation of a cytokine-dominated immunosuppressive class in squamous cell lung carcinoma with implications for immunotherapy resistance
識別鱗狀細(xì)胞肺癌中以細(xì)胞因子為主的免疫抑制類與免疫治療耐藥性的關(guān)系
一.研究背景
肺癌是世界范圍內(nèi)最常見的癌癥,也是癌癥相關(guān)死亡的主要原因。其中非小細(xì)胞肺癌(Non-smallcell lung cancer, NSCLC)約占肺癌患者的85%。除肺腺癌外,肺鱗癌(lung squamous carcinoma, LUSC)是NSCLC最常見的組織學(xué)亞型。目前免疫檢查點(diǎn)阻斷(ICB)療法顯著改善了肺鱗癌(LUSC)的治療。然而,仍然存在相當(dāng)一部分高PD-L1表達(dá)患者對免疫檢查點(diǎn)抑制劑具有耐藥性。因此,進(jìn)一步了解潛在的耐藥機(jī)制,刻畫免疫抑制腫瘤微環(huán)境和識別生物標(biāo)志物對預(yù)測患者耐藥來說十分有必要。
二.文章摘要
該研究對624例LUSC樣本的RNA測序數(shù)據(jù)進(jìn)行了分析。作者通過無監(jiān)督聚類分析腫瘤微環(huán)境中的基因表達(dá)模式,并將表達(dá)模式與一組T細(xì)胞耗竭特征、免疫抑制細(xì)胞、臨床特征和免疫治療反應(yīng)聯(lián)系起來。使用內(nèi)部和外部測試數(shù)據(jù)集來驗(yàn)證耗竭免疫狀態(tài)的存在。結(jié)果觀察到大約28 - 36%的LUSC患者表現(xiàn)出顯著的T細(xì)胞耗竭特征富集、免疫抑制細(xì)胞比例高、抑制檢查點(diǎn)的共同上調(diào),以及抗炎細(xì)胞因子的表達(dá)增強(qiáng)。作者將這一免疫抑制組患者定義為耗竭免疫類(EIC),作者也觀察到EIC表現(xiàn)出腫瘤浸潤淋巴細(xì)胞密度高,與不良預(yù)后相關(guān)的特征,且盡管EIC PD-L1表達(dá)相對升高,但對ICB治療有潛在的耐藥性。作者也開發(fā)了一個(gè)web應(yīng)用程序,以便研究人員根據(jù)多組學(xué)分析數(shù)據(jù)進(jìn)一步探索ICB耐藥性的潛在關(guān)聯(lián)。
三.?dāng)?shù)據(jù)及方法
1. LUSC數(shù)據(jù)集和資源:作者從TCGA(497個(gè)RNA測序[RNAseq]數(shù)據(jù)集)和GEO(127個(gè)芯片數(shù)據(jù)集)中檢索到624個(gè)人類LUSC樣本的基因表達(dá)譜。由于腫瘤分期的不同會影響臨床特征和治療方案,因此作者將497例TCGA LUSC患者分為晚期組(IIA - IV期,250例患者)進(jìn)行訓(xùn)練和早期組(i - II期,247例患者)進(jìn)行內(nèi)部驗(yàn)證。其他突變、拷貝數(shù)變異、甲基化、臨床病理等相關(guān)數(shù)據(jù)也均從TCGA獲取。同時(shí)作者對蛋白編碼基因數(shù)據(jù)進(jìn)行NMF分析。另外來自GEO的兩個(gè)獨(dú)立數(shù)據(jù)集用作外部驗(yàn)證。作者也從GEO數(shù)據(jù)庫獲取28例黑色素瘤患者樣本(GSE78220)經(jīng)抗PD -1治療后的臨床結(jié)果和基因表達(dá)情況數(shù)據(jù),并基于irRECIST識別應(yīng)答模式。
2. 無監(jiān)督聚類識別耗竭免疫類:作者基于250名訓(xùn)練隊(duì)列的樣本的RNA-seq數(shù)據(jù)使用非負(fù)矩陣分解(NMF)進(jìn)行分析。作者也通過單樣本基因集富集分析(ssGSEA)計(jì)算免疫和基質(zhì)富集評分來揭示免疫和基質(zhì)相關(guān)的表達(dá)模式。接著作者將免疫和基質(zhì)富集分?jǐn)?shù)與NMF識別的簇結(jié)合,觀察到,與其他簇相比簇2具有更高的富集分?jǐn)?shù),因此,作者將第2類稱為“免疫基質(zhì)類”。接下來作者分析了免疫基質(zhì)簇腫瘤中特異性免疫細(xì)胞的豐度,并收集了許多代表各種免疫細(xì)胞的特征,用于ssGSEA計(jì)算富集分?jǐn)?shù)。然后將免疫細(xì)胞的富集分?jǐn)?shù)與簇結(jié)合,以確定免疫基質(zhì)簇中特異性免疫細(xì)胞的豐度。另外,作者也從TIMER數(shù)據(jù)庫中下載了基于基因表達(dá)譜的CIBERSORT算法推斷的22個(gè)浸潤免疫細(xì)胞數(shù)據(jù)。此外,作者從先前研究中下載了樣本的白細(xì)胞分?jǐn)?shù)及腫瘤浸潤淋巴細(xì)胞(TIL)百分?jǐn)?shù)。然后,作者提取TCGA LUSC患者22類浸潤免疫細(xì)胞的分?jǐn)?shù)、白細(xì)胞分?jǐn)?shù)和TIL百分比,比較免疫基質(zhì)簇與其余簇之間的差異。最后,作者對多個(gè)抑制受體進(jìn)行表達(dá)譜分析,并對代表T細(xì)胞耗竭的基因特征進(jìn)行ssGSEA評分,結(jié)果觀察到免疫基質(zhì)簇過表達(dá)多個(gè)抑制受體,并具有高T細(xì)胞耗竭相關(guān)的特征富集分?jǐn)?shù)。因此,作者將免疫基質(zhì)簇群體定義為耗竭免疫類別(EIC),其余群體定義為剩余類別,并使用NMF包裝的extractFeature方法提取相關(guān)基因(宏基因特異性基因)來刻畫EIC的表達(dá)模式。
3. 耗竭免疫類的分子特征:作者采用GSEA和ssGSEA分析EIC中分子通路的富集情況和基因表達(dá)特征。作者從MSigDB獲取hallmark基因集和KEGG通路特征,并利用Cytoscape插件ClueGO生成KEGG通路的功能分組網(wǎng)絡(luò)來分析宏基因特異性基因的生物學(xué)作用。接著為識別EIC組和其他組的差異表達(dá)基因,作者采用DESeq2進(jìn)行基因差異表達(dá)分析,并在宏基因特異性基因中,將EIC與其他類之間的差異表達(dá)基因定義為TCGA訓(xùn)練隊(duì)列中用于識別EIC的耗竭免疫分類基因,同時(shí)使用GSEA識別EIC中富集的激活通路和hallmark基因集。
4. EIC的早期TCGA LUSC內(nèi)部驗(yàn)證:作者為了證實(shí)早期LUSC中存在免疫衰竭狀態(tài),使用上述方法對247個(gè)早期樣本的表達(dá)譜進(jìn)行了NMF和ssGSEA分析。同樣,也獲得了4個(gè)早期LUSC簇。當(dāng)整合早期樣本中用于晚期LUSC隊(duì)列的特征富集分?jǐn)?shù)時(shí),作者觀察到簇2具有更高的免疫細(xì)胞、基質(zhì)和TEX相關(guān)的特征富集分?jǐn)?shù)。因此,簇2在早期被識別為早期LUSC的EIC。作者同樣比較EIC組與其他組的免疫細(xì)胞比例、白細(xì)胞比例、TIL比例和多重抑制受體表達(dá),并通過GSEA識別hallmark富集和KEGG通路。此外,作者使用ssGSEA計(jì)算訓(xùn)練階段獲得的167個(gè)耗竭免疫分類基因的富集分?jǐn)?shù),定義為EIC分?jǐn)?shù),并采用ROC分析評價(jià)其預(yù)測能力。
5. EIC的ICB治療預(yù)測:作者用TIDE算法預(yù)測潛在的ICB治療反應(yīng)。作者還分析了黑素瘤腫瘤表達(dá)的公開數(shù)據(jù)和使用抗PD-1治療的患者的臨床結(jié)果,來驗(yàn)證ICB治療耐藥性與167個(gè)耗竭的免疫分類基因之間的關(guān)聯(lián),即利用167個(gè)耗竭免疫分類基因,通過ssGSEA計(jì)算黑色素瘤腫瘤樣本的EIC評分,并比較應(yīng)答者和無應(yīng)答者。
6. EIC的基因組突變、染色體變異和甲基化分析:作者采用Maftools對體細(xì)胞突變進(jìn)行分析,并統(tǒng)計(jì)體細(xì)胞突變總數(shù),還從先前研究獲取LUSC患者新抗原的統(tǒng)計(jì)信息。作者從cBioPortal for Cancer Genomics數(shù)據(jù)庫中獲取GISTIC2.0生成的TCGA LUSC樣本拷貝數(shù)數(shù)據(jù)。然后,作者評估了EIC與其他類在體細(xì)胞突變、新抗原數(shù)量和拷貝數(shù)變化方面的差異。此外,作者也使用limma包識別EIC和其他類別之間差異甲基化的顯著CpG位點(diǎn)。最后,計(jì)算了啟動子區(qū)域甲基化水平與相應(yīng)基因表達(dá)的相關(guān)性。
7. EIC的獨(dú)立數(shù)據(jù)集驗(yàn)證:作者利用無監(jiān)督隨機(jī)森林方法評估免疫分類基因的魯棒性。基于這些基因的表達(dá)值,使用randomForest R包對訓(xùn)練隊(duì)列進(jìn)行了無監(jiān)督學(xué)習(xí),然后利用NMF在另外兩個(gè)數(shù)據(jù)集上驗(yàn)證了耗竭免疫分類基因預(yù)測耗竭免疫狀態(tài)的能力。
8. 高度可視化的交互式web應(yīng)用程序:基于研究的分析數(shù)據(jù),作者使用R中的' shiny '構(gòu)建了一個(gè)交互式的web應(yīng)用程序,以供其他研究者在多組學(xué)水平上探索免疫治療耐藥性的潛在機(jī)制。web應(yīng)用程序包括幾個(gè)免疫治療耐藥相關(guān)分析模塊,如耗竭免疫分類模塊、特征表達(dá)模塊、體細(xì)胞突變模塊、臨床預(yù)后模塊、microRNA模塊和甲基化模塊。
9. 蛋白表達(dá)分析:作者為研究EIC蛋白表達(dá)的變化,從TCGA下載了319例LUSC患者的蛋白表達(dá)數(shù)據(jù),來比較EIC組與其余組的蛋白表達(dá)。此外,作者通過Human protein Atlas的病理切片探索了蛋白的表達(dá)。
四.研究的主要內(nèi)容與結(jié)果
1. 識別及刻畫晚期LUSC的耗竭免疫類
在文章的第一部分,作者對訓(xùn)練隊(duì)列中250個(gè)晚期LUSC樣本進(jìn)行了NMF分析,訓(xùn)練隊(duì)列的數(shù)據(jù)集被分為四個(gè)表達(dá)簇(圖1A)。作者通過ssGSEA計(jì)算發(fā)現(xiàn)簇2的LUSC患者具有較高的免疫和基質(zhì)富集分?jǐn)?shù),表明免疫細(xì)胞和基質(zhì)成分基因表達(dá)特征顯著富集,作者將這一簇命名為免疫基質(zhì)簇(Fig. 1B),作者發(fā)現(xiàn)免疫基質(zhì)簇具有顯著富集的免疫細(xì)胞特征(圖1C)。接下來,作者為了進(jìn)一步驗(yàn)證這些免疫細(xì)胞在免疫基質(zhì)簇中的富集,比較了CIBERSORT估算的免疫細(xì)胞在免疫基質(zhì)簇和其他簇之間的絕對比例。結(jié)果發(fā)現(xiàn)與ssGSEA富集分析一致(圖1D)。此外,作者也觀察到免疫基質(zhì)簇中DNA甲基化評估的白細(xì)胞比例明顯高于其他簇(圖1E)。同樣,作者通過病理圖像評估的腫瘤浸潤淋巴細(xì)胞(TILs)發(fā)現(xiàn)在免疫基質(zhì)簇中明顯高于其他簇(圖1F)。接下來為了探索LUSC中的TEX,作者對多種抑制受體進(jìn)行了表達(dá)譜分析,結(jié)果發(fā)現(xiàn)這些抑制受體在免疫基質(zhì)簇的樣本中顯著上調(diào)(圖1G),且免疫基質(zhì)簇的患者也表現(xiàn)出了多個(gè)基因集的顯著富集(圖1H)。基于上述抑制受體的表達(dá)分析和TEX信號基因集的富集得分,作者識別出了一個(gè)新的群體亞群,屬于免疫基質(zhì)群,占訓(xùn)練隊(duì)列的36.4%,并稱為耗竭免疫類(EIC)(圖1H)。作者將訓(xùn)練隊(duì)列中的剩余亞群定義為剩余類。為了進(jìn)一步驗(yàn)證EIC的T細(xì)胞耗竭,作者收集了三種參與TEX調(diào)控的免疫抑制細(xì)胞類型(NK細(xì)胞、巨噬細(xì)胞和CD4_Treg_cells)的3個(gè)基因特征,以及促進(jìn)TEX的細(xì)胞因子的4組hallmark基因(圖1H),印證EIC的免疫抑制TME。以上結(jié)果表明,作者識別出了一個(gè)耗竭的免疫類群,該免疫類群在TME中顯著富集了耗竭的T細(xì)胞和其他免疫抑制細(xì)胞的基因表達(dá)特征。

2. 細(xì)胞因子富集是EIC特有的分子特征
在這一部分,作者為了刻畫EIC的分子特征,在訓(xùn)練隊(duì)列使用基因集富集分析(GESA)識別了KEGG通路和hallmark基因集在EIC中富集情況,結(jié)果觀察到細(xì)胞因子相關(guān)的通路和hallmark在EIC中顯著富集(圖1I)。作者使用ClueGO將NMF提取的253個(gè)代表EIC表達(dá)模式的宏基因特異性基因分組成KEGG通路網(wǎng)絡(luò),進(jìn)一步揭示它們的分子功能(圖1J)。 上述分子功能刻畫表明,細(xì)胞因子相關(guān)的表達(dá)信號在LUSC的耗竭免疫狀態(tài)中起主導(dǎo)作用。
3. EIC的早期TCGA LUSC內(nèi)部驗(yàn)證
在這一部分作者為了驗(yàn)證早期LUSC是否存在耗竭的免疫類,對另外247個(gè)TCGA早期LUSC樣本進(jìn)行了NMF,獲得了4個(gè)簇(圖2A),并通過ssGSEA分析觀察到簇2的基質(zhì)和免疫富集分?jǐn)?shù)高于其他簇(圖2B)。此外,簇2還表現(xiàn)出與TEX相關(guān)的免疫細(xì)胞基因表達(dá)特征和其他細(xì)胞因子hallmark的顯著富集(圖2B)。因此,在TCGA早期LUSC樣本中,作者將簇2定義為耗竭的免疫類。作者也觀察到與LUSC晚期EIC相一致的是,早期LUSC 的EIC中CIBERSORT評估的的浸潤免疫細(xì)胞、白細(xì)胞及腫瘤浸潤淋巴細(xì)胞的比例都較高(圖2C-E)。作者也在早期LUSC的EIC中觀察到多個(gè)抑制受體共同上調(diào)(圖2F)。不過在早期LUSC的 EIC中未觀察到凋亡hallmark的富集,這表明早期LUSC的EIC的TEX水平低于晚期。此外,ROC曲線(圖2H)也表明耗竭免疫分類基因?qū)IC具有良好的預(yù)測性能。

4. EIC在LUSC晚期預(yù)后較差
在這一部分作者通過與臨床病理變量相關(guān)的分類來研究耗竭免疫狀態(tài)的預(yù)后價(jià)值。結(jié)果發(fā)現(xiàn)在晚期和早期LUSC的EIC中TILs的比例均高于其余類(圖1F和2E),不過LUSC晚期的Kaplan-Meier分析表明EIC患者的OS和PFS明顯較差(圖3A,D),且Cox多因素分析也顯示EIC仍是LUSC晚期OS的獨(dú)立預(yù)后因素(圖3G)。作者也發(fā)現(xiàn)對于早期LUSC, EIC組與其他組的OS和PFS均無差異(圖3 B,E)。最后,作者分析了所有階段LUSC患者的預(yù)后價(jià)值發(fā)現(xiàn)EIC患者的OS和PFS比其他類更差(圖3 C,F)。這些結(jié)果證實(shí),雖然EIC中存在大量的T細(xì)胞,但大部分T細(xì)胞處于免疫抑制狀態(tài),失去了控制腫瘤進(jìn)展的效應(yīng)細(xì)胞功能,導(dǎo)致預(yù)后較差。

5. EIC與免疫治療抵抗有關(guān)
在這一部分,作者為了研究EIC對ICB治療的反應(yīng),比較了EIC和其余類患者的PD-L1表達(dá),發(fā)現(xiàn)在早期和晚期LUSC中,EIC的PD-L1表達(dá)水平均高于其余類患者(圖4A,B)。作者還使用TIDE算法來預(yù)測ICB治療反應(yīng),結(jié)果觀察到在早期和晚期LUSC中,EIC的TIDE預(yù)測得分都高于其他類別(圖4A,B)。TIDE預(yù)測得分越高,ICB反應(yīng)越差,這些結(jié)果表明,雖然EIC患者有高PD - L1表達(dá),但他們可能對ICB治療有耐藥性。作者為了進(jìn)一步驗(yàn)證EIC的免疫治療耐藥性,計(jì)算了28例經(jīng)抗PD-1治療的轉(zhuǎn)移性黑色素瘤患者和497例TCGA所有腫瘤分期的LUSC患者的167個(gè)耗竭免疫分類基因的富集評分。結(jié)果發(fā)現(xiàn)對ICB治療無反應(yīng)的黑色素瘤患者比對ICB治療有反應(yīng)的黑色素瘤患者有更高的富集分?jǐn)?shù)(圖4C)。且EIC內(nèi)的患者也顯示出比其他組更高的富集分?jǐn)?shù),進(jìn)一步證明了EIC的耐藥性(圖4D)。作者也觀察到TGFB1在EIC中的表達(dá)水平高于其他類(圖4E)。

6. EIC具有獨(dú)特的甲基化模式
在這一部分作者為了探索EIC中與調(diào)控基因相關(guān)的表觀遺傳改變,對所有腫瘤分期的TCGA隊(duì)列進(jìn)行了全基因組甲基化分析,發(fā)現(xiàn)與其他類型相比,EIC中位于162個(gè)免疫相關(guān)基因啟動子區(qū)域的216個(gè)CpG位點(diǎn)發(fā)生了差異甲基化(圖5A,B)。作者也觀察到,與其他類相比,ARTN的啟動子區(qū)甲基化水平更高,EIC的基因表達(dá)水平更低,相反,轉(zhuǎn)錄因子SMAD7在EIC中甲基化水平較低,表達(dá)較高(圖5C-E)。

7. EIC在腫瘤突變負(fù)荷或新抗原數(shù)量上沒有差異但在拷貝數(shù)負(fù)荷上有改變
腫瘤的基因組突變與免疫治療結(jié)果密切相關(guān),因此在這一部分作者描繪了在晚期和早期LUSC的EIC和其他類之間的基因突變景觀。結(jié)果發(fā)現(xiàn)EIC組與其他組個(gè)體基因突變無顯著差異(圖6A,D)。作者還將體細(xì)胞突變負(fù)荷和突變的新抗原與LUSC的耗竭免疫狀態(tài)聯(lián)系起來,結(jié)果也沒有觀察到顯著改變(圖6B-E)。作者進(jìn)一步研究了EIC評分與TMB之間的相關(guān)性,結(jié)果如圖6G所示,EIC評分和TMB之間沒有顯著的相關(guān)性,表明EIC評分可獨(dú)立預(yù)測免疫治療耐藥性。另一方面,作者也發(fā)現(xiàn)EIC樣本有較低的拷貝數(shù)改變負(fù)荷(圖6 H-O)。

8. 新耗竭免疫類在兩個(gè)獨(dú)立數(shù)據(jù)集上的外部驗(yàn)證
作者在這一部分為了驗(yàn)證LUSC樣本訓(xùn)練隊(duì)列中存在耗竭免疫狀態(tài),使用167個(gè)耗竭的免疫分類基因,在另外兩個(gè)獨(dú)立的測試數(shù)據(jù)集中估計(jì)了免疫分類基因預(yù)測免疫耗竭狀態(tài)的能力。結(jié)果發(fā)現(xiàn)與訓(xùn)練隊(duì)列相似,大約30-35%的LUSC樣本在測試數(shù)據(jù)集中被識別為EIC。接著作者基于基因表達(dá)譜,對測試數(shù)據(jù)進(jìn)行分子識別,也證實(shí)EIC具有較高的免疫和基質(zhì)富集得分。
9. EIC中IDO蛋白表達(dá)較高
在文章的最后一部分,作者利用LUSC的RPPA數(shù)據(jù)研究EIC與其他類的蛋白表達(dá)差異。結(jié)果觀察到早期和晚期LUSC的EIC中PD-L1和IDO蛋白的表達(dá)均高于其他類(圖7A,B)。由于在選擇NSCLC患者進(jìn)行抗PD -1抑制劑治療時(shí),會采用免疫組化的方法來評估PD-L1蛋白的表達(dá)。因此,作者研究了不同的IDO蛋白表達(dá)HPA免疫組化染色的LUSC患者組織圖像,結(jié)果觀察到LUSC患者IDO免疫組化表達(dá)量不同(圖7C)。這些證據(jù)表明,在LUSC患者的轉(zhuǎn)錄組、蛋白組和染色組織中IDO的表達(dá)水平存在差異,表明IDO免疫組化表達(dá)可能是PD-L1高表達(dá)的LUSC免疫治療耐藥的潛在生物標(biāo)志物。

到這里這篇文章的主要內(nèi)容就介紹完了,文章整合多個(gè)平臺的多組學(xué)數(shù)據(jù),采用非負(fù)矩陣分解的方法識別了LUSC患者中的免疫抑制類,并分析了其與ICB治療的潛在耐藥性關(guān)聯(lián),同時(shí)對這一免疫抑制類從表達(dá)、功能、表觀等多個(gè)層面進(jìn)行了分析。文章的核心方法包括非負(fù)矩陣分解及ssGSEA等經(jīng)典的生物信息方法,數(shù)據(jù)也來自公共數(shù)據(jù)庫,這一篇公共數(shù)據(jù)庫的純生信分型文章能發(fā)到15+,小編認(rèn)為其亮點(diǎn)在于內(nèi)容豐富、邏輯清晰、關(guān)注熱點(diǎn)。