大家好!今天給大家分享的文獻是2021年11月發表在Frontiers in Oncology(IF 6.244)上的一篇純生信分析文章,全篇數據來源于公共數據庫,不涉及濕實驗。成本低,周期短(抓重點),一起來學習下吧。
識別頭頸部鱗狀細胞癌中神經-癌cross-talk相關基因預后模型

學習文章之前,先了解一下基礎知識:
HNSC: Head and Neck Squamous cell Carcinoma 頭頸部鱗狀細胞癌
NCCGs : Nerve-Cancer Cross-talk-related Genes 神經-癌cross-talk相關基因
nerve-cancer cross talk:神經在腫瘤的發生發展中起著重要作用。神經釋放的乙酰膽堿等神經遞質可以激活癌細胞、基質細胞和免疫細胞的膜受體,并且癌細胞分泌的神經營養因子也會促進神經生長。這一現象稱為Nerve-Cancer Cross-talk。
數據來源和分析方法
數據來源
本文所使用數據全部來自TCGA和GEO公共數據庫,非常簡單方便易獲取。
TCGA獲取 501例HNSC的RNA-seq數據及臨床信息。GSE41613 獲取97例HNSC患者的RNA-seq數據和臨床信息。GSE103322 獲取HNSC的scRNA-seq數據。GBE52130, GSE38616獲取 14個口腔扁平苔蘚上皮和14個正常口腔上皮的基因表達數據。
分析方法
本篇文章分析方法主要分為以下幾個部分:
首先是42個NCCGs的概況描述,對42個NCCGs有一個landscape式的上帝視角全局全貌的認識。包括(1)突變分析,使用cBioPortal實現突變分析。(2)蛋白互作,使用String數據庫對42個NCCG進行了蛋白互作分析。(3)功能富集分析,使用R包Pathview 完成GO和KEGG分析。
之后是預后基因模型的構建和驗證。(1)使用LASSO回歸算法,10倍交叉驗證構建預后模型。(2)Log-rank檢驗進行K-M生存分析,time-ROC分析評估模型預后效能。R包forestplot繪制森林分布圖。R包rms構建列線圖并預測1、3、5年生存率。該部分是文章的主體部分。
最后是探索模型關鍵基因與MSI,TMB等的關系,并探索關鍵基因的功能。使用TIMER探索基因表達與免疫浸潤之間的關系。R包ggstatsplot分析基因表達和腫瘤突變負荷TMB,微衛星不穩定性MSI的關系。使用GSCALite的CTRP藥物分析模塊分析NCCGs基因表達與泛癌藥物敏感性關系。
結果
HNSC中的NCCGs表達與突變
首先,在TCGA數據庫中探討了42個NCCGS在HNSC和正常組織中的表達。HNSC中共有23個基因表達上調或下調(圖1A),SEMA4F、ADRB2、ADRB3、NTRK 1、NTRK 3、LICAM、GDNF、GFRA 2、GRIN2B、GRIN2C、GRIN2D、GRIN3B、CHRM2、CHRM 4、CHRNA 5、CHRNA 6、CHRNA 9、CHRNB2和CHRNB 4上調,而GFRA 1、Slit2、CHRM1、TACR1下調。之后總結了在HNSC中NCCGS的拷貝體突變和體細胞突變的發生率(圖1B)。在144份樣本中,100份(69.44%)的NCCG發生了改變。最常見的突變類型是錯義突變(藍帶)。突變率最高的基因有GRIN2A、GRIN2B、MAP 2、GRIN3A、NTRK 3、CHRM 3、LICAM、GFRA 1和CHRNG。

NCCGs功能富集
通過對NCCGs進行功能富集分析得知,42個NCCGs主要富集在膜電位調節、化學突觸、軸突形成等方面(圖2A)。此外,KEGC通路富集分析顯示,42個NCCGs主要參與神經受體-配體相互作用、鈣信號通路等(圖2B)。最后,我們對42個NCGs進行了PPI分析,結果顯示這些基因之間存在復雜的相互作用(圖2C)。

預后基因模型的構建與驗證
首先,使用K-M plotter在42個NCCG中尋找預后基因,10個基因預后效果顯著,如圖3所示。

結果表明,CHRNA 1、CHRNA 5、CHRNB 4、CHRND、CHRNG和LICAM的高表達以及CHRNA 6、GFRA 2、GRIN3A和NTRK 1在HNSC中的低表達與預后不良有關。接下來,在這10個預后基因的基礎上,使用LASSO回歸分析建立了一個預后基因模型(圖4)。共有7個基因被包括在模型中,風險評分risk score=(-0.0117)*NTRK1+(0.057)*LICAM+(-0.5121)*GRIN3A+(0.1541)*CHRNA5+(-0.0146)*CHRNA 6+(0.0795)*CHRNB 4+(0.0564)*CHRND。計算每個HNSC患者的風險評分,并將他們分為高分組和低評分組。風險評分分布、生存狀況和7個基因的表達如圖4C所示。K-M plotter顯示高分組的預后比低評分組差(圖4D)。1-、3-和5年ROC曲線的AUC分別為0.605、0.64和0.634(圖4e).
最后,用GSE 41613中97例HNSC患者的數據進行了模型的有效性驗證。根據危險評分分為高分組和低評分組,用K-M plotter比較預后。結果表明,該模型能較好地判斷患者的預后(p=0.0235,圖4F)。

構建列線圖
之后利用該模型的臨床特征和7個基因的表達,建立列線圖預測1年、3年、5年生存率。單因素和多因素分析顯示以下獨立預后因素:CHRNA5、LICAM、CHRND、GRIN3A、年齡、M期和N階段(圖5A,b)。列線圖如圖5,C指數為0.653。列線圖可以預測1、3、5年生存率,與理想模型接近(圖5D)。

NCCGs與免疫浸潤
神經是腫瘤微環境的重要組成部分,神經系統與免疫系統關系密切。在本研究中使用Timer來探討預后基因模型中7個基因與免疫浸潤的關系,如圖6A-G和表1所示。圖6A顯示CHRNA 5與腫瘤純度呈正相關(COR=0.189)。圖6B顯示CHRNA 6與B細胞(COR=0.321)、CD8+T(COR=0.365)、CD4+T(COR=0.553)、巨噬細胞(COR=0.424)、中性粒細胞(COR=0.487)、樹突狀細胞(COR=0.567)呈正相關,與純度呈負相關(COR=-0.176)。圖6C顯示CHRNB 4與B細胞(COR 0.151)、CD8+T(COR=0.101)、CD4+T(COR=0.203)、巨噬細胞(COR=0.152)r和樹突狀細胞(COR=0.147)呈正相關。圖6D顯示CHRND與

CD4+T(COR=0.218)、巨噬細胞(COR=0.128)、中性粒細胞(COR=0.133)、樹突狀細胞(COR=0.127)呈正相關,與純度呈負相關(COR=-0.112)。圖6E顯示GRIN3A與B細胞(COR=0.297)、CD8+T(COR=0.479)、CD4+T(COR=0.487)、巨噬細胞(COR=0.486)、中性粒細胞(COR=0.501)、樹突狀細胞(COR=0.6)呈正相關,與純度呈負相關(COR=-0.153)。圖6F顯示LICAM與中性粒細胞(COR=0.125)和樹突狀細胞(COR=0.116)呈正相關,且呈負相關。CD8+T(COR=-0.119),純度(COR=-0.107)。圖6G顯示NTRK 1與B細胞(COR=0.206)、CD8+T(COR=0.387)、CD4+T(COR=0.381)、巨噬細胞(COR=0.371)、中性粒細胞(COR=0.437)、樹突狀細胞(COR=0.484)呈正相關,與純度呈負相關(COR=-0.256)。結果表明,NCCGS與免疫浸潤密切相關。
NCCGs與TMB, MSI和藥物敏感性
TMB和MSI是免疫治療的預測生物標志物。如圖7A所示,CHRNA5和MSI兩者之間存在正相關。圖7B, E-G呈負相關在CHRNA6, GRIN3A, LICAM, NTRKI和MSL之間。其他CHRNB4、CHRND和MSI(圖7C, D)。如圖7H所示, CHRNA5、CHRNB4與TME呈正相關,如(圖71,K, M, N), CHRNA6, CHRND, LICAM, NTRK1和TMB之間呈負相關,但是沒有GRIN3A與TMB之間存在顯著關系(圖7L)。進一步探索上述基因的潛力在治療靶點上,探討了基因之間的關系泛癌的表達及藥物敏感性。數據顯示藥物敏感性與LICAM呈正相關,與CHRND、NTRK1、CHRNA5、GRIN3A呈負相關(圖70)。CHRNA6、CHRNB4與藥物敏感性無顯著相關性

NCCGs與HNSC臨床分期
腫瘤基因表達與臨床進展密切相關。分析NCCGs與臨床分期的關系。數據顯示,GRIN3A, NTRK1,和CHRNB4與分期相關(圖8A-C)。但我發現CHRND、CHRNA5、LICAM、CHRNA6和分期無關(圖8D-G)。

腫瘤微環境中NCCGs的表達
研究表明,模型中的7個預后基因與正常組織相比,HNSC中有高表達。然而,目前還不清楚這些基因在哪些細胞中發揮作用。因此,利用單細胞測序數據探索基因表達在HNSC微環境中的不同細胞中。如圖9A, B所示,有肌成纖維細胞,惡性,血漿,成纖維細胞,肌細胞,單細胞/巨細胞,內皮細胞,肥大細胞CD8T、CD8Tex和CD4Tconv在微環境中的作用。CHRNB4主要在惡性腫瘤中表達細胞(圖9)。NTRKI基因在肥大細胞中高表達在CD8+ T和成纖維細胞中有少量表達(圖9D)。因此,之后重點探討惡性細胞中存在CHRNB4,肥大細胞中存在NTRKI的功能。

識別CHRNB4在惡性腫瘤細胞中的功能
采用單細胞基因集富集分析,探討基因可能的功能。選擇高表達和低表達CHRNB4的惡性腫瘤細胞進行KEGG通路的基因集富集分析。結果表明,以下通路在高表達CHRNB4的細胞中被激活:戊糖-葡萄糖轉化,淀粉-蔗糖代謝,亞油酸代謝。不飽和脂肪酸生物合成,抗壞血酸和乳酸代謝,類固醇激素生物合成,藥物代謝,和外部物質的P450代謝(圖10)。

識別NTRK1在肥大細胞中的功能
選擇NTRKI高表達和低表達的肥大細胞用于KEGG通路的基因集富集分析。結果顯示,在NTRKI高表達的肥大細胞中,以下途徑被激活:神經酪氨酸信號通路、丁酸代謝、內吞、凋亡、賴氨酸降解、造血系統譜系、甲狀腺癌、嗅覺傳導(圖11)。

到這里文章的主要內容就介紹完了。總結一下,這項研究收集了42個NCCGs,基于這些基因構建了預后模型。在模型構建之外,又探索了關鍵基因與免疫浸潤、TMB、MSI和藥物敏感性的關系。最后,通過單細胞測序數據解釋了關鍵基因可能的功能。
這篇文章思路清晰,從基因集的選取到預后模型的構建和驗證,以及與其他臨床特征的相關性分析,加入TME, MSI, TMB和藥物敏感性等分析,使得研究內容豐富,分析全面;又使用單細胞研究關鍵基因功能,進一步補充研究結果。又有生信分析又有臨床結合,又有bulk RNA-seq又有單細胞測序,豐富的生信分析加上優秀的結果,使得文章邏輯清晰,思路新穎,內容詳實,可效仿性極強,值得各位老師參考。
參考文獻:
Identification of the Nerve-Cancer Cross-Talk-Related Prognostic Gene Model in Head and Neck Squamous Cell Carcinoma. PMID: 34912722