大家好!今天給大家介紹一篇2021年發表在Journal of Cancer (IF:4.207)上的文章。作者對食管鱗狀細胞癌的GEO和TCGA數據集進行分析鑒定到6個新的預后和診斷生物標志物。
Six Novel Biomarkers for Diagnosis and Prognosis of Esophageal squamous cell carcinoma: validated by scRNA-seq and qPCR
食管鱗狀細胞癌預后和診斷的6個新生物標志物:經scRNA-seq和qPCR驗證
摘要:
食管鱗狀細胞癌(ESCC)是全世界范圍內最常見的腫瘤之一。ESCC預后較差且缺乏用于預后和診斷的生物標志物。本研究旨在鑒定ESCC的新型生物標志物。作者從GEO ESCC數據集和TCGA ESCC數據集中篩選共有DEGs,構建PPI網絡鑒定關鍵核心基因。使用KM生存分析和ROC分析鑒定核心基因的預后和診斷價值。使用UALCAN數據庫,scRNA-seq和qPCR驗證核心基因的表達水平。最后使用免疫浸潤分析研究這些基因的作用。結果表明,PBK,KIF2C,NUF2,KIF20A,RAD51AP1和DEPDC1可以有效區分ESCC組織和正常組織并與總生存期顯著相關。scRNA-seq和qPCR結果表明,ESCC組織中核心基因的表達水平顯著較高。此外,免疫浸潤分析表明樹突狀細胞浸潤水平與PBK,KIF2C,NUF2,RAD51AP1,DEPDC1的表達水平顯著負相關。總的來說,作者的結果表明PBK,KIF2C,NUF2,KIF20A,RAD1AP1和DEPDC1是ESCC診斷和預后的潛在生物標志物和潛在治療靶點。
流程圖:

背景:
近年來,高通量組學數據廣泛應用于醫學研究中。對測序數據進行重新分析可以鑒定與疾病有關的生物標志物且成本較低。TCGA數據庫和GEO數據庫存儲了大量與食管癌有關的測序數據,可以應用于鑒定ESCC的生物標志物。然而,大部分的測序數據都是對組織進行測序,得到的是組成細胞的平均表達水平并不能反映癌細胞的真實情況。因此,使用單細胞測序數據驗證基因的表達水平較為真實可靠。本研究作者結合了6個GEO數據集和TCGA數據集篩選與ESCC診斷和預后有關的生物標志物并使用scRNA-seq數據和qPCR進行驗證。
材料與方法:
1.數據集獲取:從GEO數據庫下載ESCC的腫瘤組織和正常組織的GEO數據集(表1)。

從TCGA數據庫下載TCGA-ESCC數據集,包括11例正常組織和78例腫瘤組織(表1和表2)。

收集6例接受手術的ESCC患者的腫瘤組織和正常組織進行qPCR(表3)。

2.DEG分析:對GEO數據集和TCGA數據集進行差異分析鑒定DEGs,使用jvenn鑒定共有DEGs。
3.功能注釋和篩選核心基因:使用STRING進行GO分析,通路分析和PPI分析,使用cytoHubba篩選核心基因。
4.核心基因臨床價值分析:KM生存分析和ROC分析
5.核心基因表達水平驗證:使用UALCAN數據庫驗證核心基因的表達水平,下載包括3例ESCC樣本的208個細胞的單細胞數據集(表4)進行分析。對6例ESCC組織和正常組織進行qPCR。

6.免疫浸潤分析:使用TIMER進行核心基因表達水平與免疫細胞浸潤水平的相關性分析。
結果:
1.數據預處理
首先,作者使用R包Limma對GEO和TCGA數據集進行標準化,隨后使用R包factoMineR和factoextra進行PCA分析。結果表明,GSE17351,GSE20347,GSE23400,GSE100942,GSE38129和GSE77861數據集的所有樣本都可以分為正常組和腫瘤組,而有4個正常樣本和3個腫瘤樣本沒有差異,因此接下來分析中去掉這7個樣本(圖1A-1F)。

2.GEO數據集和TCGA數據集的共有DEGs
對GEO數據集分別進行差異分析鑒定DEGs(圖2A),使用jvenn鑒定共有DEG,鑒定到132個下調基因和48個上調基因(圖2B)。對TCGA數據集進行差異分析鑒定到1383個下調基因和1268個上調基因,韋恩圖表明GEO數據集和TCGA數據集有55個下調共有基因和27個上調共有基因(圖2C)。

3.功能注釋和PPI分析
使用STRING數據集對DEGs進行GO分析,通路分析和PPI分析。結果表明,大部分上調基因存在于細胞核和細胞內,主要參與細胞過程,有絲分裂細胞周期和膠原代謝過程的正調控。通路富集分析表明上調基因參與細胞周期,細胞外基質組織和DNA修復(圖3A)。下調基因主要與肌原纖維,離子跨膜轉運蛋白活性調控和肌動球蛋白結構組織有關(圖3B)。使用STRING數據庫構建PPI網絡并篩選核心基因,結果表明PBK,CDC20,KIF2C,BIRC5,NUF2,KIF20A,RAD51AP1,RFC4,MCM2和DEPDC1是核心基因(圖3C)。

4.KM生存分析和ROC分析
為評估核心基因的臨床價值,作者進行KM生存分析。其中PBK,KIF2C,NUF2,KIF20A,RAD51AP1和DEPDC1與總生存期顯著相關(圖4A),這些基因低表達與生存較差有關。ROC分析表明,PBK,KIF2C,NUF2,KIF20A,RAD51AP1和DEPDC1可以有效區分ESCC組織和正常組織(圖4B)。

圖4 KM分析和ROC分析
5.核心基因表達水平的驗證
作者使用UALCAN ESCA數據(11例正常組織和95例ESCC樣本)研究核心基因的表達水平,結果表明PBK,KIF2C,NUF2,KIF20A,RAD51AP1和DEPDC1在腫瘤組織中的表達水平較高(圖5A)。此外,scRNA-seq分析表明核心基因主要在癌細胞中表達(圖5B)。qPCR結果表明核心基因在腫瘤組織中的表達水平較高(圖5C)。

6.免疫浸潤分析
為進一步研究這些核心基因表達水平與免疫細胞浸潤水平的關系,作者進行TIMER分析。結果表明腫瘤純度與PBK,NUF2,RAD51AP1和DEPDC1表達水平負相關。PBK,KIF2C,NUF2,RAD51AP1和DEPDC1與樹突狀細胞浸潤水平表達水平負相關,而與其他細胞浸潤水平無關(圖6A-6F)。

結論:
總的來說,作者的研究鑒定到6個新的ESCC生物標志物(PBK,KIF2C,NUF2,KIF20A,RAD51AP1和DEPDC1),可以作為食管鱗狀細胞癌的診斷和預后指標。此外,scRNA-seq結果表明核心基因主要在癌細胞中表達,qPCR結果表明核心基因在腫瘤組織中高表達。免疫浸潤分析表明,核心基因表達水平與腫瘤純度顯著正相關而與樹突狀細胞顯著負相關。樹突狀細胞是最重要的抗原呈遞細胞,在先天免疫和獲得性免疫中起到關鍵作用。樹突狀細胞浸潤水平降低會影響抗原呈遞,從而導致宿主免疫反應不能有效殺死腫瘤細胞。這可能是食管鱗狀細胞癌發生的潛在分子機制之一。作者的研究結果表明,這些核心基因可以作為ESCC治療的潛在靶點,但還需要進一步實驗驗證。