大家好,今天給大家介紹一個數據庫網站,生物信息學文章日益增多,在線零代碼分析的腫瘤數據庫也越來越多,大部分都是連接到TCGA數據庫的癌癥數據,從GEPIA到TIMER,涉及的方向也是越來越多,從基礎的表達量分析到生存分析,到近來的免疫浸潤以及日益火爆的單細胞分析,簡單直觀明了的操作界面幫助我們快捷方便的完成論文中的圖標制作,圖片質量也越來越高。
同時,惡性腫瘤是機體正常細胞癌變的產物, 具有不斷增殖并有可能在體內轉移的特點。為了生存和生長, 腫瘤細胞能夠采用不同策略抑制人體的免疫系統, 使其不能正常地殺傷腫瘤細胞, 從而在抗腫瘤免疫應答的各階段得以幸存。簡單來說,免疫治療的目的其實就是通過調動人體強大的免疫系統來對抗癌癥。通過分離獲取的患者自身免疫細胞, 在細胞因子的誘導下,大量擴增出具有高度抗腫瘤活性的免疫細胞,回輸到患者體內以恢復患者免疫的力量進而攻擊腫瘤。漸漸的,免疫治療在癌癥治療領域不斷展現實力,逐漸成為癌癥治療炙手可熱的明星療法。在多個復發或難治性的惡性腫瘤中都展現了十分強勁的治療效果;那么今天我們來介紹一個與腫瘤免疫治療相關的在線數據庫——“TIGER”。
文章名稱:
TIGER: A Web Portal of Tumor Immunotherapy Gene Expression Resource
DOI:https://doi.org/10.1016/j.gpb.2022.08.004
雜志:Journal Pre-proofs ,if:7.614(一區)

數據的來源與處理方法:
與其他很多癌癥數據庫類似,TIGER數據庫也是與TCGA數據庫鏈接的,構建數據庫的腫瘤和正常RNA-seq樣本數據來自于UCSC Xena數據庫(https://xena.ucsc.edu)。
通過搜索immunotherapy, programmed cell death protein 1 (PD-1) inhibitors, and cytotoxic, T-lymphocyte antigen 4 (CLTA4) inhibitors等關鍵詞,從GEO(https://ncbi.nlm.nih.gov/geo)和SRA (https://ncbi.nlm.nih.gov/sra)數據庫中收集具有臨床免疫治療信息的腫瘤樣本的bulk RNA-seq和基因表達芯片數據。但是在沒有原始數據的情況下,則會使用預處理數據,小編認為這將不可避免地造成一些數據上的誤差,但是影響不大。
另外人類腫瘤的單細胞bulk RNA-seq是在GEO、Genome Sequence Archive (GSA) (https://bigd.big.ac.cn/gsa-human)、EMBL-EBI (https://www.ebi.ac.uk)、Single-Cell Portal數據庫中通過檢索single-cell、scRNA-seq、10x Genomics、inDrop、Smart-seq2等關鍵詞收集的。
單細胞數據的預處理方法是:
利用STAR將FASTQ格式的reads與人類參考基因組(hg38, GRCh38)進行比對,然后利用Cell Ranger導出基因表達矩陣。使用Seurat (v3.1.3) R 包對每個單細胞bulk RNA-seq數據集進行質量控制。首先,線粒體RNA含量超過10%的細胞被認為已經死亡或正在死亡,并被移除。reads數小于200或大于3000的細胞也被排除。同時表達以上三種標記物(CD2、CD79A和CD68)中一個或多個的細胞被定義為二聚體并去除。其次,將過濾后的每個樣本的基因表達矩陣用Seurat包的NormalizeData函數進行歸一化,用FindVariableFeatures函數保留高變異基因;最后,利用FindVariableFeatures和Integratedata函數對所有樣本的基因表達矩陣進行整合,并對不同樣本之間的批次效應進行校正。接下來則是常規的細胞聚類和細胞亞群注釋。
隨后,對單細胞的腫瘤樣本與正常樣本進行差異分析,通路富集分析,不同細胞類型間基因對的皮爾森相關性分析,細胞軌跡分析,細胞通訊分析。
bulk基因表達數據分析:
去除低質量的探針數據,對探針進行注釋,并將數據轉換為FPKM類型。
接下來對數據進行差異分析,生存分析,相關性分析,預測免疫治療的反應。預測免疫治療反應的特征基因從文獻中獲得,每個特征基因的得分根據原研究中使用的參數計算。我們采用RRA算法以無偏差的方式整合所有特征基因的得分。整合后的得分用于預測癌癥患者的免疫治療反應。
最終以上的所有分析結果,以及TIGER中的所有數據都以MySQL表、JSON文件、Rds和RData文件的形式保存。Web接口已包括PHP、HTML、JavaScript和CSS。并使用ECharts和Rscripts生成統計圖。
數據庫首頁:

TIGER是一個與腫瘤免疫相關的、可基于表達數據進行多項分析的網站。TIGER包含來自TCGA的1508個具有免疫治療臨床結局的腫瘤樣本和11057個腫瘤/正常樣本的批量轉錄組數據,以及655個樣本、2116945個細胞的單細胞轉錄組數據,其中63個樣本的119039個細胞具有免疫治療臨床數據。此外,作者還收集了8個CRISPR和2個shRNA screen數據,這些數據來自于抗癌免疫反應基因的研究。并從公共文獻中收集了11個可能用于預測免疫治療反應的特征基因。

TIGER由四個主要模塊組成,包括免疫治療反應模塊、反應特征模塊、單細胞免疫模塊和快速搜索免疫篩選模塊。
1.快速搜索:當用戶進入網站時,可以在頁面中間看到一個快速搜索欄。用戶可以通過搜索感興趣的基因Symbol,得到在所有數據集中具有顯著差異的結果,如不同細胞類型下腫瘤組織與正常組織的差異,免疫治療反應樣本與非反應樣本的差異。

2.基因信息:內含基因信息的總結,包括基因信息(Gene Information)和通路信息(Pathway Information)。

3.單細胞免疫:在單細胞免疫模塊中,用戶可以懸停在圖中圓點上或對表格排序,以發現不同癌癥的細胞類型標記基因。此外,用戶可以單擊表的選項卡來顯示數據集中這種細胞類型的詳細圖像。

在表達相關性分析中,用戶可以計算一個感興趣的基因與其他基因的表達之間的相關性,也可以基于輸入基因計算不同細胞類型中的表達相關性。在差異表達分析中,用戶可以點擊表格選項卡查看詳細信息,該詳細信息由UMAP圖和條形圖組成,用于可視化所選基因在不同組之間的差異表達。


4.免疫治療反應: TIGER會展示差異表達分析和生存分析。散點圖和表格將顯示每個數據集的具體差異分析結果。
5.反應特征:在AUC Matrix和Survival Matrix中,用戶可以利用基因表達數據和免疫治療臨床信息,將自己的特征基因與已知的免疫治療響應特征基因進行比較

在Correlation Matrix中,用戶可以在沒有免疫治療臨床信息的情況下,使用TCGA基因表達數據來探索感興趣的基因是否與已知的免疫治療特征基因相關。

6.免疫篩選:CRISPR screen和RNAi Screen相關的基因信息將以表格的形式顯示,點擊表格即可獲得數據集相關信息。

小結:
TIGER 可以對與癌癥免疫治療相關的基因或單細胞轉錄組的基因表達數據進行綜合分析。與 TCIA、TIDE 和 TISCH 等其他現有工具相比,TIGER 具有多個優勢:
1. TIGER 是第一個整合了癌癥bulk RNA-seq、芯片數據和單細胞基因表達數據,并用以發現癌癥免疫治療中的抗腫瘤免疫機制并反應生物標志物的在線數據庫。
2. TIGER 擁有最全面的癌癥免疫治療相關轉錄組基因表達數據,包含了33 種癌癥類型的 11,057 個腫瘤和正常樣本的非免疫療法基因表達數據、8 種癌癥類型的 1508 個腫瘤樣本的免疫療法基因表達數據,以及來自 25 種癌癥類型的 655 個樣本的 2,116,945 個細胞的單細胞基因表達數據。
3. 與其他工具相比,TIGER 包含更多用于bulk RNA-seq和單細胞基因表達數據的分析和可視化功能。特別是,使用 scbulk RNA-seq在腫瘤和正常細胞之間以及不同細胞類型之間進行差異分析,使用戶能夠探索抗腫瘤免疫并開發特定細胞類型的基因特征。