讓文章錦上添花的模型構建后故事思路總結
很多生信分析的文章都會進行模型構建,在構建模型之后如何去寫故事,來進行文章的思路繪制和故事講解非常關鍵。寫好一個故事常常會給文章帶來錦上添花的效果。因此,今天小編就和大家分享幾個模型構建后的故事思路,大家可以體會下文章的思路以及邏輯。
思路一:其他數據模型驗證支持結果+模型效能評估增加說服力+刻畫模型與臨床因素關聯結合臨床+模型基因功能分析解析生物學意義+模型與免疫突變等多維度結合分析豐富內容
例子:Development of a novel gene signature to predict prognosis and response to PD-1 blockade in clear cell renal cell carcinoma(IF:8.11)
該研究針對腎透明細胞癌ccRCC從GEO數據庫、TCGA數據庫、ArrayExpress數據庫下載RNA-seq數據及臨床數據。對TCGA數據集識別的ccRCC樣本和癌旁組織的DEGs進行WGCNA分析識別與臨床特征有關的關鍵模塊。根據MCODE分析和PPI網絡分析得到核心基因,對核心基因進行LASSO回歸分析篩選到4個基因。KM分析表明,其中有兩個基因高表達與OS較差有關。最終,基于這兩個基因構建預后模型計算風險打分。根據風險打分中位數將患者分為高風險組和低風險組。
預后模型的驗證+模型效能評估:作者對TCGA隊列,E-MTAB-1980和TMA隊列驗證預后模型的性能,進行了KM分析并計算了ROC對模型進行評估(圖1)。

模型與臨床因素關聯:分析了高風險組的患者G3和G4期的比例及病理分期。及模型基因表達水平與年齡,AJCC分期,腫瘤大小和等級等的相關性(圖2),及隨腫瘤等級增加,模型基因染色強度(圖3)。

模型基因功能分析:作者對TCGA隊列進行GSEA和GSVA分析,刻畫了排名前面的顯著富集通路。及模型基因高表達組中的基因顯著
富集功能(圖3)。

模型與免疫突變結合分析:作者分析了高風險組及低風險組免疫表型(圖4),及高風險組與低風險組的體細胞突變情況(圖5)。


思路二:缺氧模型內部外部驗證支持結果+模型與臨床特征之間的關系結合臨床+模型與免疫特征的相關性豐富內容+模型與分子亞型及精準治療的關系注重應用
例子:A Robust Hypoxia Risk Score Predicts the Clinical Outcomes and Tumor Microenvironment Immune Characters in Bladder Cancer(IF:7.561)
該研究中,作者整合了多個獨立的BLCA數據集來開發新的缺氧風險預測模型,并將其與臨床結果、TME特征和治療效果預測相關聯。
缺氧模型內部外部驗證:作者在TCGA驗證隊列中成功驗證了缺氧風險評分在預測OS中的作用(圖6),作者進一步在其他隊列中驗證了缺氧風險評分對預后的預測價值(圖7)。


模型與臨床特征之間的關系:作者評估了缺氧風險評分與分級和分期的關系。并在三個外部隊列中進一步驗證了這些結果。然后,作者進行了單因素Cox分析和多因素Cox分析再次確認缺氧風險評分是一個獨立的預后因素(圖8)。

模型與免疫特征的相關性:腫瘤免疫微環境的狀態決定了癌細胞的命運和免疫治療的療效。因此作者分析了風險評分與癌癥免疫微環境之間的相關性(圖9)。

模型與分子亞型及精準治療的關系:接下來作者分析了風險評分與經典分子亞型分類之間的相關性及對幾種治療方案的預測作用(圖10)。

思路三:模型驗證評估支持結果+模型與臨床特征關系結合臨床+模型生物學功能分析解析生物學意義+模型與免疫微環境關系增加維度+模型與體細胞突變豐富內容
例子:Development and validation of a novel ferroptosis-related gene signature for predicting prognosis and immune microenvironment in head and neck squamous cell carcinoma(IF:4.933)
本篇文章主要基于頭頸部鱗狀細胞癌患者的鐵死亡相關基因構建預后模型,表明鐵死亡可能是頭頸部鱗狀細胞癌患者的潛在治療靶點。
模型驗證評估:使用GEO數據集驗證該預后模型的性能,GEO數據集同樣分為HRisk和LRisk。KM分析表明HRisk的OS更差并且死亡更早,PCA分析同樣可以將兩組分開(圖11)。

模型與臨床特征關系:作者接下來分析了模型與臨床特征的關系,多因素Cox回歸分析表明風險打分是OS的獨立預測因子(圖12)。

模型功能分析:作者對TCGA隊列和GEO隊列的HRisk和LRisk的DEG進行GO和KEGG富集分析(圖13)。

模型與免疫微環境關系:作者分析了兩個隊列的HRisk患者的基質打分,免疫打分,CYT打分及TCGA隊列中LRisk患者的RCT豐度和TCGA隊列和GEO隊列中的na?ve B細胞,樹突狀細胞,嗜酸性粒細胞等比例(圖14和15)。作者也分析了模型與免疫浸潤及免疫相關基因的分析(圖16,17)。




模型與體細胞突變:作者分析了HRisk組中的體細胞突變比例及HRisk組的TMB和兩組之間新抗原趨勢一致(圖18)。

小編為大家整理了三篇文章,他們分別從PD-1、缺氧、鐵死亡的角度去構建模型,小編重點概括了構建模型后的思路及邏輯,可以看出針對模型的解析和模型的構建同樣重要。感興趣的小伙伴們可以仔細研讀細細體會下。
參考文獻1:Development of a novel gene signature to predict prognosis and response to PD-1 blockade in clear cell renal cell carcinoma(IF:8.11);
參考文獻2:A Robust Hypoxia Risk Score Predicts the Clinical Outcomes and Tumor Microenvironment Immune Characters in Bladder Cancer(IF:7.561);
參考文獻3:Development and validation of a novel ferroptosis-related gene signature for predicting prognosis and immune microenvironment in head and neck squamous cell carcinoma(IF:4.933);