小伙伴們大家好,今天跟大家分享一個不錯的R包,于2021年發表在Briefings in Bioinformatics(IF:11.622)。這是一個全面分析藥物反應以及藥物反應標志物的R包,包括了三個算法,讓我們來看看如何將這個工具應用到我們的研究當中呢?
oncoPredict: an R package for predicting in vivo or cancer patient drug response and biomarkers from cell line screening data
從細胞系數據預測癌癥患者藥物反應和生物標志物的R包: oncoPredict
該R包整合了三個主要函數,分別為GLDS,calcPhenotype和IDWAS(圖1),下面為大家介紹下這三個功能。

圖1. oncoPredict包的框架
1. GLDS
GLDS是作者先先前研究中開發的一個識別藥物反應相關生物標志物的工具。在這里,作者對該工具做了一些矯正,修改后的模型能夠提升標志物識別的效能(圖2)。
輸入數據:細胞系中的藥物敏感性數據以及表型信息(如體細胞突變,拷貝數變異等);輸出:藥物反應相關的生物標志物。
應用:作者在GDSCv2數據集中識別藥物相應的標志物,如矯正后的GLDS模型發現了KRAS是奧沙利鉑的一個響應標志物,這在先前研究中已被證實。

圖2. 校正后的GLDS可提升生物標志物的識別能力
2. calcPhenotype
該工具使用大規模的基因表達和藥物篩選數據來建立嶺回歸模型,然后應用于新的基因表達數據集,實現預測臨床化療反應。
輸入數據:該工具集成了GDSC或CTRP數據作為訓練數據集得到的模型,使用者可直接輸入基因表達數據來預測藥物反應。同時,該工具接受使用者提供自己的訓練數據集,來訓練模型;輸出:預測的藥物反應值。
應用:為了評估calcPhenotyp的預測效能,作者在一個卵巢癌臨床數據集中預測藥物反應,該數據集包括患者對紫杉醇的反應信息和基因表達數據(GSE51373)。作者使用CTRP數據集訓練紫杉醇藥物反應模型,然后分析預測為敏感和耐藥兩組病人的臨床結果(圖3A)并比較了預測敏感性得分(圖3B)發現該模型效能較好。

圖3. 評估calcPhenotyp方法的效能
3. IDWAS
IDWAS方法是識別藥物反應標志物的一種推廣模型,與GLDS不同的是,該方法基于人群數據。IDWAS在概念和實現上與GWAS相似,通過輸入藥物反應與體細胞突變或CNV來衡量藥物基因相互作用并識別藥物反應的生物標志物。通過利用臨床數據集,能夠識別在細胞系數據集中看不到的新關系。此外,由于它基于患者的基因組數據,任何發現的生物標志物都與該患者群體相關。
輸入數據:患者遺傳特征矩陣和藥物反應值矩陣(如calcPhenotype功能的輸出)。遺傳特征可以是一個包含0/1的突變矩陣,也可以是一個包含患者基因CNV水平的CNV矩陣。輸出:藥物反應標志物。
應用:作者利用calcPhentope方法,基于CTRP數據建立了藥物反應模型。并計算了TCGA樣本中496種藥物的藥物反應,然后使用IDWAS方法來篩選這些藥物相應的標志物。與先前研究類似,最顯著的關聯是nutlin-3a(一種MDM2抑制劑)與TP53狀態之間的關聯(圖4A)。相反,對于selumetinib(一種MEK抑制劑)在KRAS突變環境下更有效(圖4B)。

圖4. 基于患者識別的藥物反應標志物
以上就是這個工具包的主要內容,該包下載并打包了最新的CTRP和GDSC數據,為藥物反應預測與藥物反應標志物的識別提供了一站式服務,并會持續更新。大家在做藥物相關研究時可以考慮使用這個R包進行一些分析,如使用calcphenotype在臨床數據集中獲得藥物反應的預測,然后使用IDWAS搜索潛在的生物標志物,并可以對這些標志物進行后續的分析與驗證,為你的研究添彩。最后祝大家科研順利!