早吖,各位打工人,美好的一天又開始了!快來跟小編一起學(xué)(mo)習(xí)(yu)新(he)知(hua)識(shui)吧。今天咱們來看兩篇純生信的文章,說是兩篇,其實(shí)出處是同一個團(tuán)隊(duì),他們?nèi)ツ暝贗nt J Cancer(IF=5.2)雜志發(fā)表了一篇介紹單樣本預(yù)測器的方法學(xué)文章,后來在此基礎(chǔ)上增加了泛癌分析,今年十一月份在Briefings in Bioinformatics(IF=11.6)雜志又發(fā)了一篇文章。果然,檸檬樹下只有我,羨慕嫉妒的話小編已經(jīng)不想多說了,咱們直接看看作者都做了啥吧。

一個簡單的背景介紹
作為肺癌中最常見的亞型,肺腺癌(LUAD)相關(guān)的文章咱們公眾號之前也推過不少,所以病因病理之類的小編就不贅述了(這不是懶,而是對大家知識儲備的足夠信任,哈哈),簡單說點(diǎn)跟今天的內(nèi)容有關(guān)的哈。在TCGA中,LUAD可分為三種轉(zhuǎn)錄亞型——終末呼吸單位亞型(TRU)、近端增殖亞型(PP)和近端炎癥亞型(PI)三種,TRU亞型的特征為:患者多無吸煙史、攜帶EGFR突變、腫瘤分期和增殖較低、患者預(yù)后得到改善;PI和PP(nonTRU)亞型則均與患者吸煙相關(guān),并表現(xiàn)出高頻的非靶向驅(qū)動突變、較高的增殖率和特定的形態(tài)學(xué)生長模式。在今天分享的研究中,作者利用基因表達(dá)譜開發(fā)了一種基于AIMS方法的單樣本預(yù)測器(SSP)來對LUAD進(jìn)行分型, SSP無需對樣本進(jìn)行任何預(yù)處理,具有平臺獨(dú)立性,且能夠可靠地預(yù)測單個樣本。

技術(shù)路線
作者獲得了22個公開的基因表達(dá)數(shù)據(jù)集,對于每一個數(shù)據(jù)集,首先通過最近質(zhì)心分類(NCC)方法為每個樣本賦予一個亞型標(biāo)簽,然后將所有樣本分為訓(xùn)練集(17個數(shù)據(jù)集)和驗(yàn)證集(5個數(shù)據(jù)集),利用基于AIMS (https://github.com/meoyo/trainAIMS)方法的SSP將訓(xùn)練集分別按照TRU/nonTRU(SSP2)和TRU/PI/PP(SSP3)這兩種模型進(jìn)行分類。利用這5個獨(dú)立的驗(yàn)證數(shù)據(jù)集,作者分別評估了SSP模型在僅接受手術(shù)治療和輔助治療的患者中的預(yù)后表現(xiàn),此外,研究還開發(fā)了相應(yīng)的R包”CLAMS”,并用另外兩個數(shù)據(jù)集測試了CLAMS在FFEP組織中的適用性。

結(jié)果分析
SSP2分類模型共包含18個基因?qū)?36個基因),通路富集分析的結(jié)果表明它們主要富集在細(xì)胞周期等生物學(xué)過程,SSP3包含141個基因?qū)?259個基因),這些基因富集到了細(xì)胞周期、細(xì)胞遷移和定位、細(xì)胞外基質(zhì)等功能類,圖2.B分別展示了它們和NCC分類基因的交集情況,占比都是50%左右。對SSP2分類結(jié)果的病理評估表明,87.5%以鱗片狀生長模式為主的腫瘤屬于TRU亞型,而在這兩種亞型中,以乳頭狀生長模式為主的病例在TRU亞型中的占比要顯著的高一些,表明了SSP分類與LUAD生長模式的相關(guān)型。以NCC分類結(jié)果為標(biāo)準(zhǔn),在所有驗(yàn)證集中,SSP2的分類準(zhǔn)確性為0.85,SSP3的準(zhǔn)確性為0.81。

在驗(yàn)證集中,大約有1/7的樣本,NCC和SSP2對它們的分類結(jié)果不一致,同分類結(jié)果一致的樣本相比,在這一群組中,非吸煙和II期腫瘤患者的占比較高。為了進(jìn)一步分析這些樣本,作者根據(jù)兩個分類器的結(jié)果將所有驗(yàn)證樣本賦予TRU-TRU,TRU-nonTRU,nonTRU-TRU 和nonTRU-nonTRU標(biāo)簽。對增殖相關(guān)基因MKI67表達(dá)的分析表明,nonTRU-nonTR組比TRU-TRU組的增殖率更高。預(yù)后分析結(jié)果也表明,TRU-TRU患者的5年生存率高于nonTRU-nonTRU患者,而且NCC分類的TRU 亞型以及SSP2分類得到的nonTRU 亞型的生存模式與nonTRU-nonTRU患者相似(圖3),這么一看,SSP2的分類結(jié)果好像更準(zhǔn)確一些。

在接受手術(shù)治療的I期患者中,SSP2預(yù)測的TRU患者組的OS和DMFS均顯著高于nonTRU組(圖4.A-B)。最后,作者開發(fā)了R包”CLAMS”,利用44例I期肺腺癌患者的FFPE RNA數(shù)據(jù)評估SSP2模型,通過層次聚類證實(shí)了分類結(jié)果。在TRU亞型中,71%的患者在5年后無轉(zhuǎn)移,nonTRU亞型只有33%。此外,作者還做了生存分析,CLAMS可以很好的根據(jù)預(yù)后的好壞將患者分層,在另一個數(shù)據(jù)集中,也得到了同樣的結(jié)果(圖4.F-G)。

萬物皆可泛
既然SSP可以用于肺腺癌,那其他癌型又差哪了呢?于是,工具有了,作者就開始用泛癌搞事情了,然后,一篇文章又發(fā)表了,此處請自動腦補(bǔ)表情包。
首先呢,作者從TCGA、GOBO、SCAN-B等公共數(shù)據(jù)庫以及已有研究下載了40個數(shù)據(jù)集,涵蓋了32種癌型,根據(jù)不同的數(shù)據(jù)類型,分別做了患者預(yù)后分析、腫瘤增殖分析和治療反應(yīng)預(yù)測分析(圖5),這篇文章用的是CLAMS中的SSP2分類模型。

在有預(yù)后數(shù)據(jù)的14個數(shù)據(jù)集(包含12種癌型)中,除了LUAD外,浸潤性乳腺癌(BRCA)、低級別膠質(zhì)瘤(LGG)、腎乳頭狀細(xì)胞癌(KIP)和肝細(xì)胞癌(LIHC)這四種癌型的兩個預(yù)后組之間的總生存率也表現(xiàn)出顯著差異,并且被CLAMS分為預(yù)后不良的一組(nonTRU)死亡風(fēng)險(xiǎn)也更高(圖6)。
在乳腺癌的分類結(jié)果中,TRU樣本為Luminal A亞型,并且大多數(shù)ER或PR陽性,以及HER2陰性。當(dāng)將腫瘤大小、年齡、性別等作為協(xié)變量,進(jìn)行多變量Cox回歸分析時(shí),GOBO和SCAN-B中的nonTRU亞型死亡風(fēng)險(xiǎn)仍顯著高于TRU組。But,在這三個來自不同數(shù)據(jù)庫的乳腺癌數(shù)據(jù)集中,只有TCGA數(shù)據(jù)集沒有表現(xiàn)出兩個預(yù)后組之間的差異性,研究對此也沒能給出合理的解釋。
在對LGG的分類結(jié)果中,80%多的樣本被CLAMS分類為nonTRU,同III級腫瘤樣本相比,II級腫瘤中的TRU亞型更多,這與生物學(xué)事實(shí)相一致,但是在多變量Cox回歸分析的結(jié)果中,CLAMS兩類亞型未表現(xiàn)出顯著的生存差異,作者將其歸因?yàn)闃颖玖刻 ?/p>
對LIHC和KIP的分類結(jié)果也是如此,nonTRU組的樣本預(yù)后更差,死亡風(fēng)險(xiǎn)更高,兩種亞型在多變量Cox回歸分析的結(jié)果中,也均未表現(xiàn)出顯著差異。

由于CLAMS所用的分類基因大多與腫瘤增殖相關(guān),為了檢驗(yàn)TRU這一亞型的腫瘤細(xì)胞增殖率是否低于nonTRU亞型,作者接下來通過基因網(wǎng)絡(luò)分析,比較了一組肺癌腫瘤增殖相關(guān)基因在這兩種亞型中的表達(dá)差異,雖然不同癌型的腫瘤增殖水平不同,但是在所有類型的腫瘤中,預(yù)后較好的TRU組的腫瘤增殖基因排秩得分都低于nonTRU組(圖7)。此外,在BRCA、LGG和KIP(LIHC除外)中,預(yù)后較好的分子亞型傾向于有更多低增殖得分的樣本,

然后,為了分析增殖得分是否可以作為單獨(dú)的預(yù)后因子,作者根據(jù)之前計(jì)算所得的等級評分,將每個惡性腫瘤的樣本等分為低、中、高三個增殖組(圖8)。研究發(fā)現(xiàn),在LUAD、BRCA等5種癌型的分析結(jié)果中,不同的預(yù)后組之間的生存結(jié)果顯著不同,不同的增殖組間的生存也表型出顯著差異。
最后,為了評估CLAMS的預(yù)測效能,作者將其應(yīng)用于6個包含治療反應(yīng)信息的數(shù)據(jù)集,并未發(fā)現(xiàn)良好預(yù)后與治療反應(yīng)之間的關(guān)系。

到這,兩篇文章就看完了,怎么說呢,小編總覺得在有第一篇文章的基礎(chǔ)上,第二篇的泛癌分析略顯單薄,很多結(jié)果都是淺嘗輒止,缺乏更深層次的分析,但是作為一篇方法學(xué)文章,它也確實(shí)有自己的優(yōu)點(diǎn)所在,比如適用于泛癌,不局限于某一特定的平臺及數(shù)據(jù)預(yù)處理方法,對早期肺腺癌的風(fēng)險(xiǎn)分層和治療選擇也都有一定的幫助,所以,分析方面就不要苛求太多了!好啦,今天的分享結(jié)束了,Have a nice day!

參考文獻(xiàn):
Nacer DF, Liljedahl H, Karlsson A, Lindgren D, Staaf J. Pan-cancer application of a lung-adenocarcinoma-derived gene-expression-based prognostic predictor. Brief Bioinform. 2021 Nov 5;22(6):bbab154. doi: 10.1093/bib/bbab154. PMID: 33971670; PMCID: PMC8574611.
Liljedahl H, Karlsson A, Oskarsdottir GN, Salomonsson A, Brunnstr?m H, Erlingsdottir G, J?nsson M, Isaksson S, Arbajian E, Ortiz-Villalón C, Hussein A, Bergman B, Vikstr?m A, Monsef N, Branden E, Koyi H, de Petris L, Patthey A, Behndig AF, Johansson M, Planck M, Staaf J. A gene expression-based single sample predictor of lung adenocarcinoma molecular subtype and prognosis. Int J Cancer. 2021 Jan 1;148(1):238-251. doi: 10.1002/ijc.33242. Epub 2020 Aug 12. PMID: 32745259; PMCID: PMC7689824.