早吖,各位打工人,美好的一天又開(kāi)始了!快來(lái)跟小編一起學(xué)(mo)習(xí)(yu)新(he)知(hua)識(shí)(shui)吧。今天咱們來(lái)看兩篇純生信的文章,說(shuō)是兩篇,其實(shí)出處是同一個(gè)團(tuán)隊(duì),他們?nèi)ツ暝贗nt J Cancer(IF=5.2)雜志發(fā)表了一篇介紹單樣本預(yù)測(cè)器的方法學(xué)文章,后來(lái)在此基礎(chǔ)上增加了泛癌分析,今年十一月份在Briefings in Bioinformatics(IF=11.6)雜志又發(fā)了一篇文章。果然,檸檬樹(shù)下只有我,羨慕嫉妒的話(huà)小編已經(jīng)不想多說(shuō)了,咱們直接看看作者都做了啥吧。

一個(gè)簡(jiǎn)單的背景介紹
作為肺癌中最常見(jiàn)的亞型,肺腺癌(LUAD)相關(guān)的文章咱們公眾號(hào)之前也推過(guò)不少,所以病因病理之類(lèi)的小編就不贅述了(這不是懶,而是對(duì)大家知識(shí)儲(chǔ)備的足夠信任,哈哈),簡(jiǎn)單說(shuō)點(diǎn)跟今天的內(nèi)容有關(guān)的哈。在TCGA中,LUAD可分為三種轉(zhuǎn)錄亞型——終末呼吸單位亞型(TRU)、近端增殖亞型(PP)和近端炎癥亞型(PI)三種,TRU亞型的特征為:患者多無(wú)吸煙史、攜帶EGFR突變、腫瘤分期和增殖較低、患者預(yù)后得到改善;PI和PP(nonTRU)亞型則均與患者吸煙相關(guān),并表現(xiàn)出高頻的非靶向驅(qū)動(dòng)突變、較高的增殖率和特定的形態(tài)學(xué)生長(zhǎng)模式。在今天分享的研究中,作者利用基因表達(dá)譜開(kāi)發(fā)了一種基于AIMS方法的單樣本預(yù)測(cè)器(SSP)來(lái)對(duì)LUAD進(jìn)行分型, SSP無(wú)需對(duì)樣本進(jìn)行任何預(yù)處理,具有平臺(tái)獨(dú)立性,且能夠可靠地預(yù)測(cè)單個(gè)樣本。

技術(shù)路線
作者獲得了22個(gè)公開(kāi)的基因表達(dá)數(shù)據(jù)集,對(duì)于每一個(gè)數(shù)據(jù)集,首先通過(guò)最近質(zhì)心分類(lèi)(NCC)方法為每個(gè)樣本賦予一個(gè)亞型標(biāo)簽,然后將所有樣本分為訓(xùn)練集(17個(gè)數(shù)據(jù)集)和驗(yàn)證集(5個(gè)數(shù)據(jù)集),利用基于AIMS (https://github.com/meoyo/trainAIMS)方法的SSP將訓(xùn)練集分別按照TRU/nonTRU(SSP2)和TRU/PI/PP(SSP3)這兩種模型進(jìn)行分類(lèi)。利用這5個(gè)獨(dú)立的驗(yàn)證數(shù)據(jù)集,作者分別評(píng)估了SSP模型在僅接受手術(shù)治療和輔助治療的患者中的預(yù)后表現(xiàn),此外,研究還開(kāi)發(fā)了相應(yīng)的R包”CLAMS”,并用另外兩個(gè)數(shù)據(jù)集測(cè)試了CLAMS在FFEP組織中的適用性。

結(jié)果分析
SSP2分類(lèi)模型共包含18個(gè)基因?qū)?36個(gè)基因),通路富集分析的結(jié)果表明它們主要富集在細(xì)胞周期等生物學(xué)過(guò)程,SSP3包含141個(gè)基因?qū)?259個(gè)基因),這些基因富集到了細(xì)胞周期、細(xì)胞遷移和定位、細(xì)胞外基質(zhì)等功能類(lèi),圖2.B分別展示了它們和NCC分類(lèi)基因的交集情況,占比都是50%左右。對(duì)SSP2分類(lèi)結(jié)果的病理評(píng)估表明,87.5%以鱗片狀生長(zhǎng)模式為主的腫瘤屬于TRU亞型,而在這兩種亞型中,以乳頭狀生長(zhǎng)模式為主的病例在TRU亞型中的占比要顯著的高一些,表明了SSP分類(lèi)與LUAD生長(zhǎng)模式的相關(guān)型。以NCC分類(lèi)結(jié)果為標(biāo)準(zhǔn),在所有驗(yàn)證集中,SSP2的分類(lèi)準(zhǔn)確性為0.85,SSP3的準(zhǔn)確性為0.81。

在驗(yàn)證集中,大約有1/7的樣本,NCC和SSP2對(duì)它們的分類(lèi)結(jié)果不一致,同分類(lèi)結(jié)果一致的樣本相比,在這一群組中,非吸煙和II期腫瘤患者的占比較高。為了進(jìn)一步分析這些樣本,作者根據(jù)兩個(gè)分類(lèi)器的結(jié)果將所有驗(yàn)證樣本賦予TRU-TRU,TRU-nonTRU,nonTRU-TRU 和nonTRU-nonTRU標(biāo)簽。對(duì)增殖相關(guān)基因MKI67表達(dá)的分析表明,nonTRU-nonTR組比TRU-TRU組的增殖率更高。預(yù)后分析結(jié)果也表明,TRU-TRU患者的5年生存率高于nonTRU-nonTRU患者,而且NCC分類(lèi)的TRU 亞型以及SSP2分類(lèi)得到的nonTRU 亞型的生存模式與nonTRU-nonTRU患者相似(圖3),這么一看,SSP2的分類(lèi)結(jié)果好像更準(zhǔn)確一些。

在接受手術(shù)治療的I期患者中,SSP2預(yù)測(cè)的TRU患者組的OS和DMFS均顯著高于nonTRU組(圖4.A-B)。最后,作者開(kāi)發(fā)了R包”CLAMS”,利用44例I期肺腺癌患者的FFPE RNA數(shù)據(jù)評(píng)估SSP2模型,通過(guò)層次聚類(lèi)證實(shí)了分類(lèi)結(jié)果。在TRU亞型中,71%的患者在5年后無(wú)轉(zhuǎn)移,nonTRU亞型只有33%。此外,作者還做了生存分析,CLAMS可以很好的根據(jù)預(yù)后的好壞將患者分層,在另一個(gè)數(shù)據(jù)集中,也得到了同樣的結(jié)果(圖4.F-G)。

萬(wàn)物皆可泛
既然SSP可以用于肺腺癌,那其他癌型又差哪了呢?于是,工具有了,作者就開(kāi)始用泛癌搞事情了,然后,一篇文章又發(fā)表了,此處請(qǐng)自動(dòng)腦補(bǔ)表情包。
首先呢,作者從TCGA、GOBO、SCAN-B等公共數(shù)據(jù)庫(kù)以及已有研究下載了40個(gè)數(shù)據(jù)集,涵蓋了32種癌型,根據(jù)不同的數(shù)據(jù)類(lèi)型,分別做了患者預(yù)后分析、腫瘤增殖分析和治療反應(yīng)預(yù)測(cè)分析(圖5),這篇文章用的是CLAMS中的SSP2分類(lèi)模型。

在有預(yù)后數(shù)據(jù)的14個(gè)數(shù)據(jù)集(包含12種癌型)中,除了LUAD外,浸潤(rùn)性乳腺癌(BRCA)、低級(jí)別膠質(zhì)瘤(LGG)、腎乳頭狀細(xì)胞癌(KIP)和肝細(xì)胞癌(LIHC)這四種癌型的兩個(gè)預(yù)后組之間的總生存率也表現(xiàn)出顯著差異,并且被CLAMS分為預(yù)后不良的一組(nonTRU)死亡風(fēng)險(xiǎn)也更高(圖6)。
在乳腺癌的分類(lèi)結(jié)果中,TRU樣本為L(zhǎng)uminal A亞型,并且大多數(shù)ER或PR陽(yáng)性,以及HER2陰性。當(dāng)將腫瘤大小、年齡、性別等作為協(xié)變量,進(jìn)行多變量Cox回歸分析時(shí),GOBO和SCAN-B中的nonTRU亞型死亡風(fēng)險(xiǎn)仍顯著高于TRU組。But,在這三個(gè)來(lái)自不同數(shù)據(jù)庫(kù)的乳腺癌數(shù)據(jù)集中,只有TCGA數(shù)據(jù)集沒(méi)有表現(xiàn)出兩個(gè)預(yù)后組之間的差異性,研究對(duì)此也沒(méi)能給出合理的解釋。
在對(duì)LGG的分類(lèi)結(jié)果中,80%多的樣本被CLAMS分類(lèi)為nonTRU,同III級(jí)腫瘤樣本相比,II級(jí)腫瘤中的TRU亞型更多,這與生物學(xué)事實(shí)相一致,但是在多變量Cox回歸分析的結(jié)果中,CLAMS兩類(lèi)亞型未表現(xiàn)出顯著的生存差異,作者將其歸因?yàn)闃颖玖刻 ?/p>
對(duì)LIHC和KIP的分類(lèi)結(jié)果也是如此,nonTRU組的樣本預(yù)后更差,死亡風(fēng)險(xiǎn)更高,兩種亞型在多變量Cox回歸分析的結(jié)果中,也均未表現(xiàn)出顯著差異。

由于CLAMS所用的分類(lèi)基因大多與腫瘤增殖相關(guān),為了檢驗(yàn)TRU這一亞型的腫瘤細(xì)胞增殖率是否低于nonTRU亞型,作者接下來(lái)通過(guò)基因網(wǎng)絡(luò)分析,比較了一組肺癌腫瘤增殖相關(guān)基因在這兩種亞型中的表達(dá)差異,雖然不同癌型的腫瘤增殖水平不同,但是在所有類(lèi)型的腫瘤中,預(yù)后較好的TRU組的腫瘤增殖基因排秩得分都低于nonTRU組(圖7)。此外,在BRCA、LGG和KIP(LIHC除外)中,預(yù)后較好的分子亞型傾向于有更多低增殖得分的樣本,

然后,為了分析增殖得分是否可以作為單獨(dú)的預(yù)后因子,作者根據(jù)之前計(jì)算所得的等級(jí)評(píng)分,將每個(gè)惡性腫瘤的樣本等分為低、中、高三個(gè)增殖組(圖8)。研究發(fā)現(xiàn),在LUAD、BRCA等5種癌型的分析結(jié)果中,不同的預(yù)后組之間的生存結(jié)果顯著不同,不同的增殖組間的生存也表型出顯著差異。
最后,為了評(píng)估CLAMS的預(yù)測(cè)效能,作者將其應(yīng)用于6個(gè)包含治療反應(yīng)信息的數(shù)據(jù)集,并未發(fā)現(xiàn)良好預(yù)后與治療反應(yīng)之間的關(guān)系。

到這,兩篇文章就看完了,怎么說(shuō)呢,小編總覺(jué)得在有第一篇文章的基礎(chǔ)上,第二篇的泛癌分析略顯單薄,很多結(jié)果都是淺嘗輒止,缺乏更深層次的分析,但是作為一篇方法學(xué)文章,它也確實(shí)有自己的優(yōu)點(diǎn)所在,比如適用于泛癌,不局限于某一特定的平臺(tái)及數(shù)據(jù)預(yù)處理方法,對(duì)早期肺腺癌的風(fēng)險(xiǎn)分層和治療選擇也都有一定的幫助,所以,分析方面就不要苛求太多了!好啦,今天的分享結(jié)束了,Have a nice day!

參考文獻(xiàn):
Nacer DF, Liljedahl H, Karlsson A, Lindgren D, Staaf J. Pan-cancer application of a lung-adenocarcinoma-derived gene-expression-based prognostic predictor. Brief Bioinform. 2021 Nov 5;22(6):bbab154. doi: 10.1093/bib/bbab154. PMID: 33971670; PMCID: PMC8574611.
Liljedahl H, Karlsson A, Oskarsdottir GN, Salomonsson A, Brunnstr?m H, Erlingsdottir G, J?nsson M, Isaksson S, Arbajian E, Ortiz-Villalón C, Hussein A, Bergman B, Vikstr?m A, Monsef N, Branden E, Koyi H, de Petris L, Patthey A, Behndig AF, Johansson M, Planck M, Staaf J. A gene expression-based single sample predictor of lung adenocarcinoma molecular subtype and prognosis. Int J Cancer. 2021 Jan 1;148(1):238-251. doi: 10.1002/ijc.33242. Epub 2020 Aug 12. PMID: 32745259; PMCID: PMC7689824.