如何從患者的臨床數據入手進行生信分析?今天小編和大家分享的一篇今年11月剛剛發表在Nat Commun(IF:17.694)雜志上的文章就給出了答案。由于青少年和青年中癌癥具有很高的發病率及死亡率,但其生物學基礎尚不完全清楚,因此這篇文章就從患者年齡數據入手,進行了一系列基因及臨床分組分析。文章條理清晰,內容豐富,而且這種從患者臨床表型入手的生信分析思路也十分值得我們參考學習,長話短說,現在就讓小編帶大家一睹為快吧。
Genomic disparities between cancers in adolescent and young adults and in older adults
癌癥在青少年、青年和老年人中的基因組差異
一.文章背景
如今研究發現在美國每年青少年和青年人(adolescents and young adults,AYA;15-39歲)中約有89000人受到癌癥影響,而老年人( older adults,OA;>39歲)的發病率約為5%,比兒童(0-14歲)高8倍。此外,在過去的30年里,AYA患者的生存率幾乎沒有任何改善,而兒童和老年人的生存卻有了顯著的提高。而且由于缺乏專門的AYA癌癥項目,許多研究將AYA患者與年幼的兒童或老年人分組,加之AYA患者參加臨床試驗的人數也較少,因此人們對AYA相關的基因組改變仍知之甚少。所以這篇文章就對癌癥的AYA和OA組進行了系統性地比較。
二.文章摘要
文章分析了來自GENIE數據庫的臨床數據及基因組數據,對超過10萬例AYA和OA癌癥患者進行了分析,并比較了AYA和OA組之間的臨床和基因組差異。結果研究發現AYA和OA組癌癥患者在臨床表現上有顯著差異。此外,研究也發現在大多數癌癥類型中,AYA組表現出較低的突變負荷和較少的基因組不穩定性,這也導致大多數癌癥基因在AYA組中表現出較少的突變和拷貝數變化。然而,研究也發現CTNNB1和BRAF突變的比例在AYA組的多種癌癥類型中過高,且AYA組也表現出更多的驅動基因融合。研究也進一步發現組織學亞型是導致AYA和OA之間遺傳差異的一個重要因素。最后研究通過突變特征分析也發現AYA中內源性突變過程較強,外源性突變過程較弱。
三.研究的主要內容及結果
1. AYA 和 OA 癌癥的臨床差異
在文章的第一部分,作者首先對AYA和OA組癌癥患者的臨床差異進行了介紹。研究納入了GENIE隊列的19種癌癥類型,分別為甲狀腺癌、腎細胞癌、黑素瘤、頭頸癌、食管胃癌、結腸直腸癌、白血病、肝膽的癌癥、胰腺癌、骨癌、乳腺癌、生殖細胞瘤、原發不明的癌癥、軟組織肉瘤、中樞神經系統癌癥、神經膠質瘤、非小細胞肺癌、卵巢癌及子宮頸癌,并基于年齡分為AYA和OA組。研究發現除了乳腺癌、卵巢癌和宮頸癌(CESC)等與性別相關的癌癥類型外,AYA組中的甲狀腺癌(THCA)、腎細胞癌、黑色素瘤、頭頸癌、食道胃癌和結腸直腸癌的女性比例更高 (圖1a),這表明性別與AYA患癌密切相關。進一步作者也發現有八種癌癥類型在兩組間存在轉移比例差異(圖1b)。研究也觀察到,在AYA組中有9種癌癥表現出非西班牙裔亞裔患者顯著增加(圖1c),另有13種癌癥表現出非西班牙裔白人比例降低。接下來,作者比較了兩組的組織學亞型,將GENIE數據集中的19種癌癥進一步劃分為371個亞型,結果發現了105種亞型在兩組間存在不同分布,表明AYA和OA在癌癥組織學上存在廣泛的差異。

2. AYA 和 OA組間的基因組差異
在這一部分文章對AYA和OA組癌癥之間的遺傳差異進行了刻畫。研究比較了兩組患者的總體腫瘤突變負荷(TMB),共涉及16種癌癥,結果發現AYA組的中位TMB比OA組低。此外,作者也觀察到兩組間有13種癌癥的TMB存在顯著差異。接下來作者使用Fisher’s檢驗和logistic模型兩種方法識別出88個顯著的基因-癌癥對(gene-cancer),其中41對是兩種方法都識別到的。作者發現logistic模型確定的基因-癌癥對中,有25對的突變僅與AYA有關,其余的突變則除了AYA外,還與一個或多個其他因素有關。對于僅通過Fisher精確檢驗確定的38個基因-癌癥對,作者發現有24對與組織學、性別和轉移狀態有關(圖2a,b),這些結果表明,組織學亞型在癌癥遺傳差異中起著重要作用。

3. AYA與OA組間基因表現出不同的突變率
接下來作者又對AYA及OA兩組間癌癥的基因突變頻率進行了分析。這一部分作者重點研究了上述88對基因癌癥對,將在兩種或兩種以上癌癥類型中發現的顯著基因分為復發基因,反之為非復發基因(圖2 d)。作者發現大多數復發基因在AYA中表現出較低的突變率(圖2c),這與AYA整體較低的TMBs一致。接著作者也觀察到非復發基因在AYA中顯示出較低的突變率(圖2d)。研究也發現表觀遺傳修飾相關基因往往在AYA中表現出更多的突變。此外,由于作者在一些兒童癌癥中觀察到BRAF和H3F3A等基因的頻繁突變,因此作者研究了AYA中這些基因突變率的增加是否是它們在兒童癌癥中頻繁突變的延伸。作者以膠質瘤為例對5個頻繁突變的膠質瘤基因進行了研究,結果作者發現從兒童到AYA再到OA,BRAF和H3F3A的突變率隨著患者年齡的增加不斷下降,然而,TP53、ATRX和IDH1卻與此相反,三者在AYA中突變率最高。這些結果表明,從遺傳學上講,AYA組不僅僅是兒童腫瘤的延伸。接下來作者使用TCGA數據集來對這些結果進行驗證,結果TCGA數據再現了這些差異,支持了研究結果具有魯棒性。
4. AYA中存在TERT啟動子突變
由于端粒酶對維持癌細胞的永生至關重要,因此在這一部分作者對編碼端粒酶相關亞基的TERT進行了分析。由于AYA患者較年輕,因此AYA中的癌癥更有可能起源于端粒酶活性細胞,因此可能攜帶較少的TERT啟動子(TERTp)突變。為了驗證這一假設,作者比較了15種癌癥類型中的TERTp突變。結果發現黑色素瘤的TERTp突變率最高,其次是頭頸癌、膠質瘤(圖2f)。接著作者對AYA及OA進行比較,發現在測試的15種癌癥類型中,有5種表現出顯著差異,包括膠質瘤、THCA、腎細胞癌、頭頸癌和卵巢癌。作者也發現AYA膠質瘤有更多ATRX突變, ATRX是一種染色質調控子,與端粒替代延長(ALT)有關。此外,作者構建了一個邏輯回歸模型,考慮了AYA狀態、性別、組織亞型和轉移狀態等因素,結果發現AYA與TERTp突變顯著相關。
5. AYA中的基因拷貝數分析
在這一部分作者對AYA中的基因拷貝數進行了分析。作者計算了基因組不穩定性(GI)分數來研究受拷貝數變化影響的基因組的比例。結果發現在檢查的16種癌癥中,AYA和OA之間的GI評分有顯著差異(圖3a)。除BRCA外,其余均顯示AYA評分較低。為了了解AYA中BRCA的GI較高的原因,比較了AYA和OA之間的基因水平拷貝數變化,并在9種癌癥類型中識別了46對顯著的基因-癌癥對,其中包括32個擴增和14個缺失(圖3b)。研究發現大多數基因-癌癥對在膠質瘤、BRCA和軟組織肉瘤的AYA中擴增更頻繁,而OA中缺失更頻繁。作者觀察到在AYA BRCA中識別出超過半數在AYA中過度表達的擴增基因(12/21),這些基因位于兩個擴增子中,一個包含ERBB2和CDK12,另一個包含其余基因。第一個擴增子與TP53突變同時發生,而第二個擴增子與GATA3突變同時發生(圖3c)。

6. AYA與OA的基因融合比較
在這一部分對AYA與OA中的基因融合進行了比較。作者首先檢查了復發融合的差異,結果發現了6對不同的融合-癌癥對(圖3d),其中5種在AYA中更為常見,包括軟組織肉瘤,非小細胞肺癌,THCA,以及膽管癌。接著為了評估這些融合的轉錄影響,作者使用TCGA數據比較了融合陽性和融合陰性腫瘤中參與融合的癌基因的表達水平。結果顯示,癌基因在融合陽性腫瘤中高度表達。接著作者將分析擴展到融合伴侶基因,并將分析限制在每個癌癥隊列中最低發生率為2%的基因,結果發現了16對癌癥-基因對(圖3e),其中8對來自上述復發融合,且在這8對有4對更頻繁地出現在AYA中。
7. AYA中的超突變樣本與免疫應答的關聯
在這一部分作者對AYA患者與ICB獲益的關聯進行了研究。作者使用MSK免疫治療隊列比較了接受免疫檢查點抑制劑(ICI)的患者的總生存率,結果發現在泛癌中AYA的總生存率較低(圖4a)。此外,多因素分析在控制了癌癥類型、轉移狀態和性別后也對上述結果進行了證實(圖4b)。作者推測AYA對ICIs反應較差的部分原因可能是其腫瘤突變負荷(TMB)較低。研究認為TMB越高的AYA患者反應越好,因此接下來作者計算了突變密度(即每Mb編碼非同義突變的數量)來識別了超突變體。結果作者在AYA中識別出了340個超突變體,在OA中識別出了5632個超突變體。接著為了研究AYA中超突變體機制,研究使用deconstructSigs將它們的突變分配給Catalogue of Somatic Mutations in Cancer (COSMIC),結果發現研究識別了一個顯性特征(圖4c)。接著作者發現遺傳缺陷導致的特征在AYA中比在OA中更常見(圖4d)。相比之下,與環境因素相關的特征在OA中更為頻繁。進一步,研究也發現一些特征在AYA中表現出癌癥偏性(圖4c)。研究也發現AYA的DNA錯配修復缺陷(MMR)膠質瘤的缺失單核苷酸變異(SNV)低于其他MMR腫瘤,但仍高于具有替莫唑胺(TMZ)暴露特征的膠質瘤(圖4e)。

8. AYA的臨床治療
在文章的最后一部分,作者對AYA的臨床治療進行了介紹。作者根據OncoKB(一個人工注釋的可操作的靶向藥物數據庫)對每個突變進行注釋(圖5)。結果發現在AYA中,11.8%的腫瘤中存在1級或2級改變,2.3% 的腫瘤存在3A級改變,23.5%的腫瘤存在3B級改變。根據OncoKB的定義,1級改變是指那些可以被FDA批準的藥物靶向的改變;2級是可以預測對FDA批準的藥物反應的標準護理生物標志物;3A級是研究藥物可能靶向的改變,3B級是針對不同癌癥類型的已批準或研究藥物的改變。

到這里這篇文章的主要內容就介紹完了,文章以患者年齡為切入點,對癌癥患者進行分層,進一步研究了不同年齡組的基因組及臨床特征。文章的內容豐富,邏輯嚴謹,有理有據,研究泛癌的小伙伴不要錯過呀。