今天來給大家分享一篇近期的綜述。Nature Reviews Cancer (IF=53.030) 于7月6日發表了一篇關于人類癌癥中非編碼驅動突變的綜述,作者重點從體細胞點突變和小插入缺失的角度,總結了癌癥基因組領域的最新發現,探討了癌癥中非編碼驅動事件相對較少的可能原因,并討論了關于檢測非編碼DNA中正選擇信號的各種挑戰。感興趣的小伙伴跟小編一起往下看看文章的內容~
圖1. 文章標題 相關背景:
多年來,科學家通過基于外顯子組的分析成功地繪制了蛋白質編碼區域的體細胞變化,這激發了大家對于其他非編碼區的癌癥驅動突變的熱烈研究。然而,一直以來的核心挑戰是將重要的驅動突變從非編碼基因組中產生的大量非功能性的passenger突變中分離出來,而非編碼基因組可比編碼基因組大50多倍。 癌癥中驅動基因的活性經常通過轉錄激活或失活而發生改變,這可以通過廣泛重復的DNA拷貝數或啟動子甲基化事件來影響關鍵致癌基因或腫瘤抑制因子,因此非編碼點突變和小插入缺失也可能有多種導致腫瘤發生的途徑,包括增強子序列的改變、染色質區域結構被破壞而導致的基因表達的改變、影響mRNA穩定性或蛋白翻譯的5’或3’非翻譯 (UTR) 區變異,以及非編碼調控RNA突變(如圖2)。 圖2. 非編碼突變有助于腫瘤發生的機制 一、檢測癌癥中的驅動突變(driver)的挑戰:
(1)評估選擇作用的挑戰:
癌癥中的大多數突變是無法提供克隆性生長優勢的passenger突變,其出現頻率約等于中性選擇下的期望突變率。 人類基因組的巨大規模和癌癥中的高突變負荷表明,功能性非編碼元件的passenger突變會頻繁出現。 與蛋白編碼DNA一樣,非編碼DNA分析的一個關鍵挑戰是可靠地識別正選擇信號。 (2)基因組突變率的關鍵協變量:
識別選擇信號的基本原理: 在一個癌癥隊列中,如果一個堿基、基因或其他基因組元件的突變比(中性選擇的零假設下)隨機期望的出現得更頻繁,那么就認為該突變在腫瘤發展過程中是被正向選擇的。癌癥基因組上存在突變率的廣泛異質性: (1)突變率變異性的主要來源是差異的DNA修復,特別是錯配修復和核苷酸切除修復(在紫外線暴露的腫瘤中,如圖3)。這些修復過程在早期復制、轉錄活性的常染色質區域更加活躍,因此復制時間和異染色質相關組蛋白標記是突變率的強決定性因素。(2)在單堿基水平上,突變概率明顯受到三核苷酸序列上下文的影響,相關的突變過程及其序列特征的研究揭示了該現象。圖3. 基因組突變率異質性的來源 (3)局部突變現象會干擾driver的檢測:
近年來出現了大量的識別非編碼DNA中選擇信號的方法(如圖4)。其中很多方法僅依靠突變數據來估計局部(例如,基因水平或千堿基規模)突變率變異性。但是,對于基因組中特定堿基或較小位點的各種局部突變現象,仍然是混雜信號來源,特別是對于非編碼突變。 在外顯子組外,DNA修復的保真度可能會降低,而龐大的非編碼基因組更容易出現局部突變過程,很難進行預測和建模,而且一般的driver檢測工具被沒有考慮該問題,因此我們需要對結果進行進一步的過濾。 紫外線照射下的皮膚癌說明了局部突變效應對突變景觀的深遠影響。除了少數已知的驅動突變外,黑素瘤全基因組最常發生突變的堿基主要是啟動子中顯著的突變熱點,特別是ETS家族轉錄因子預測的結合位點(如圖5)。其他幾個局部突變效應已知會導致腫瘤中的非編碼突變熱點(如圖5)。 圖4. 識別非編碼DNA中選擇信號的方法
圖5. 紫外線突變過程的局部易感性 二、PCAWG項目的研究結果:
2013年,隨著WGS的數據在癌癥基因組圖譜(TCGA)和國際癌癥基因組聯盟(ICGC)的數據庫中不斷積累,就產生了整理一項研究全基因組規模的癌癥基因變異的想法。來自泛癌癥全基因組分析(PCAWG)聯盟的初步結果涵蓋了38種癌癥類型(主要是實體瘤)的2658個腫瘤,涉及37個國家的1300多名科學家,最終于2020年作為論文集合發表,每一篇文章涵蓋了腫瘤生物學的不同方面,包括非編碼的體細胞驅動事件。 PCAWG的結果強調了TERT啟動子突變在人類癌癥中的高流行率(如圖6)。TERT啟動子突變,現在被認為是人類癌癥中最頻繁發生的突變事件之一,其建立了非編碼調控DNA突變作為改變driver基因轉錄的有效手段。 但除了TERT以外,很難捕獲到其他非編碼基因的選擇信號。編碼事件主導了結果,在通過后過濾的20個顯著突變的非編碼元素中,大多數仍然被認為可能是假陽性,這要么是因為缺少driver的額外證據,要么是因為存在技術人工因素,其中包括編碼microRNA 663a (MIR663A)基因的啟動子和G029190長非編碼RNA。 非編碼DNA中選擇信號缺乏的可能原因:PCAWG中雖然少數病例超過200例(肝癌、乳腺癌、前列腺癌和胰腺癌),但大多數腫瘤特異性隊列的病例少于100例。而互作調節狀態以及driver突變通常是高度組織特異性的,因此對于僅有個別癌癥具有較大WGS規模的研究,是無法完全成功地揭示新的非編碼癌癥驅動事件。 圖6. PCAWG中的蛋白編碼和非編碼元件的頻發突變 三、最新的研究進展:
通過對PCAWG數據的重新分析,最近的兩項研究顯示,在幾種癌癥中,U1小核RNA反復發生突變。U1小核RNA是一個重復基因座,在最初的PCAWG研究中沒有考慮到。雖然這種突變在總體癌癥中并不常見,但在某些癌癥類型中有很高的復發率,約50%的Sonic hedgehog突變的成神經管細胞瘤中有這種突變。 另外,對來自PCAWG隊列的1844個腫瘤進行再分析(不包括高突變樣本和先前有TFBSs突變率增加證據的癌癥類型)發現,表觀基因組數據定義的幾個調節元件中存在顯著的過度突變,其中很多都沒有在最初的PCAWG論文中考慮,包括一個遠端增強子的突變,該突變通過染色質的長期相互作用與注釋腫瘤抑制因子CCNB1IP1的負轉錄調控相連,這在1.3%的患者中發生。 其他幾項研究報告了增強子的突變,包括一項基于WGS分析的98例乳腺癌樣本的研究,73例雌激素受體α (ESR1)陽性腫瘤中約7%在控制ESR1表達的遠端和近端元件中存在體細胞單基替代。體外報告基因分析顯示,大多數突變是激活的,與已知乳腺癌風險變異的共定位進一步增加了這些發現的可信度。 這些例子強調,如今通過使用改進的方法、更好的非編碼基因組注釋或更大的癌癥特異性隊列,仍然可以發現額外的非編碼driver。 文章小結:
最近的非編碼突變研究已經取得了一些發現,雖然像TERT這樣的突破可能很少,不過這個領域還正處于初始階段。隨著計算方法的改進(包括更好的突變率模型)和對人類基因組調控線路的日益了解,更多可能的發現即將到來。隨著已驗證的非編碼driver突變的增加,這將有助于識別特定腫瘤或癌癥類型中的功能性非編碼事件,最終再將這些知識轉化為臨床有用的分析或治療方法。