《Cell》上的生信分析!!!

這篇文章發表在期刊《Cell》上的,文章的質量不言而喻。在最近一年的影響因子為41.582。中科院大類: 生物學 1區,中科院小類: 1區 生化與分子生物學。這項研究證實了主調節蛋白提供的分子邏輯整合了許多不同的和患者特異性突變的影響,以實現特定腫瘤亞型的轉錄狀態,從而極大地擴大了可能對相同治療做出反應的患者的比例。更具體地說,這項新的研究表明,更大比例的患者可能對靶向主調節蛋白的新藥物有反應,而不是尋找靶向與越來越小的患者亞群相關的突變基因的藥物。
背景知識:
綜合基因組分析,利用基于網絡的方法,確定了407個主調節蛋白(MR),這些蛋白質負責將癌癥基因組圖譜(TCGA)中20個隊列的個體樣本的遺傳學歸入112個轉錄上不同的腫瘤亞型。MR蛋白可以進一步組織成24個泛癌,主調節模塊(MRB),每個模塊都調節關鍵的癌癥標志,并在多個隊列中預測患者的結果。
結果解讀:

(A).主調節蛋白(MR)蛋白(如MR1-MR12)在上游途徑蛋白(如P1-P5)中整合了基因組改變(小紅球)和異常旁分泌和內分泌信號(小藍球)的影響。此外,它們還通過激活和抑制的靶標(分別為紅色和藍色邊緣)調節細胞的“下游”轉錄特性--表現為基因表達特征,基因表達從最低(藍色)到最高(紅色)。Passenger改變(小黑球)和不影響細胞轉錄特性的改變發生在下游效應器(例如P7)中,這不影響MR活性的蛋白質(例如P6)。MR蛋白形成嚴格自動調節的模塊化結構(腫瘤檢查點),負責控制癌細胞轉錄特性的動態平衡。
(B).腫瘤檢查點由多個子模塊結構組成,稱為MR塊(MRB),它們調節特定的腫瘤標志,并在不同的亞型中被反復檢測到。作為說明性示例,示出了包括三個不同MRB的腫瘤檢查點。
(C).MOMA算法的概念性工作流程圖。
在每個隊列中,通過使用集群可靠性分數(CRS)來確定最佳集群數量。當然,腎透明細胞癌(KIRC)的五組解決方案是一個說明性的例子,包括第5組(最差)和第3組(最佳)的不同結果。

(A).MOMA確定的隊列亞型,從最低的子宮內膜癌(UCEC)到最高的結腸腺癌(COAD),最佳亞型的數量(x軸)。解決方案的最佳性由網點的大小和顏色表示,較大、較紅的網點代表較高的平均CRSS。選定的解決方案用黑色十字標記。通過Kaplan Meier分析,最好和最差星團之間的存活間隔的統計意義顯示在代表-Log10p的藍色條旁邊。虛線表示p=0.05。
(B).小提琴曲線圖,表示通過基于MR(藍色)或基于表達式(紅色)的聚類分析推斷的用于最佳聚類解決方案的20個TCGA組織類型(x軸)中的每一個的輪廓得分概率密度(y軸)。紅線虛線表示標準統計顯著性閾值(SS=0.25)。
(C).TCGA腎透明細胞癌隊列(KIRC)基于MR的聚類熱圖。行代表腫瘤檢查點MR蛋白,而列代表單個樣本。色標與蛋白質活性成正比(紅色激活,藍色失活)。
(D).S5亞型(紅線)與S3亞型(綠線)患者生存的Cox比例風險分析(p=1.1310×10-16)。
腫瘤檢查點被定義為具有最小MR譜系的模塊,通過引導上游通路中的基因組事件來實現腫瘤的轉錄識別。因此,自拍者使用飽和度分析將MOMA分析產生的亞型特異蛋白的初始排序列表提煉為一小部分候選MRs,這些候選MRs最好地解釋了亞型的遺傳格局。


單獨的曲線顯示了當n從1增加到100時,在nMOMA推斷的MR蛋白頂端上游確定的每個樣本中每個亞型的功能基因組事件的平均比例。零假設(即,從1253個無統計學意義的調控蛋白(所有MOMA排序的蛋白的下半部分)中隨機選擇n個MRS)產生的飽和曲線顯示為灰色。按腫瘤檢查點MRS所占遺傳事件比例的降序對隊列進行排序。為保持視覺清晰度,最后五組以擴展的y軸比例顯示(0%-50%)
這幅圖展示了37個最頻繁激活的MR蛋白,根據飽和分析,這些蛋白使mR15 MOMA推斷的亞型(黑色細胞)的基因改變效應變得通道化。行表示按其亞型特異性活性聚類的MR蛋白,以突出在相同聚類(例如,FOXM1和CENPF)中共激活的MRS,而列中顯示MOMA推斷的亞型,按腫瘤類型分組。矩陣的左側顯示了每個MR基于其異常激活的子類型的數量的重復排名,而子類型的數量顯示在右側,以條形圖的形式顯示。在矩陣的左側顯示每個MR的重復等級,在矩陣的左側顯示其異常激活的子類型的數量,在右側以條形圖的形式顯示子類型的數量。
與從2,506個調控蛋白中隨機選擇的相同大小的蛋白質集進行比較,對現有分子相互作用網絡的分析證實,腫瘤檢查點代表著超連接模塊。
圖4.基因組改變失調的Coad腫瘤檢查點
(A-D).OncoPrint圖顯示了COAD中S2/S3(MSIHigh)(A和 B)和S5/S6(MSS)(C和D)亞型上游的基因組改變。僅顯示SCNA焦點事件。水平直方圖和百分比顯示出包含特定事件類型的樣本的比例。垂直直方圖顯示在每個樣本中檢測到的事件數量。對于SCNAs,每一行對應于一個獨立的細胞帶,由功能上確定的癌蛋白/腫瘤抑制因子(STAR方法)識別。藍色標記只在一個亞型中檢測到基因改變,而在另一個亞型中沒有檢測到(即S2對S3或S5對S6),橙色標記顯示不成比例的改變在不同的亞型中出現,而紅色標記顯示S2中的錯配修復基因。
(E).S5中變化的OncoPrint圖,包括地區性(即非重點)SCNA中的變化,多數受影響的事件用紅色標簽顯示。
(F).基因組事件類型的圖例
(G-J).Coad亞型S2(G)、S3(H)、S5(I)和S6(J)的基因組飽和曲線。垂直虛線表示飽和閾值。
作者根據Achilles計劃的數據進一步評估了推斷的腫瘤檢查點MRS是否富含必要的蛋白質。具體地說,通過蛋白質活性分析鑒定了與MOMA推斷的亞型最佳匹配的細胞系。然后根據匹配細胞系中的Achilles評分來評估其重要性。
為了評估MRB是否可以對患者的預后進行分層,作者使用了以MRB活動為預測因子的Lasso Cox比例風險回歸模型。這20個TCGA隊列中有16個可以有效地分層,與腫瘤檢查點分層相比,p值通常有很大的改善。


按腫瘤類型分組,熱圖顯示MOMA陰性轉錄亞型的MRBS激活(ON)和失活(OFF)有統計學意義(P<10-3)。顏色飽和度與統計學意義成正比(MRB MRS的平均蛋白質活性),參見色標圖例。乳腺癌(BRCA)和黑色素瘤(SKCM)亞型分別被標記為突出MRB:7和MRB:24的差異激活,也被突出顯示。水平直方圖顯示具有顯著激活(紅色)和非激活(藍色)塊的子類型的總數,也顯示數值以便于清晰。
.MRB MRS及其轉錄靶點(Benjamini-Hochberg和超幾何檢驗的假發現率[FDR]<0.05)中腫瘤標志物的豐富確定了與每個MRB顯著相關的標志物。順序基于行和列之間的共同聚類,以突出相關特征。
.MRB:7活動對Metabric乳腺癌隊列中的生存進行分層(p=3.53×10-8;Kaplan Meier)。
.在TCGA黑色素瘤隊列中,MRB:24活性顯著影響患者的生存(p<1.93×10-5)。與MRB:7相比,MRB:24的活性越高,預后越好,這與其作為炎癥和免疫感應標志物的作用一致。
為了驗證基因改變對MRB活性的影響,作者選擇了MRB:2,它是所有亞型中最頻繁激活的。通過正則化Cox回歸,MRB:2在TCGA中產生了一些最大的結果回歸系數,成為不良結果的最重要的預測因子之一。


A)熱圖顯示TCGA前列腺癌隊列(PRAD)基于MR的聚集性,分為7個分子上不同的亞型,如圖2C所示。
(B)Gleason評分頻率按亞型分層。
(C)按亞型劃分的生化復發情況。
(D)MRB基因富集:2個在S1和S6亞型間差異表達的標志性基因,經t檢驗分析排序。每個標記中的基因以黑色刻度表示,統計顯著性由基因集富集分析計算(p<2.23×10-16,即低于最小可計算顯著性)。
然后,作者想探索MRB活性和相關功能是否可能受到藥物調節。作者重點研究了MRB:14,它的活性在建立和維持激素介導的腔上皮特性和細胞黏附表型方面起著至關重要的作用。


(A).功能驗證分析的概念圖。用慢病毒非靶向對照載體和含有shRNA發夾的慢病毒載體感染雄激素非依賴性22Rv1前列腺癌細胞,沉默MRB:2上游有預測的、反復發生的基因組事件的基因。然后用穩定沉默的克隆細胞進行體外和體內實驗。
(B).對每個沉默條件(列)中的8個MRB核心組蛋白(行)進行VIPER分析。總體MRB:2差異活性的意義如上所示。
(C).在創傷愈合實驗中評估22Rv1細胞的遷移情況,分別于傷后24小時(對照組)、48小時和72小時觀察對照細胞對22Rv1細胞的沉默,一式三份。
(D).遷移試驗的定量。條形表示遷移百分比(空隙面積與T=24小時相比)±平均值的標準誤差(SEM)。兩個發夾的P值經Fisher‘s法積分(*p<0.0 5,**p<0.001,經單尾t檢驗)。
(E).Boyden小室侵襲實驗定量,一式三份。條形代表浸潤細胞的比例。兩個發夾的掃描電鏡p值用Fisher‘s法進行積分(**p<0.001,單尾t檢驗)。
(F).功能性,用于腫瘤致癌效應的活體驗證。移植了對照組和沉默的22Rv1細胞的小鼠的腫瘤生長曲線最長可達35天。在活體分析中,三個重復和誤差條代表±SEM;*p<0.001和**p<0.001,用雙尾、雙向方差分析。
(G).顯示選定藥物擾動(列)對MRB活性影響的熱圖:24小時的14個MR蛋白(行)。根據劑量反應曲線,藥物名稱后面是其EC20濃度。熱圖頂部的顏色條表示平均MRB:14差異活動的重要性。
(H).藥物治療后DU145細胞遷移實驗的改良,以激活MRB:14,在藥物治療后24小時進行評估。
(I).在減去DMSO處理的細胞中的任何剩余間隙面積后,通過沿間隙積分測量R3圖像來定量平均間隙面積(間隙剩余)。剩余間隙百分比是相對于0小時時的圖像計算的。誤差條表示±SEM。
全文小結:
本篇范文作者通過使用整合多組學數據的MOMA算法,在調節腫瘤特性的蛋白質和誘導其異常活動的基因組改變之間建立更直接的聯系。從分析中發現的細粒度亞型結構揭示了一種高度模塊化和重復性的調控結構。最終通過亞型特異性、組合激活或失活24個主調控模塊(MRB)來實現。