WGCNA使用非常廣泛,網上流傳的示例代碼也非常多,但還是推薦大家直接參考官方代碼,最全面且權威:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/index.html
今天不講代碼,只講講這些圖怎么看,能表達什么意義。
WGCNA文章[1]給出了工作流程圖,主要包括:構建共表達網絡→模塊識別→模塊與性狀關聯→模塊相關性→關鍵模塊中識別核心基因

在構建共表達網絡之前,還有一步比較關鍵的步驟——尋找最優軟閾值(soft thresholding或power),使構建的網絡更符合無標度拓撲結構。這時,我們會看到如下圖:

確定最優軟閾值主要參考左圖,即在不同軟閾值(x軸)情況下的無標度擬合指數(scale-free fit index,y軸)。其中紅線表示主觀選擇的無標度擬合指數取值,如圖為0.9,一般我們選擇0.8~0.95之間較為穩妥。從左圖看,當無標度擬合指數在0.9時,符合構建無標度網絡的最小軟閾值為6,因此可以選擇6作為最優軟閾值用于后續分析。右圖為不同軟閾值情況下的網絡連通度。
基于最優軟閾值構建共表達網絡,將基因劃分到不同模塊后,可以繪制基因聚類樹:

這個圖可以分為兩部分看:上半部分是基因的層次聚類樹狀圖,下半部分是基因模塊,也就是網絡模塊。上下對應,可以看到距離較近的基因(聚類到同一條分支)被劃分到了同一模塊。
接著,計算模塊與感興趣的臨床特征之間的相關性與顯著性,繪制相關性熱圖:

上圖中,最左側的顏色塊代表模塊,最右側的顏色條代表相關性范圍。中間部分的熱圖中,顏色越深相關性越高,紅色表示正相關,綠色表示負相關;每個單元格中的數字表示相關性和顯著性。如上圖,brown模塊與weight性狀表現為正相關且相關性最高。此時,我們可以選擇相關性最高的brown模塊作為關鍵模塊。一般,我們會按相關性的絕對值篩選最相關模塊,即負相關模塊也應該考慮在內。需要注意的是,grey模塊中包含了所有未參與聚類的基因,因此是無效模塊,不應用于后續分析。
基于拓撲重疊矩陣,可以繪制基因之間的相關性熱圖。其中顏色越深,說明基因之間的相互作用越強。由于對角線表示模塊內部基因之間的相互作用,所以自然是對角線上的顏色最深:

也可以看看模塊之間的聚類樹和相關性熱圖,探索模塊之間的互作關系:

可以將感興趣的性狀,如weight也加入到圖中。如上圖,可以發現red、brown、blue模塊之間有很強的相關性,甚至比他們與weight之間的相關性更強。
之后針對關鍵模塊brown和感興趣的性狀weight進一步挖掘,看看基因與模塊的相關性(Module Membership, MM)和基因與性狀的相關性(Gene Significance, GS)之間是否有某種關聯。
`

通過以上散點圖,可以發現MM和GS呈正相關,說明這些與性狀高度相關的基因,在關鍵模塊中也扮演著舉足輕重的角色。
我們也可以基于關鍵模塊中基因之間的相似性,構建關鍵模塊網絡,以Cytoscape或VisANT軟件可視化展示網絡中基因之間的互作關系:

最后,也是最重要的——基于關鍵模塊篩選核心基因。這一步的可用方法比較多,沒有固定限制。比如,可以根據MM>0.8且GS>0.3篩選核心基因[2];可以根據關鍵模塊的網絡degree篩選top 30作為核心基因[3];也可以計算kME值,依據|kME|≥0.7篩選[4];或者將網絡導入Cytoscape后,利用插件cytoHubba篩選[5]。
參考文獻:
1. Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008;9:559. Published 2008 Dec 29. doi:10.1186/1471-2105-9-559
2. Song ZY, Chao F, Zhuo Z, Ma Z, Li W, Chen G. Identification of hub genes in prostate cancer using robust rank aggregation and weighted gene co-expression network analysis. Aging (Albany NY). 2019;11(13):4736-4756. doi:10.18632/aging.102087
3. Zhang X, Feng H, Li Z, et al. Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis. Onco Targets Ther. 2018;11:6001-6021. Published 2018 Sep 19. doi:10.2147/OTT.S171791
4. Panahi B, Hejazi MA. Weighted gene co-expression network analysis of the salt-responsive transcriptomes reveals novel hub genes in green halophytic microalgae Dunaliella salina. Sci Rep. 2021;11(1):1607. Published 2021 Jan 15. doi:10.1038/s41598-020-80945-3
5. Li CY, Cai JH, Tsai JJP, Wang CCN. Identification of Hub Genes Associated With Development of Head and Neck Squamous Cell Carcinoma by Integrated Bioinformatics Analysis. Front Oncol. 2020;10:681. Published 2020 May 22. doi:10.3389/fonc.2020.00681