前面小編寫了幾篇主要以實驗設(shè)計為主導(dǎo)的文獻解讀,本來是想著給大家多分享一些除了生信之外的科研思路,但感覺反響不是很好。于是,今天小編繼續(xù)之前的主題,解析如何利用生信的手段篩選出有研究價值的基因,從而做出一篇不錯的純生信文章。
小編上個月有寫過一篇解讀CD分子家族的基因(CD93,CD96)發(fā)表純生信文章的推文:如何利用大佬的研究發(fā)表自己的文章。這一次小編就以最近讀文獻遇到的另一個基因HHLA2為主線,系統(tǒng)分析如何利用HHLA2基因的特點來開展研究。
下面首先介紹一下這個基因:HHLA2,別名B7-H5, B7H7,看到這個別名有一些免疫知識的同志就能辨別出它是B7家族的基因了。然而,肯定還會有人問B7家族是啥?那小編舉幾個例子大家就知道了。B7家族屬于免疫球蛋白超家族(IgSF),其有很多的成員,包括B7-1(CD80)、B7-2(CD86)、B7-H1/PD-L1(CD274)、ICOS-L/B7-H2(CD275)、B7-H3(CD276)、B7-H4、B7-DC/PD-L2(CD273)和BT3.1(CD277)。相應(yīng)受體是CD28家族:B7-1/B7-2的受體是CD28/CTLA-4,可交叉結(jié)合;人B7-H2的受體是誘導(dǎo)性共刺激分子(ICOS);PD-L1和PD-L2的受體為PD-1。該家族是重要的協(xié)同刺激分子,可促進或抑制T細胞增殖和細胞因子產(chǎn)生,對B細胞活化、分子和抗體產(chǎn)生也發(fā)揮重要調(diào)節(jié)作用。
圖1:

那就是這樣的一個基因家族能做哪些研究呢?首先簡單來看兩篇這個家族的純生信文章吧。
第一篇是2016年發(fā)表在ONCOIMMUNOLOGY(IF:8.11)的一篇文章:Comprehensive molecular profiling of the B7 family of immune-regulatory ligands in breast cancer。2016年,當很多人還不知道生信是個什么東東的時候,別人已經(jīng)分析這個基因家族發(fā)了文章了,這也說明這個家族基因的重要性。
作者利用cBioPortal數(shù)據(jù)庫的數(shù)據(jù),對105種不同癌癥中目前已知的10種B7家族蛋白進行了全面的分析,發(fā)現(xiàn)B7家族成員在乳腺癌中表達水平升高。在1098名所有類型乳腺癌患者和82名三陰性乳腺癌患者中,B7家族基因的表達水平上調(diào)。通過分析這些基因的啟動子甲基化水平后,作者發(fā)現(xiàn)了在乳腺癌中某些B7家族基因的表達具有受表觀遺傳調(diào)控的基礎(chǔ)。此外,B7-H6基因組改變后的患者總生存期明顯較差,而且某些臨床屬性與B7-H6表達也相關(guān),提示B7-H6可能是乳腺癌免疫治療的潛在靶點。最后,作者通過網(wǎng)絡(luò)分析確定了BTLA、MARCH8、PLSCR1和SMAD3可能參與了B7家族蛋白調(diào)控下的T細胞信號傳導(dǎo)。
圖2:

緊接著,2018年就有另一篇發(fā)表在Cell Proliferation(IF:6.83)的文章:“Comprehensive molecular profiling of the B7 family in gastrointestinal cancer”在消化系統(tǒng)腫瘤中做了B7家族基因類似的生信分析。
作者首先發(fā)現(xiàn)B7家族分子在不同類型胃腸道腫瘤中相對于正常組織中都差異表達,并且在腫瘤樣本中發(fā)現(xiàn)這些基因高頻突變。腫瘤樣本中B7家族成員的啟動子甲基化與B7家族成員的mRNA表達呈負相關(guān),也提示B7家族基因在胃腸道癌癥中的表達受表觀遺傳學(xué)調(diào)節(jié)。其中,胰腺癌中B7-H1、食管癌中B7-H5和肝癌中B7-H6的過表達與較差的總生存率顯著相關(guān)。最后,通過網(wǎng)絡(luò)分析,作者鑒定了B7-1/2和B7-H1/DC可能的相互作用蛋白。
圖3:

上述只是簡單舉兩個例子,想如今都2021年了,就那么多種癌癥類型,B7家族的分析估計已沒有任何新鮮感了,也很難挖掘出比較有意義的東西了。那該怎么搞呢?可以想到的是深入探索其中某一個基因來搞事情,這就需要找一個比較有潛力的基因,而且這個基因還不能被研究的太透徹,比如PD-L1,都做出藥了,肯定各種機制都研究透透的了。從這點考慮,那就得挑一個相對面生的基因:HHLA2。
在開始通過研究一個陌生的基因做一篇生信文章前,需要先查一查目前這個基因的生信方面的研究進展。通過在pubmed中關(guān)鍵詞檢索,小編發(fā)現(xiàn)這個基因竟然是一個生信熱點,其中近兩年光胰腺癌和卵巢癌中就發(fā)表了3篇純生信文章,而且都是不錯的雜志,分別是
Cancer Letters(IF:8.68), Br J Cancer(IF:7.64),Cancer Cell Int(IF:5.72)
圖4:

還有一篇2020年發(fā)表在Frontiers in Cell and Developmental Biology(IF:6.68)的文章“Over-Expression and Prognostic Significance of HHLA2, a New Immune Checkpoint Molecule, in Human Clear Cell Renal Cell Carcinoma”比較特殊,下面單獨拿出來講一下。
就是我們一般認為腫瘤相對于正常組織高表達的基因肯定是不利于生存的,因為在腫瘤中高表達且不利于腫瘤細胞的存活,有點類似于“自殺”,從進化的角度看,這很不科學(xué)。但是確實有很多這樣的基因存在,小編之前也寫過一篇推文:匪夷所思,腫瘤中高表達基因預(yù)后更好?還專門說明了這種情況。這篇文章作者利用多個數(shù)據(jù)庫的公共數(shù)據(jù)對HHLA2的差異表達進行了驗證,發(fā)現(xiàn)HHLA2在腫瘤中廣泛表達,特別是在腎癌中,并且通過對自己收集的臨床樣本進行驗證,也說明了同樣的問題;最后還發(fā)現(xiàn),HHLA2高表達預(yù)示腎癌生存期延長。
圖5:

小編通過閱讀HHLA2基因相關(guān)的綜述,發(fā)現(xiàn)HHLA2表達在正常人體組織中主要限于腸、乳腺和胎盤中的上皮細胞;而在腫瘤中廣泛表達,但是其最初發(fā)現(xiàn)是在抗原遞呈細胞上的。在免疫系統(tǒng)中,HHLA2由人類單核細胞組成型表達并誘導(dǎo)B細胞,與 細胞、B細胞和抗原呈遞細胞上的受體結(jié)合,因此HHLA2可發(fā)揮共抑制和共刺激功能。此外,作為T細胞共抑制劑,HHLA2抑制人CD4 T和 CD8 T細胞的增殖和細胞因子的產(chǎn)生。此外,HHLA2/TMIGD2 相互作用通過AKT依賴性信號級聯(lián)反應(yīng)共同刺激人類 T 細胞生長和細胞因子產(chǎn)生。當在抗原呈遞細胞上表達時,HHLA2 通過跨膜和含有免疫球蛋白結(jié)構(gòu)域2 (TMIGD2) 受體刺激 T 細胞增殖和細胞因子分泌,并定位于初始 T 細胞上。隨著T細胞活化,TMIGD2表達逐漸喪失,而另一受體KIR3DL3活化而使T細胞功能受到抑制。這種局面就造成了這種高表達,而且結(jié)局好或者壞的情況同時存在。
從上述的解讀中我們可以看出HHLA2在多種腫瘤中都有純生信的文章發(fā)表,這也說明了它的重要性;此外,HHLA2功能復(fù)雜,其所呈現(xiàn)的表型不再是簡單的促癌基因抑或抑癌基因,這也更加突出其研究價值。想想看,如果一個基因的功能比較單一,那絕對沒有多少可以利用數(shù)據(jù)挖掘來做文章的意義。恰恰這種功能復(fù)雜的基因,才能延申出各種生信分析,且只要言之有理即可?,F(xiàn)在候選基因找好了,那下面小編就來示范一下如何對HHLA2開展新的研究。
首先看看HHLA2基因在各個組織的表達情況,這里小編推薦用THPA數(shù)據(jù)庫(https://www.proteinatlas.org/)來看,一方面是因為這個數(shù)據(jù)庫是有蛋白蛋白水平的數(shù)據(jù),這樣相對來說更準確。因為基因高表達,不一定蛋白就高表達,而只有蛋白水平搞才能說是有功能的。此外這個數(shù)據(jù)庫還整合了其它各大數(shù)據(jù)庫的數(shù)據(jù),可以一站式解決研究基因表達的所有問題。
圖6:

從圖3,我們可以看到HHLA2主要在胃腸道高表達,從這點可以首先確定在消化系統(tǒng)腫瘤中研究這個基因是比較容易做出陽性結(jié)果的。然后考慮到現(xiàn)在發(fā)表純生信文章的困境,得為自己留點退路,萬一生信部分分析的結(jié)果不出彩,那還可以加點實驗來驗證。簡單的實驗無外乎qPCR, WB和IHC以及流式實驗,qPCR沒有什么要求,一般基因都能做,而IHC,WB和流式都是需要抗體的。這里小編普及一下,IHC,WB和流式抗體是不同的,簡單說就是做IHC的抗體你不一定能用來做流式或者WB的。查抗體最簡單的就是從文獻中看,如圖4就是一張HHLA2基因的IHC圖片。
圖7:

但是查文獻是比較慢的,小編這里給大家推薦幾個網(wǎng)站,可以直接進入這些公司的官網(wǎng)進行查詢就非常方便。全世界比較出名的有幾大抗體運營商:
Invitrogen(https://www.thermofisher.cn/cn/zh/home.html),Abcam(https://www.abcam.com/),Bioledend( https://www.biolegend.com/).BD(https://www.bdbiosciences.com/en-us)等,小編這里不一一列舉了。通過檢索發(fā)現(xiàn)Abcam就有做IHC/WB的HHLA2抗體(圖8);此外,因為HHLA2是表面蛋白,Invitrogen還有做流式的抗體(圖9)。那這樣就很棒了,想想如果能用流式細胞術(shù)分析腫瘤細胞或者免疫細胞HHLA2蛋白的表達情況,那這文章的檔次就有了相當大的提高。
圖8:

圖9:

上面簡單的看過了HHLA2在各器官的表達水平,也找到了做實驗用到的抗體,有了這些基礎(chǔ)加上一套完整的生信分析就差不多可以發(fā)表一篇不錯的SCI了。但是如果想在上個臺階,那就需要聯(lián)系臨床實際的運用了,腫瘤研究可結(jié)合的臨床表型有很多,如焦亡,轉(zhuǎn)移,免疫治療等。介于小編剛寫過“如何從腫瘤免疫應(yīng)答的角度設(shè)計研究思路?”,那就接著說一下HHLA2聯(lián)合免疫治療的生信分析思路吧。
小編簡單的在谷歌中進行關(guān)鍵詞搜索了一下,就找到了兩篇分別在2019和2020年發(fā)表在J Immunother Cancer(IF:13.75)上的文章(圖10),而且都是國內(nèi)學(xué)者在膽管癌和腎癌中聯(lián)合HHLA2和PD-L1免疫治療來開展的研究。
圖10:

:
這兩篇文章除了主題類似,文章脈絡(luò)和思路也基本一致,可謂英雄所見略同。此外,從這兩篇文章發(fā)表的期刊質(zhì)量來看,目標基因結(jié)合臨床表型,就具有了沖擊更高水平文章的潛力。
總結(jié)
最后,小編對全文進行總結(jié)一下。首先我們可以通過平時閱讀新發(fā)表的文獻找到后續(xù)研究的基因,這樣有兩個好處:其一,看自己領(lǐng)域文章找的基因往往功能和自己研究的方向相關(guān),做對應(yīng)的功能驗證實驗也輕車熟路;其二,最新發(fā)表的文章中被揭示的基因往往沒有被研究的太深入,這就有了基于數(shù)據(jù)挖掘做生信套路的基礎(chǔ)。待選定基因后,我們首先可以看看這個基因?qū)儆谀膫€家族,針對基因家族進行的分析往往能揭示出一定規(guī)律,從而較容易發(fā)文章。如果基因家族的分析已經(jīng)被做過,或者沒有做的價值,那就只能通過深入研究這個基因本身來進行搞事情了。像上面小編示例中那樣,可以先看看這個基因在各個器官的表達情況,表達太低的基因往往很難做出陽性結(jié)果;此外,如果在各個器官的表達水平都普遍較高,那這樣的基因可能是作為管家基因等細胞基本功能維持所需要的,就很難有太出彩的發(fā)現(xiàn)。最后就是看這個基因能和哪些表型結(jié)合,做腫瘤研究的無怪乎就要向患者的生存,腫瘤的轉(zhuǎn)移,免疫治療應(yīng)答等方面去想,只要能結(jié)合到一種表型就可以開展研究了。當然,如果能加一些簡單的實驗驗證就再好不過了。