Hey, guys~早上好呀!今天小編要跟大家分享的是第一個可以直接從RNA-seq數據識別全長circRNA亞型,并對其表達水平進行量化的方法,名曰psirc,廢話不多說,咱們開嘮~

一、circRNAs的身世
Firstly,咱們還是先了解一下circRNA的特征、功能等基本資料,已經了解的透透的朋友請自行移步到下一part哈。
1、circRNA的特征
起初,circRNAs被大家認為是錯誤剪接,直到2012年,Salzman等人利用RNA測序技術發現了circRNAs在不同的人類細胞系中廣泛表達。至此,越來越多的研究發現circRNAs在許多生物中普遍存在,表達豐度甚至能夠超過同源線性mRNAs;circRNAs的表達模式在不同的細胞和組織類型以及發育階段也具有特異性;circRNAs的表達、發生機制以及結構特征被認為是保守的;circRNAs分子呈封閉環狀結構,不易被核酸外切酶RNaseR降解,因此更加穩定。
2、circRNA的形成機制
根據組成部分,circRNAs大致可分為三種亞型:有一個或多個外顯子循環產生的ecircRNAs;由外顯子環狀化而成,且保留了內含子的EIciRNAs;以及只有內含子組成的ciRNAs這三種亞型。根據circRNAs和臨近編碼RNA的位置關系又可以將其分為:“exonic”,“intronic”,“ antisense”,“sense overlapping”和“intergenic”。大部分成熟的circRNAs位于細胞質,但也有一些亞型留在細胞核中。
3、circRNAs的功能
circRNA最重要的功能是作為miRNA海綿,與mRNA競爭性結合miRNA,進而調控靶基因的表達水平;circRNA還可與蛋白質相互作用,調節蛋白活性;細胞核中的一些circRNAs, 如EIciRNAs和ciRNAs可以調控基因的轉錄和剪切; 翻譯成多肽或蛋白質;逆轉錄并整合到宿主基因組中生成假基因;某些circRNAs通過作用于DNA或組蛋白甲基化來影響表觀遺傳修飾。

二、psirc——檢測并量化全長circRNAs亞型
1、是什么?
目前全基因組水平檢測circRNAs的通用方法是RNA-seq,由于沒有使用polyA富集,得到的數據混雜著線性和環狀轉錄本。從測序數據中識別circRNA的一個重要步驟就是尋找反向剪接位點(BSJs),現有的方法大多只能識別BSJs,但不能確定具體的轉錄本,還有一些方法要么只能推斷亞型,要么只可以量化表達水平。而psirc方法不僅可以檢測全長circRNA轉錄本亞型,還能夠直接利用標準化的RNA-seq數據量化其表達水平。

2、怎么做?
這個方法的流程可以分為三部分,第一步是識別BSJs(圖2.A),這一步用到了兩種信號:junction-crossing reads和last–first exon read pairs,首先作者為所有可能的BSJs構建了一個文庫,然后利用pseudo-alignment方法進行比對,junction-crossing是一段覆蓋了下游外顯子3‘和上游外顯子5’端大部分位置的序列,last–first exon read pair則是一對分別與已注釋的線性轉錄本的第一個和最后一個外顯子比對上的讀段,只有兩個讀段反向偽比對到同一轉錄本,才會被篩選。接下來,對于第一步篩選出的每個具有BSJ的線性轉錄本亞型,研究利用圖搜索算法識別了潛在的全長環狀轉錄本亞型(圖2.B)。最后,基于已有研究為所有線性和環狀轉錄本亞型構建了一個T-DBG,根據測序數據的偽比對,通過最大似然函數量化每個線性和環狀轉錄本亞型的表達水平(圖2.C)。

3、怎么樣?
東西好不好,比了才知道。作為一篇方法學文章,作者也是用了很大篇幅將psirc與其他方法進行對比。同CIRI2、CIRCexplorer2等其他四種方法相比,psirc對時間和內存的消耗更低,對轉錄本的定量也更準確一些。然后,為了避免數據偏向性對比較結果造成的影響,作者又重新設計了一個標準流程,同CircAST 、Sailfish-cir、CIRI-full和CIRI-quant等做了對比,結果當然是psirc對轉錄本亞型的識別和定量更勝一籌了(圖3)。

作者又對轉錄本的實際表達值和不同方法得到的預測值做了相關性分析,結果表明,psirc能夠更準確地量化線性和環狀轉錄本(圖4)。

換個數據集,結果還是一樣(圖5)。

最后,文章使用一個包含短讀和長讀的RNA-seq數據集來評估psirc識別全長circRNA亞型的能力,并跟其他兩種方法做對比。總的來說,psirc和isoCirc識別的circRNAs在數量與比例上重疊度更高,它們的關聯性也更高(圖6)。

4、怎么用?
黑貓白貓,能抓住耗子的就是好貓,跟其他方法的比較結果再好,都不如實例有說服力。于是,作者接下來以11個鼻咽癌(NPC)細胞系和4個正常鼻咽(NP)細胞系的RNA-seq數據為例,去識別BSJs和全長circRNA轉錄本亞型,并進行定量。結果表明,80%多的BSJs在相關數據庫中有收錄,新的BSJs也能得到較好的數據支持,此外,線性和環狀轉錄本亞型表達水平的相關性也與已有研究相符。然后,作者篩選了差異表達的BSJs和全長circRNA亞型,通過功能富集進一步識別出癌癥相關的circRNA,并發現一些差異表達的circRNA亞型,其表達水平遠遠高于它們相應的線性轉錄本,且具有更少的MREs (圖7)。

最后,研究利用RT-PCR和RT-qPCR再一次對結果進行了實驗驗證(圖8)。

近五年來,分析circRNA與癌癥關聯性的研究越來越多,作為癌癥標志物領域的后起之秀,circRNA這幅地圖正在被一點點繪制填充,相信隨著工具和方法的不斷完善,circRNA在疾病的發病機制中所扮演的角色,終將被我們揭示!好了,今天的分享就到這了,have a nice day!

參考文獻:
1、Yu KH, Shi CH, Wang B, Chow SH, Chung GT, Lung RW, Tan KE, Lim YY, Tsang AC, Lo KW, Yip KY. Quantifying full-length circular RNAs in cancer. Genome Res. 2021 Oct 18. doi: 10.1101/gr.275348.121. Epub ahead of print. PMID: 34663689.
2、Zhang C, Hu J, Yu Y. CircRNA Is a Rising Star in Researches of Ocular Diseases. Front Cell Dev Biol. 2020 Sep 3;8:850. doi: 10.3389/fcell.2020.00850. PMID: 33015046; PMCID: PMC7494781.