Molecular Mechanisms of Long Noncoding RNAs
LncRNA的分子機(jī)制
上個(gè)星期,青山與師兄聊到ceRNA網(wǎng)絡(luò)的生信文章也屢見不鮮了,師兄聽后,默默說(shuō)了一句 “不是文章套路不新鮮了,是大家對(duì)lncRNA的了解在ceRNA就到頭了。“
我頓時(shí)發(fā)現(xiàn),自己對(duì)lncRNA的了解也十分有限,脫離本質(zhì),只依靠分析方法,去解釋lncRNA在疾病中的機(jī)制實(shí)在是太膚淺,所以趕緊找來(lái)這篇綜述學(xué)習(xí)。同時(shí),青山也將這篇綜述分享給大家。
正文開始之前,先不直接解釋LncRNA的定義,首先他也是一種RNA,和mRNA有什么區(qū)別的呢?mRNA和DNA到底是什么呢?和人體的生長(zhǎng)發(fā)育又有什么聯(lián)系呢?種種問題使我不僅好奇起來(lái),那么,讓青山帶大家一起探索這個(gè)既耳熟能詳,又不知從何說(shuō)起的大自然神奇造物。
細(xì)胞中的生物大分子有四種,分別是蛋白質(zhì)、脂質(zhì)、糖類和核酸。蛋白質(zhì)是細(xì)胞生命活動(dòng)的主要承擔(dān)者,基本單位是氨基酸。脂質(zhì)包括脂肪、磷脂和固醇三種,其中脂肪是細(xì)胞內(nèi)的主要儲(chǔ)能物質(zhì),磷脂是生物膜的重要組成成分,固醇包括膽固醇、性激素和維生素D三種。糖類是細(xì)胞內(nèi)的主要能源物質(zhì)。核酸是生物體內(nèi)遺傳物質(zhì),包括脫氧核酸(DNA)和核糖核酸(RNA)兩種。
在基因組中,遺傳信息存儲(chǔ)在稱為基因的DNA序列中,基因是含有能夠影響生物體表型特征的遺傳信息的DNA序列。基因內(nèi)的DNA堿基序列作為模板可以合成RNA分子,在大多數(shù)情況下,RNA分子被翻譯成多肽,折疊為蛋白質(zhì)。 將基因的核苷酸序列復(fù)制到RNA鏈中的過(guò)程稱為轉(zhuǎn)錄。
人體一個(gè)細(xì)胞含RNA約10pg(含DNA約7pg)。與DNA相比,RNA種類繁多,分子量較小,含量變化大。RNA可根據(jù)結(jié)構(gòu)和功能的不同分為信使RNA和非編碼RNA。非編碼RNA分為非編碼大RNA和非編碼小RNA。非編碼大RNA包括核糖體RNA、長(zhǎng)鏈非編碼RNA。非編碼小RNA包括轉(zhuǎn)移RNA、核酶、小分子RNA等。小分子RNA(20~300nt)包括 miRNA、 SiRNA、 piRNA、scRNA、 snRNA、 snoRNA等。真核生物90%的RNA分布在細(xì)胞質(zhì)中,少量存在于線粒體和核仁。

首先簡(jiǎn)要概括mRNA的特點(diǎn),mRNA只占細(xì)胞總RNA的2%~5%,但種類最多,并且代謝十分活躍,是半衰期最短的一種RNA,合成后數(shù)分鐘至數(shù)小時(shí)即被分解。真核細(xì)胞的mRNA分子最顯著的結(jié)構(gòu)特征是具有5’端帽子結(jié)構(gòu)(m7G)和3’端的Poly(A)尾巴。這種結(jié)構(gòu)為真核mRNA的提取,提供了極為方便的選擇性標(biāo)志,寡聚(dT)纖維素或寡聚(U)瓊脂糖親合層析分離純化mRNA的理論基礎(chǔ)就在于此。

一、lncRNA概述
從原核生物到真核生物,非編碼RNA隨著生物體級(jí)別的增高,其在細(xì)胞的含量也逐漸升高,相較于只有2%的mRNA,人類細(xì)胞含有約98.5%的非編碼RNA。這提示隨著基因組復(fù)雜程度和生物體內(nèi)智能化程度越來(lái)越高,非編碼RNA的功能也隨之增加。從長(zhǎng)度對(duì)比,哺乳動(dòng)物mRNA長(zhǎng)度為5×102~1×105nt,而長(zhǎng)鏈非編碼RNA(Long non-coding RNA, lncRNA) 是長(zhǎng)度大于 200 個(gè)nt的非編碼 RNA。
LncRNA的功能
lncRNA可以作為主要研究分子的原因,就是lncRNA可以在不同的水平(表觀遺傳學(xué)-染色質(zhì)重構(gòu),轉(zhuǎn)錄調(diào)控,轉(zhuǎn)錄后加工)調(diào)控編碼蛋白的mRNA的表達(dá)[1,2]。
lncRNA可通過(guò)招募染色質(zhì)重塑復(fù)合物至特定的基因組位點(diǎn)使其發(fā)生催化活性。如圖3a,HOTAIR、Xist/RepA和Kcnqot1招募Polycomb complex至HoxD位點(diǎn),使得X染色體或Kcnq1功能域的組蛋白H3第27位賴氨酸發(fā)生3甲基化(me3K27),誘導(dǎo)異染色質(zhì)形成,從而抑制該區(qū)域基因表達(dá)。
lncRNA可通過(guò)多種機(jī)制進(jìn)行轉(zhuǎn)錄水平調(diào)控,包括自身作為共調(diào)節(jié)因子、修飾轉(zhuǎn)錄因子活性、調(diào)節(jié)共調(diào)節(jié)因子的結(jié)合和活性等。lncRNA靶向基因轉(zhuǎn)錄過(guò)程的不同環(huán)節(jié),如轉(zhuǎn)錄激活因子、阻遏蛋白,包括RNA聚合酶II、甚至DNA雙鏈在內(nèi)的轉(zhuǎn)錄反應(yīng)成分來(lái)調(diào)節(jié)基因轉(zhuǎn)錄和表達(dá)。這些lncRNA可能形成一個(gè)包括轉(zhuǎn)錄因子的調(diào)控網(wǎng)絡(luò),在復(fù)雜的真核生物中精細(xì)調(diào)控基因表達(dá)。如圖3b,lncRNA結(jié)合到基因cyclin D1上,招募RNA結(jié)合蛋白TLS來(lái)調(diào)控蛋白CBP和p300的組蛋白乙酰轉(zhuǎn)移酶活性,進(jìn)而抑制cyclin D1轉(zhuǎn)錄;圖3c,超保守增強(qiáng)子轉(zhuǎn)錄出lncRNA-Evf2,該lncRNA能激活轉(zhuǎn)錄因子DLX2,進(jìn)而調(diào)控基因Dlx6轉(zhuǎn)錄;圖3d,DHFR次要啟動(dòng)子區(qū)域轉(zhuǎn)錄出的lncRNA與該基因主要啟動(dòng)子區(qū)域結(jié)合形成三聚體,抑制轉(zhuǎn)錄因子TFIID結(jié)合,從而使基因DHFR發(fā)生沉默。
互補(bǔ)的lncRNA與mRNA形成RNA雙鏈體可掩蓋mRNA內(nèi)部與反式作用因子結(jié)合必須的主要元件,可能影響轉(zhuǎn)錄后基因表達(dá)的任何步驟,包括pre-mRNA的加工、剪接、轉(zhuǎn)運(yùn)、翻譯、降解。圖3e中,反義lncRNA與剪接體(splicesome)中鋅指同源mRNA Zeb2的5'剪切位點(diǎn)結(jié)合,使內(nèi)含子未被剪切掉,而該內(nèi)含子序列中保留有內(nèi)部核糖體進(jìn)入位點(diǎn)(IRE位點(diǎn)),翻譯過(guò)程中識(shí)別并結(jié)合該位點(diǎn),導(dǎo)致Zeb2基因表達(dá)和翻譯。

羅列定義是很抽象不好理解的,Mercer[3]總結(jié)了8個(gè)lncRNA調(diào)控mRNA表達(dá)的具體機(jī)制(圖4):
1.編碼蛋白的基因上游啟動(dòng)子區(qū)(橙色)轉(zhuǎn)錄,干擾下游基因(藍(lán)色)的表達(dá);
2.抑制RNA聚合酶II或者介導(dǎo)染色質(zhì)重構(gòu)以及組蛋白修飾,影響下游基因(藍(lán)色)的表達(dá);
3.與編碼蛋白基因的轉(zhuǎn)錄本形成互補(bǔ)雙鏈(紫色),干擾mRNA的剪切,形成不同的剪切形式;
4.與編碼蛋白基因的轉(zhuǎn)錄本形成互補(bǔ)雙鏈(紫色),在Dicer酶的作用下產(chǎn)生內(nèi)源性siRNA; 5.與特定蛋白質(zhì)結(jié)合,lncRNA轉(zhuǎn)錄本(綠色)可調(diào)節(jié)相應(yīng)蛋白的活性;
6.作為結(jié)構(gòu)組分與蛋白質(zhì)形成核酸蛋白質(zhì)復(fù)合體;
7.結(jié)合到特定蛋白質(zhì)上,改變?cè)摰鞍踪|(zhì)的細(xì)胞定位;
8.作為小分子RNA(如miRNA、piRNA)的前體分子。

探索非編碼RNA的種類
在Chris P[4]的文章中,非編碼RNA的來(lái)源有多個(gè)途徑,可以由編碼蛋白質(zhì)的基因結(jié)構(gòu)發(fā)生中斷而轉(zhuǎn)變成非編碼RNA;也可通過(guò)染色質(zhì)重排,生成含多個(gè)外顯子的非編碼RNA;另外,非編碼基因通過(guò)反轉(zhuǎn)錄轉(zhuǎn)座作用復(fù)制,產(chǎn)生有功能的非編碼反義基因以及沒有功能的非編碼反轉(zhuǎn)錄假基因;再者,非編碼RNA內(nèi)部某段序列的重復(fù)復(fù)制,產(chǎn)生了新的具有相鄰重復(fù)序列的非編碼RNA;轉(zhuǎn)座元件插入基因組中,也可產(chǎn)生一個(gè)有功能的編碼RNA。

Massively parallel cDNA sequencing,也就是轉(zhuǎn)錄組測(cè)序技術(shù)(RNA-Seq),測(cè)序的結(jié)果主要依賴于現(xiàn)有的轉(zhuǎn)錄本注釋,基于現(xiàn)有的轉(zhuǎn)錄本分析基因的表達(dá)水平和變異。Mitchell[5]提出了一種重建哺乳動(dòng)物轉(zhuǎn)錄組的技術(shù),Scripture。Mitchell通過(guò)對(duì)小鼠的胚胎干細(xì)胞測(cè)序,重新堅(jiān)定了小鼠胚胎干細(xì)胞的轉(zhuǎn)錄組,在已知的編碼RNA基因序列間發(fā)現(xiàn)了大量的未知區(qū)域,包括了上千個(gè)新的5 '起始位點(diǎn),3 '末端和內(nèi)部編碼外顯子。Mitchell利用Scripture測(cè)序技術(shù),鑒定了超過(guò)1000個(gè)大型基因間非編碼RNA (lincRNA)和反義位點(diǎn)的基因結(jié)構(gòu)。目前除了少數(shù)lncRNA的功能比較明確外,大部分lncRNA的功能都還未知。非常值得去深入研究。(圖6)

根據(jù)基因組上的位置關(guān)系,lncRNA主要可以分為以下三大類[6](圖7所示):1、Intronic lncRNA,內(nèi)含子lncRNA:主要產(chǎn)生于編碼基因的內(nèi)含子區(qū)域;2、Intergenic lncRNA,基因間區(qū)的lncRNA,也稱作lincRNA:主要產(chǎn)生于兩個(gè)編碼基因的中間區(qū)域;3、Antisense lncRNA,反義lncRNA:主要產(chǎn)生于編碼基因的反義鏈。進(jìn)一步根據(jù)基因組位置還可細(xì)分為下面的類型[7](圖8):


LncRNA的種類及在基因組的未知如此繁雜,注釋起來(lái)也相對(duì)困難,目前保存lncRNA信息的數(shù)據(jù)庫(kù)達(dá)十余種(不是我們生信分析預(yù)測(cè)mRNA的那種數(shù)據(jù)庫(kù)),但不同數(shù)據(jù)庫(kù)注釋的lncRNA完整性和覆蓋度不大一樣。就這樣看,是不是覺得目前的生信分析,還是很局限呢?那些叫囂著生信已經(jīng)玩爛的人,可能要重新審視一下lncRNA的潛力。
從Antisense lncRNA為例,展開對(duì)lncRNA功能的分析,在不改變基因核苷酸序列的情況下,antisense lncRNA能夠結(jié)合DNA進(jìn)行甲基化酶及染色質(zhì)組蛋白修飾酶的招募,通過(guò)改變?nèi)旧|(zhì)狀態(tài),調(diào)控正義基因的表達(dá),并且產(chǎn)生可遺傳變異。像這種修飾可以小到作用于一個(gè)基因,大到影響整個(gè)染色體,比如Xist和反義Tsix二者介導(dǎo)的X染色體失活過(guò)程(圖9)。

由于哺乳動(dòng)物雌性含有兩條X染色體,而雄性只有一條X染色體,為了確保雄性(XY)和雌性(XX)的X基因劑量相等,雌性胚胎會(huì)發(fā)生單個(gè)X染色體永久失活,即“劑量補(bǔ)償”效應(yīng)。非編碼RNA Xist是X染色體失活的主要參與基因,Xist僅在失活的X染色體中表達(dá),其通過(guò)包裹合成它的X染色體,并結(jié)合Eed/PRC2復(fù)合物形成H3K27me3組蛋白修飾,進(jìn)而抑制基因轉(zhuǎn)錄,致使X染色體失活。而在Xist基因3'端存在antisense lncRNA Tsix,Tsix的轉(zhuǎn)錄可以阻止Eed/PRC2募集到Xist啟動(dòng)子區(qū)并且抑制H3K4甲基化,導(dǎo)致染色質(zhì)結(jié)構(gòu)發(fā)生改變,最終沉默Xist。

由于antisense lncRNA和正義鏈基因方向相反,單單從空間位置來(lái)說(shuō),有模型表明當(dāng)正/反義鏈同時(shí)轉(zhuǎn)錄形成RNA時(shí),RNA聚合酶會(huì)相遇產(chǎn)生一定的空間阻礙,從而使RNA的轉(zhuǎn)錄受到抑制,像這種轉(zhuǎn)錄調(diào)控是由于基因本身方向相反導(dǎo)致,并不是由antisense lncRNA本身的調(diào)控功能引起對(duì)正義鏈基因轉(zhuǎn)錄的影響。

在細(xì)胞核內(nèi),antisense lncRNA能夠與正義鏈RNA通過(guò)堿基配對(duì)形成二聚體,二聚體的形成會(huì)導(dǎo)致部分外顯子的剪接位點(diǎn)被掩蓋掉,從而影響前體pre-mRNA的剪切過(guò)程,產(chǎn)生不同種類的mRNA成熟體。研究表明,antisense lncRNA除了通過(guò)二聚體形式調(diào)控pre-mRNA的成熟剪切,它也可以對(duì)核內(nèi)mRNA的部分核苷酸進(jìn)行替換編輯,如果蠅的反義Sas-10通過(guò)結(jié)合Rnp4f,將Rnp4f部分腺嘌呤替換為次黃嘌呤,從而降低Rnp4f mRNA的表達(dá)水平。

Antisense lncRNA不只在細(xì)胞核內(nèi)影響正義基因的轉(zhuǎn)錄,正/反義鏈RNA二聚體同樣能夠在轉(zhuǎn)錄后水平調(diào)控基因的表達(dá)。Antisense lncRNA可以結(jié)合正義基因mRNA 3’ UTR區(qū),封閉大量miRNA的靶位點(diǎn),阻礙了miRNA對(duì)靶基因的抑制作用,從而維持mRNA的穩(wěn)定性。如反義lncRNA-PXN-AS1-L能夠結(jié)合PXN mRNA 3’ UTR,提高PXN mRNA的穩(wěn)定性,最終促進(jìn)癌基因RXN的表達(dá)和腫瘤細(xì)胞的生長(zhǎng)3。 Antisense lncRNA同樣能夠吸附miRNA,進(jìn)而減弱miRNA對(duì)靶基因的下調(diào)。另外,antisense lncRNA可與編碼蛋白基因的轉(zhuǎn)錄本,形成互補(bǔ)雙鏈,在Dicer酶的作用下產(chǎn)生類似內(nèi)源性的siRNA,從而沉默編碼基因的表達(dá)。下面讓我們開始解讀正文。
重點(diǎn)定義:
*等位基因:人的眼瞼形態(tài)是一種性狀,這種性狀有不同的表現(xiàn)形式:雙眼皮、單眼皮,其中單為隱性,雙為顯性。我們把它們稱為相對(duì)性狀。性狀又是由基因控制的,控制顯性性狀的為顯性基因(用大寫字母,如A),控制隱性性狀的為隱性基因(用小寫字母,如a)。基因在體細(xì)胞中成對(duì)存在,所以一個(gè)個(gè)體的基因型就有:AA,Aa,aa。A和a就可以表示一對(duì)等位基因,即染色體的相同位置上控制相對(duì)性狀的一對(duì)基因。
*基因座:基因座是染色體上的固定部位,在相同基因座上編碼相同的DNA被稱為等位基因。形象地說(shuō),一對(duì)染色體可想象為兩條平行線,染色體上一個(gè)給定的位置,好比兩平行線上相對(duì)應(yīng)位置的一點(diǎn)或一段,叫做基因座。
*順式作用:同一染色體上DNA序列直接調(diào)控其鄰近基因的表達(dá),例如,DNA對(duì)DNA。由某一基因表達(dá)后,對(duì)自身基因進(jìn)行轉(zhuǎn)錄調(diào)控的作用;調(diào)節(jié)因子是與被調(diào)節(jié)基因同處于一條DNA鏈上的另一端DNA片段而進(jìn)行的調(diào)節(jié)。
*順式作用元件:順式作用元件(cis-acting element)存在于基因旁側(cè)序列中,能影響基因表達(dá)的序列。順式作用元件包括啟動(dòng)子、增強(qiáng)子、調(diào)控序列和可誘導(dǎo)元件等,它們的作用是參與基因表達(dá)的調(diào)控。順式作用元件本身不編碼任何蛋白質(zhì),僅僅提供一個(gè)作用位點(diǎn),要與反式作用因子相互作用而起作用。
*順式or反式:在分子遺傳學(xué)領(lǐng)域,相對(duì)同一染色體或DNA分子而言為“順式”(cis);對(duì)不同染色體或DNA分子而言為“反式”(trans)。
*印記基因:指來(lái)自父or母方的,親本來(lái)源的同源基因表達(dá),而來(lái)自另方的不表達(dá),因?yàn)閬?lái)自父方和母方的等位基因在通過(guò)精子和卵子傳遞給子代時(shí)發(fā)生了修飾,使帶有親代印記的等位基因具有不同的表達(dá)特性,這種修飾常為DNA甲基化修飾,也包括組蛋白乙酰化、甲基化等修飾。
*印記基因的修飾:在生殖細(xì)胞形成早期,來(lái)自父方和母方的印記將全部被消除,父方等位基因在精母細(xì)胞形成精子時(shí)產(chǎn)生新的甲基化模式,但在受精時(shí)這種甲基化模式還將發(fā)生改變;母方等位基因甲基化模式在卵子發(fā)生時(shí)形成,因此,在受精前來(lái)自父方和母方的等位基因具有不同的甲基化模式,在成卵子后會(huì)有不用的基因表達(dá)模式。
二、 原型Ⅰ:信號(hào)(Archetype I: Signals)
等位基因特異性:Xist
Xist lncRNA與X染色體失活
X染色體去激活,又稱X染色體失活或里昂化,是指雌性哺乳類細(xì)胞中兩條X染色體的其中之一失去活性的現(xiàn)象[8]。正常的雌性擁有兩條X染色體,有一條保有活性,標(biāo)記作Xa;另一條則失活,標(biāo)記作Xi。目前的假說(shuō)認(rèn)為,體染色體上有某個(gè)基因會(huì)制造出“阻礙因子”(blocking factor)來(lái)與X染色體結(jié)合,進(jìn)而防止此染色體失去活性。X染色體上存在一種稱為X去活化中心(X inactivation center,XIC)的序列,可調(diào)控X染色體的沉默化,是阻礙因子可能的結(jié)合位置。這些XIC序列是造成X染色體去活化的充要條件。
XIC序列上含有兩個(gè)非轉(zhuǎn)譯RNA基因,分別是Xist與Tsix,此兩者參與了去活化作用。此外,XIC上含有一些結(jié)合位置,分別可供一些已知和未知調(diào)控蛋白(regulatory protein)結(jié)合。Xist基因會(huì)轉(zhuǎn)錄出RNA分子,且此RNA將不會(huì)轉(zhuǎn)譯成蛋白質(zhì),XistRNA會(huì)從XIC位置開始,逐漸將Xi包覆起來(lái),而且這些XistRNA并不會(huì)作用到Xa上。Xi被RNA包覆過(guò)后不久就會(huì)發(fā)生基因沉默現(xiàn)象。Xist是X染色體去活化的主要影響因子,Xi染色體外圍會(huì)被XistRNA包覆,而Xa則沒有這種現(xiàn)象。缺乏Xist基因的X染色體將無(wú)法去活化。
另一方面,Tsix基因同樣也會(huì)轉(zhuǎn)錄出一條無(wú)蛋白質(zhì)產(chǎn)物的RNA分子。Tsix基因是Xist基因的反義序列,也就是說(shuō),兩者實(shí)際上是來(lái)自同一段DNA上互補(bǔ)的兩股,而他們的產(chǎn)物RNA也因此具有互補(bǔ)性。這使Tsix成為Xist的負(fù)向調(diào)節(jié)因子,使沒有表現(xiàn)Tsix的X染色體比較容易被去活化。
*知識(shí)點(diǎn)拓展:2021年3月17日,來(lái)自斯坦福大學(xué)Howard Chang教授團(tuán)隊(duì)在Cell上發(fā)表論文B cell-specific XIST complex enforces X-inactivation and restrains atypical B cells。本文首次報(bào)道了XIST在成體免疫B細(xì)胞中維持X染色體失活的重要作用和調(diào)控機(jī)制。這一發(fā)現(xiàn)顛覆了領(lǐng)域之前對(duì)XIST在成體體細(xì)胞中X失活作用的認(rèn)識(shí),拓寬了lncRNA-蛋白復(fù)合物的細(xì)胞特異性功能,揭示了X失活對(duì)免疫反應(yīng)兩性差異的重要影響。

表達(dá)趨勢(shì)與器官生長(zhǎng)有關(guān):HOTAIR和HOTTIP
HOX基因座的ncRNA
Hox基因,全名同源基因(homeotic genes)或同源異型基因。是生物體中一類專門調(diào)控生物形體的基因,一旦這些基因發(fā)生突變,就會(huì)使身體的一部分變形。其作用機(jī)制,主要是調(diào)控其他有關(guān)于細(xì)胞分裂、紡錘體方向。Hox基因?qū)儆谕串愋秃校╤omeobox)家族的其中一員,在大多數(shù)Hox基因中,會(huì)含有一段約180個(gè)核苷酸的同源異型盒,可以轉(zhuǎn)錄出含有約60個(gè)氨基酸序列,稱為同源蛋白質(zhì)區(qū)段(homeodomain)。各種生物的Hox基因之表現(xiàn)方式類似,靠近3'端的基因會(huì)表現(xiàn)于動(dòng)物的身體前部,靠近5'端則表現(xiàn)于身體的后部。除了這種規(guī)律之外,Hox基因又會(huì)因?yàn)橐恍┰颍诓煌瑺顟B(tài)下有不同的表現(xiàn)。
人類的Hox基因可分成4個(gè)基因群集,分別位在不同的染色體上,這些染色體分別是7號(hào)、17號(hào)、12號(hào)與2號(hào)。人類的Hox基因在書寫時(shí)以全大寫表達(dá),例如HOXA、HOXB、HOXC與HOXD。此外,這些基因可分成13個(gè)平行同源家族(paralogous family),以數(shù)字表示,例如HOXA4,HOXB4,HOXC4與HOXD4。這些家族成員的DNA序列與轉(zhuǎn)錄出來(lái)的蛋白質(zhì)序列類似。其中HOXD13的突變會(huì)造成多指癥(synpolydactyly);而HOXA13的突變則會(huì)導(dǎo)致手腳生殖器癥(hand-foot-genital syndrome,HGFS)。另外HOXB群集中的8個(gè)成員會(huì)影響紅血球的發(fā)育,其中HOXB4與HOXB7又會(huì)影響T細(xì)胞與B細(xì)胞。
大量的lncRNA被發(fā)現(xiàn)轉(zhuǎn)錄于人類HOX基因簇中,它們以時(shí)間和空間特異的方式表達(dá)。lncRNA也被發(fā)現(xiàn)與HOX基因座的整體空間表達(dá)模式相對(duì)應(yīng),表明它們可能使用與HOX基因相同的增強(qiáng)子,例如,HOTAIR,一個(gè)HOXC基因座的lncRNA,在遠(yuǎn)端和后端位置相同的細(xì)胞中表達(dá);以及Frigidair,另一個(gè)HOXC基因座的lncRNA,具有前端的表達(dá)模式。相反,HOTTIP,另一個(gè)在人HOXA簇遠(yuǎn)端發(fā)現(xiàn)的lncRNA,也在遠(yuǎn)端細(xì)胞中表達(dá)[9]。(圖14)
知識(shí)點(diǎn)拓展:HOX基因在喉癌組織與癌旁正常組織中的表達(dá)譜研究[10](生信分析)

DNA損傷誘導(dǎo):LincRNA-p21和PANDA
LncRNA不僅影響生物發(fā)育,而且在組織應(yīng)激時(shí)(炎癥、腫瘤)也起著重要作用。研究發(fā)現(xiàn),lncRNA-p21位于CDKN1A基因上游,參與調(diào)控p53介導(dǎo)的凋亡過(guò)程。
lincRNA-p21 由 p53 直接激活,與異質(zhì)性核糖核蛋白K(hnRNP-K) 這個(gè)反式作用因子直接相互作用來(lái)共同調(diào)控細(xì)胞凋亡[11]。(圖15)
lncRNA-PANDA也依賴p53基因的激活。在缺乏p53基因的情況下,PANDA不能被DNA損傷激活。在DNA損傷后,p53直接與CDKN1A位點(diǎn)結(jié)合并激活PANDA。PANDA隨后與轉(zhuǎn)錄因子NF-YA相互作用,限制促凋亡基因的表達(dá),使細(xì)胞周期停滯[12]。

多能性與重編程:ROR-LncRNA
提到多能性和重編程,大家一定能聯(lián)想到誘導(dǎo)性多能干細(xì)胞(induced pluripotent stem cells,iPS cells)。2006年日本京都大學(xué)Shinya Yamanaka在世界著名學(xué)術(shù)雜志《細(xì)胞》上率先報(bào)道了誘導(dǎo)多能干細(xì)胞的研究。他們把Oct3/4,Sox2、c-Myc和Klf4這四種轉(zhuǎn)錄因子基因克隆入病毒載體,然后引入小鼠成纖維細(xì)胞,發(fā)現(xiàn)可誘導(dǎo)其發(fā)生轉(zhuǎn)化,產(chǎn)生的iPS細(xì)胞在形態(tài)、基因和蛋白表達(dá)、表觀遺傳修飾狀態(tài)、細(xì)胞倍增能力、類胚體和畸形瘤生成能力、分化能力等方面都與胚胎干細(xì)胞相似。
科學(xué)家發(fā)現(xiàn)在小鼠胚胎干細(xì)胞(ESC)中存在一種與細(xì)胞多能性相關(guān)的lincRNA-ROR。研究人員表明,重編程可以誘導(dǎo)體細(xì)胞轉(zhuǎn)化為多能干細(xì)胞(iPSC)。lincRNA-RoR參與了體細(xì)胞重編程轉(zhuǎn)化為多能性干細(xì)胞的過(guò)程。ROR是關(guān)鍵的多潛能因子Oct4、Sox2和Nanog的直接靶向因子,研究發(fā)現(xiàn)RoR在Oct4缺失時(shí)下調(diào),在iPSC分化過(guò)程中也下調(diào)[13]。

冷誘導(dǎo):COLDAIR和COOLAIR
本篇綜述,作者也舉了植物相關(guān)的lncRNA參與的分子機(jī)制。對(duì)植物來(lái)說(shuō),從營(yíng)養(yǎng)發(fā)育到生殖發(fā)育的轉(zhuǎn)變是一個(gè)高度調(diào)節(jié)的過(guò)程。許多植物對(duì)季節(jié)非常敏感,利用春化作用儲(chǔ)備營(yíng)養(yǎng),在一年中的最佳時(shí)期開始開花。冬季寒冷的環(huán)境中會(huì)通過(guò)表觀遺傳沉默機(jī)制,激活抑制開花的因子,為春季開花提供能力。例如在擬南芥植物中,寒冷引起開花因子沉默的過(guò)程中,產(chǎn)生了大量的反義轉(zhuǎn)錄本,其中一種lncRNA,命名為COOLAIR,溫度下降激活lncRNA-COOLAIR與PRC2形成復(fù)合物,導(dǎo)致花抑制因子-開花位點(diǎn)C(FLC)染色質(zhì)上三甲基化組蛋白H3K27的富集,達(dá)到FLC的表觀遺傳穩(wěn)定的抑制作用。
以eRNA為例的協(xié)調(diào)活性
在發(fā)育和分化過(guò)程中,基因的表達(dá)調(diào)控涉及許多元件,例如,順式調(diào)控DNA元件和反式作用蛋白。順式調(diào)控DNA元件有啟動(dòng)子,絕緣子,增強(qiáng)子和沉默子。其中,一類被稱為增強(qiáng)子RNA(eRNA),也是一種lncRNA,eRNA的長(zhǎng)度為0.5-5kb。
啟動(dòng)子位于基因近端,與一般轉(zhuǎn)錄因子相關(guān)聯(lián),招募和定位RNA聚合酶激活轉(zhuǎn)錄。與啟動(dòng)子相反,增強(qiáng)子eRNA通常遠(yuǎn)離它們所調(diào)控的基因。是一類DNA調(diào)節(jié)序列,其可以激活基因表達(dá)而不依賴于它們與其靶基因的距離或方向。增強(qiáng)子通常與靶基因結(jié)合。在發(fā)育過(guò)程中,按時(shí)間及組織特異性調(diào)控編碼基因的表達(dá)。它們的錯(cuò)誤調(diào)節(jié)會(huì)誘發(fā)人類疾病。研究報(bào)道,eRNA的改變可影響癌細(xì)胞的細(xì)胞周期和細(xì)胞生長(zhǎng)等生物過(guò)程,是潛在的治療靶點(diǎn)。目前估計(jì)> 400k潛在的增強(qiáng)子存在于人類基因組中[14]。

重復(fù)檢測(cè):RNA降解和Staufen
mRNA的豐度與蛋白質(zhì)的產(chǎn)量由直接的聯(lián)系。影響mRNA豐度的主要因素就是轉(zhuǎn)錄量和降解速率。mRNA的轉(zhuǎn)錄量和降解速率主要通過(guò)轉(zhuǎn)錄水平調(diào)控和轉(zhuǎn)錄后加工決定。RNA結(jié)合蛋白Staul(Staufenl)通過(guò)直接結(jié)合移碼增加蛋白(up-fameshift protein 1,Upf1)的NMD因子,將其募集到mRNA的3‘-非編碼區(qū)域(UTR),引起mRNA的降解。這種機(jī)制稱為Staul介導(dǎo)的mRNA降解 (SMD)。一種稱為半Staul結(jié)合位點(diǎn)的lncRNA,1/2-sbsRNA(half-STAU1結(jié)合位點(diǎn)lncRNA),通過(guò)與mRNA的3‘-非編碼區(qū)域(UTR)的ALU元件的不完全匹配,形成Staul結(jié)合位點(diǎn),促進(jìn)Staul與mRNA結(jié)合導(dǎo)致mRNA降解[15,16]。

三、功能2:分子誘餌
上述研究結(jié)果證明lncRNA在調(diào)節(jié)mRNA轉(zhuǎn)錄中的重要地位,此外,還有一個(gè)主要的機(jī)制,lncRNA充當(dāng)分子誘餌。吸引另外一個(gè)分子與它結(jié)合,并發(fā)揮功能。
DHFR次要啟動(dòng)子:DHFR Minor
二氫葉酸還原酶(dihydrofolate reductase,DHFR)是利用NADPH還原二氫葉酸產(chǎn)生四氫葉酸的氧化還原酶。DHFR次要啟動(dòng)子區(qū)域轉(zhuǎn)錄出的lncRNA與該基因主要啟動(dòng)子區(qū)域結(jié)合形成lncRNA-DNA復(fù)合體,抑制轉(zhuǎn)錄因子TFIID結(jié)合,從而使基因DHFR發(fā)生沉默[13],并強(qiáng)調(diào)了基因間的lncRNA在調(diào)控鄰近基因表達(dá)中充當(dāng)誘餌,結(jié)合某些物質(zhì)抑制基因表達(dá)。
TERRA:調(diào)控端粒
端粒是位于真核生物染色體物理末端的DNA-蛋白質(zhì)復(fù)合物,對(duì)染色體穩(wěn)定性至關(guān)重要。由端粒轉(zhuǎn)錄產(chǎn)生的長(zhǎng)鏈非編碼RNA被稱作TERRA, TERRA具有調(diào)控和保護(hù)染色體末端的能力[17]。研究報(bào)道,攜帶PolyA的TERRA,刺激端粒酶陽(yáng)性細(xì)胞中的端粒酶重新募集,以及TERRA可作為支架,可以加強(qiáng)端粒上蛋白質(zhì) 招募和酶活性。
PANDA:NF-YA
lncRNA PANDA可以調(diào)控細(xì)胞凋亡。DNA損傷可導(dǎo)致細(xì)胞凋亡或細(xì)胞周期停滯。PANDA對(duì)DNA損傷非常敏感,其表達(dá)的誘導(dǎo)早于CDKN1A。PANDA通過(guò)直接結(jié)合和分離NF-YA(一種在DNA損傷時(shí)激活凋亡程序的核轉(zhuǎn)錄因子)來(lái)抑制凋亡基因的表達(dá),以利于細(xì)胞周期的停止。
Gas5:糖皮質(zhì)激素受體
生長(zhǎng)阻滯特異性轉(zhuǎn)錄因子5(growth arrest-special transcript 5, GAS5)屬于長(zhǎng)鏈非編碼RNA, 位于人類基因組1號(hào)染色體上, 在細(xì)胞增殖、凋亡、遷移和侵襲等生物過(guò)程中起重要調(diào)控作用。研究表明Gas5具有誘導(dǎo)細(xì)胞糖皮質(zhì)激素抵抗的作用。Gas5通過(guò)形成RNA模體與糖皮質(zhì)激素受體的DNA結(jié)合域結(jié)合,充當(dāng)分子誘餌,抑制糖皮質(zhì)激素受體[18]。
miRNA和剪接因子介導(dǎo)的LncRNA誘餌:假基因、miRNA靶向模擬物和MALAT1
miRNA可以與mRNA中的不完全互補(bǔ)序列相互作用調(diào)控編碼基因的表達(dá)。而lncRNA,腫瘤抑制因子假基因(PTENP1)的3’ UTR與以腫瘤抑制基因(PTEN)為靶點(diǎn)的調(diào)節(jié)性miRNA序列結(jié)合,抑制PTEN基因的下調(diào),并使其翻譯成腫瘤抑制蛋白PTEN。
總之,這些例子說(shuō)明了lncRNA誘餌可以結(jié)合蛋白質(zhì)和小的調(diào)節(jié)性RNA發(fā)揮作用。
四、功能III:引導(dǎo)
lncRNA的第三個(gè)功能是引導(dǎo)RNA結(jié)合蛋白質(zhì),然后引導(dǎo)核糖核蛋白復(fù)合物定位到特定的靶點(diǎn)。lncRNA可以以順式(在鄰近基因上)或反式(遠(yuǎn)定位基因)的方式來(lái)引導(dǎo)基因表達(dá)的變化。
順式導(dǎo)向作用之一,前面也有提及,lncRNA具有類似啟動(dòng)子和增強(qiáng)子的作用結(jié)合X染色體的非活性中心,使X染色體沉默[19]。(圖19)

起到反式導(dǎo)向作用的lncRNA,類似于轉(zhuǎn)錄因子一樣的結(jié)構(gòu),可發(fā)揮反式轉(zhuǎn)錄調(diào)控作用; 比如lncRNA HOTAIR與腫瘤轉(zhuǎn)移相關(guān),研究發(fā)現(xiàn)lncRNA HOTAIR表達(dá)下降,細(xì)胞侵襲性下降,其中l(wèi)ncRNA HOTAIR對(duì)腫瘤轉(zhuǎn)移的影響通過(guò)反式調(diào)控PRC2表達(dá)實(shí)現(xiàn)[20]。

五、功能IV:支架
TERC:組裝端粒酶
端粒酶催化活性需要與兩個(gè)端粒酶亞基的結(jié)合。TERC(端粒酶RNA)為合成端粒酶提供模板并且為端粒酶與催化蛋白的結(jié)合和催化活性提供結(jié)構(gòu)基礎(chǔ)[21]。

HOX基因座轉(zhuǎn)錄反義RNA(HOTAIR):PRC2和LSD1
如前面所述,lncRNA HOTAIR結(jié)合多梳復(fù)合物PRC2,使K27上的組蛋白H3甲基化。發(fā)揮抑制基因表達(dá)的作用。研究報(bào)道與PRC2結(jié)合的片段是lncRNA HOTAIR 的5’ 端的前300nt,表明HOTAIR在PRC2和LSD1/CoREST/REST復(fù)合物之間充當(dāng)支架和橋梁。
INK4基因座反義非編碼RNA(ANRIL):PRC2 and PRC1
INK4為細(xì)胞周期蛋白依賴的激酶抑制劑,INK4可與MDM2結(jié)合防止p53被泛素化降解,這兩種蛋白通過(guò)共同調(diào)節(jié)CDK4和p53,從而控制細(xì)胞從G1期轉(zhuǎn)到S期,是一個(gè)非常重要的抑癌基因。反義lncRNA-ANRIL,來(lái)源于INK4b/ARF/INK4a基因座,有類似于啟動(dòng)子和增強(qiáng)子的作用,ANRIL與多梳抑制復(fù)合物PRC2 and PRC1相結(jié)合,并通過(guò)與這兩種多梳蛋白相互作用引起INK4a基因轉(zhuǎn)錄沉默。
異染色質(zhì):
lncRNA發(fā)揮異染色質(zhì)的分子拼接作用。異染色質(zhì)是指在細(xì)胞周期中具有固縮特性的染色體。異染色質(zhì)分為結(jié)構(gòu)異染色質(zhì)和功能異染色質(zhì)兩種類型。結(jié)構(gòu)異染色質(zhì)是指各類細(xì)胞在整個(gè)細(xì)胞周期內(nèi)處于凝集狀態(tài)的染色質(zhì),多定位于著絲粒區(qū)、端粒區(qū),含有大量高度重復(fù)順序的脫氧核糖核酸(DNA),稱為衛(wèi)星DNA(satellite DNA)。功能異染色質(zhì)只在一定細(xì)胞類型或在生物一定發(fā)育階段凝集,如雌性哺乳動(dòng)物含一對(duì)X染色體,其中一條始終是常染色質(zhì),但另一條在胚胎發(fā)育的第16~18天變?yōu)槟癄顟B(tài)的異染色質(zhì),該條凝集的X染色體在間期形成染色深的顆粒,稱為巴氏小體(Barr body)。
總結(jié)
通過(guò)上述介紹的幾種lncRNA,可以說(shuō)lncRNA具備多種關(guān)鍵的生物學(xué)功能。目前發(fā)表的生信分析的文章,分析內(nèi)容主要涉及單個(gè)lncRNA在某些腫瘤中的預(yù)后作用,與臨床的相關(guān)性,通過(guò)一些lncRNA數(shù)據(jù)庫(kù)預(yù)測(cè)一些靶基因,再富集分析一下。進(jìn)階版本就是ceRNA網(wǎng)絡(luò)。但總的來(lái)講lncRNA與基因的作用不應(yīng)該限于作用于某個(gè)mRNA并調(diào)控mRNA的表達(dá)。也許,某些lncRNA本身異常的增高也是一種機(jī)制呢?希望由本篇綜述以及擴(kuò)展學(xué)習(xí)的資料,為大家增加一點(diǎn)關(guān)于生物信息的背景知識(shí),再寫非編碼RNA的文章的時(shí)候,可以更進(jìn)一步的討論其與腫瘤的關(guān)系。
參考文獻(xiàn)
1. Mercer TR, Dinger ME, Mattick JS. Long non-coding RNAs: insights into functions. Nature Reviews Genetics. 2009;103:155-159.
2. St. Laurent G, Wahlestedt C, Kapranov P. The Landscape of long noncoding RNA classification. Trends in Genetics. 2015;315:239-251.
3. Wilusz JE, Sunwoo H, Spector DL. Long noncoding RNAs: functional surprises from the RNA world. Genes Dev. 2009;2313:1494-1504.
4. Ponting CP, Oliver PL, Reik W. Evolution and Functions of Long Noncoding RNAs. Cell. 2009;1364:629-641.
5. Guttman M, Garber M, Levin JZ, et al. Ab initio reconstruction of cell type–specific transcriptomes in mouse reveals the conserved multi-exonic structure of lincRNAs. Nature Biotechnology. 2010;285:503-510.
6. Scheuermann J, Boyer L. Getting to the heart of the matter: Long non-coding RNAs in cardiac development and disease. The EMBO journal. 2013;32.
7. Ransohoff JD, Wei Y, Khavari PA. The functions and unique features of long intergenic non-coding RNA. Nature Reviews Molecular Cell Biology. 2018;193:143-157.
8. Pontier DB, Gribnau J. Xist regulation and function explored. Human genetics. 2011;1302:223-236.
9. Rinn JL, Kertesz M, Wang JK, et al. Functional Demarcation of Active and Silent Chromatin Domains in Human HOX Loci by Noncoding RNAs. Cell. 2007;1297:1311-1323.
10. 曲靈美, 徐光達(dá), 李昕, et al. HOX基因在喉癌組織與癌旁正常組織中的表達(dá)譜研究. 中國(guó)中西醫(yī)結(jié)合耳鼻咽喉科雜志. 2018;261:3.
11. Lander, E. S, Regev, et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response. CELL -CAMBRIDGE MA-. 2010.
12. 陳曉英. LncRNA PANDA通過(guò)抑制細(xì)胞凋亡調(diào)控動(dòng)脈粥樣硬化發(fā)展過(guò)程, 汕頭大學(xué); 2016.
13. Loewer S, Cabili MN, Guttman M, et al. Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells. Nat Genet. 2010;4212:1113-1117.
14. Li W, Lam MT, Notani D. Enhancer RNAs. Cell Cycle. 2014;1320:3151-3152.
15. 夏天, 肖丙秀, 郭俊明. 長(zhǎng)鏈非編碼RNA的作用機(jī)制及其研究方法. 遺傳. 2013;353:269-280.
16. Gong C, Maquat LE. lncRNAs transactivate STAU1-mediated mRNA decay by duplexing with 3′ UTRs via Alu elements. Nature. 2011;4707333:284-288.
17. Montero JJ, López de Silanes I, Gra?a O, Blasco MA. Telomeric RNAs are essential to maintain telomeres. Nature Communications. 2016;71:12534.
18. 李明凱, 詹浩煉, 吳靈飛. 長(zhǎng)鏈非編碼RNA GAS5在腫瘤中的研究進(jìn)展. 世界華人消化雜志. 2019;2703:42-49.
19. Lee JT. The X as model for RNA's niche in epigenomic regulation. cold spring harb perspect biol. 2010;29:a003749.
20. Gupta RA, Shah N, Wang KC, et al. Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis. NATURE -LONDON-. 2010.
21. Collins K. Physiological assembly and activity of human telomerase complexes. Mechanisms of Ageing and Development. 2008;1291:91-98.