2. 河北大学中医学院, 保定 071002;
3. 河北科技大学生物科学与工程学院, 石家庄 050018
2. College of Traditional Chinese Medicine, Hebei University, Baoding 071002, China;
3. College of Bioscience and Bioengineering, Hebei University of Science and Technology, Shijiazhuang 050018, China
利用体细胞核移植技术获得的克隆动物为研究细胞核的表观重编程机制提供了一个独特的模型[1]。研究发现,印记基因的异常表达会导致个体发育异常或病变,而这些印记基因在克隆动物中的异常表达与体细胞克隆率低下有关[2]。然而,到目前为止,对印记紊乱与发育缺陷之间的关系了解的还很少。基因组印记是一种表观调控机制,通过对亲本等位基因DNA和组蛋白的不同修饰(甲基化、乙酰化等),选择性的表达来自一方亲本的基因[3-4]。印记基因大多在基因组上成簇存在形成印记域,每个印记域中至少存在1~2个lncRNA(long noncoding RNA),近年来的研究表明,位于基因组印记域中的lncRNA参与了该印记区域内基因印记的调控[5-6]。
转录组深度测序分析发现, 约有62%~75%的人基因组被转录[7],只有约20%的转录产物参与了蛋白质的合成[8-9],近80%为非编码RNA(noncoding RNA,ncRNA),ncRNA在真核生物的转录组中广泛存在。根据长度ncRNA被分为lncRNA和小非编码RNA(small noncoding RNA),大部分ncRNA是lncRNA,长度大于200 nt[7, 9-10]。通过物种间的同源分析表明,lncRNA普遍不具有物种间序列保守性,但这似乎并不是保守的表观调控机制所必需的[11-12], 另外,lncRNA经常表现出高组织特异性, 并在不同的组织及发育阶段中呈现低表达的特点。虽然大部分的lncRNA还不清楚,但已有的研究结果表明,lncRNA通过多种机制参与了不同的生物加工过程,表现出了新的基因调控模式,在表观遗传修饰与基因表达调控中起着重要的作用[9, 13-15]。
在DLK1-DIO3基因簇上,母源表达的ncRNA已证实与胚胎干细胞的全能性有关[16]。在鼠[17-19]和牛[20-22]中,这个区域内多个新的lncRNAs转录已被发现。在对牛DLK1-DIO3印记区域的研究分析中发现,基因MEG8和MEG9之间存在2个EST簇,利用RACE和RT-PCR技术,得到了1个lncRNA,命名为LINC24065。鉴于DLK1-DIO3在体细胞核移植重编程中的重要作用,本研究对LINC24065在体细胞核移植牛中的印记状态和组织表达进行了分析。该研究结果将为进一步了解DLK1-DIO3印记区域在供体核表观重编程中作用提供理论基础。
1 材料与方法 1.1 材料8头出生后48 h内死亡的雌性体细胞核移植牛,它们的供体核分别来自8个不同的皮肤成纤维细胞系(SCN1~SCN8)[23]。并且,这8头体细胞核移植牛均死于器官的发育异常。8头雌性荷斯坦自然繁殖牛(NR1~NR8),在出生后48 h内直接屠宰。分别采集这16头样品牛的心、肝、脾、肺、肾、骨骼肌和大脑组织,编号装入样品袋,立即投入液氮暂存并运输,最后置于-70 ℃冷冻保存。
1.2 方法 1.2.1 牛LINC24065序列的克隆 1.2.1.1 总RNA提取及反转录利用TransZol Up Plus RNA Kit(Transgen Biotech,中国)提取牛各冻存组织的总RNA,通过琼脂糖凝胶检测RNA的完整性;并用Nanodrop2000(Thermo,美国)检测总RNA的质量和浓度, 试验样品的OD260nm/ OD280nm值为1.8~2.1。各组织样品cDNA的合成根据反转录试剂盒(Transgen Biotech,中国)的说明进行操作。20 μL反应体系:1 μg总RNA,1 μL Oligo(dT)引物,1 μL gDNA Remover,10 μL 2×ES Reaction Mix,1 μL RT Enzyme Mix,RNase-free Water补足20 μL。依照厂家提供的说明书进行反转录,先把总RNA、引物和RNase-free Water混合,65 ℃孵育5 min,冰浴2 min。随后加入Enzyme Mix、Reaction Mix和gDNA Remover,42 ℃孵育30 min,85 ℃加热5 min终止反应,-20 ℃冻存。
1.2.1.2 利用RACE技术克隆LINC24065利用UCSC Genome Browser(http://genome.ucsc.edu/)数据库,在牛DLK1-DIO3印记域内的MEG8和MEG9基因间发现了2个可剪接的EST簇。选取第一个EST簇中的交叠序列,用Oligo7软件设计RACE引物RACE5′,RACE3′和RACE3′-1(表 1),引物位于EST序列DY196469上,其中3′端引物为嵌套引物。以大脑做为RACE模板,LINC24065的5′-RACE和3′-RACE过程按照SMARTer RACE 5′/3′Kit(TaKaRa公司,大连,中国)的试剂盒说明进行操作。RACE产物用pEASY-Blunt Cloning Kit (Transgen,北京,中国)克隆并测序(华大基因公司)。本试验中所有用到的引物见表 1。
利用3′和5′RACE测序结果之间的交叠序列拼接全长序列。用NCBI(www.ncbi.nlm.gov/gorf.html)的在线软件Open Read in Frame Finder(ORF Finder)对获得的序列进行分析, 并对得到的多肽链进行结构域的分析。根据GENCODE对lncRNA的命名原则,将获得的基因命名为LINC24065。
1.2.2 LINC24065的印记状态分析 1.2.2.1 基因组提取及SNP鉴定利用DNA提取试剂盒(Transgen Biotech,中国)提取自然繁殖牛和体细胞核移植牛的基因组DNA,用引物(gF/gR)进行PCR扩增。PCR反应体系:1 μL基因组DNA为模板,上下游引物(10 μmol·L-1)各0.5 μL,12.5 μL 2×ES Taq MasterMix (Dye)(CWBIO,中国),10.5 μL ddH2O。PCR反应条件:95 ℃变性3 min;95 ℃变性30 s,55 ℃退火30 s,72 ℃延伸40 s,30个循环;72 ℃延伸7 min。用1.5%琼脂糖凝胶进行电泳分离,E.Z.N.A Gel胶回收试剂盒(Omega,美国)回收PCR产物,并直接送华大基因公司测序。然后,用sequencher(V5.4.5)查看测序图谱,寻找有效重叠峰,鉴定SNP位点,确定杂合子个体。
1.2.2.2 利用RT-PCR检测LINC24065的等位基因表达根据RACE结果,用Oligo7软件设计跨内含子的引物(IF/IR),以杂合子牛各组织的cDNA为模板进行RT-PCR扩增。以GAPDH基因为内参基因(Accession No.: BTU85042),利用引物GAPDH-F/GAPDH-R扩增375 bp跨内含子的片段。25 μL RT-PCR反应体系:1 μL cDNA为模板,上下游引物(10 μmol·L-1)各0.5 μL,12.5 μL 2×ES Taq MasterMix (Dye)(CWBIO,中国),10.5 μL ddH2O。PCR反应条件:95 ℃预变性3 min;95 ℃变性30 s,55 ℃退火,30 s,72 ℃延伸30 s,30个循环;72 ℃延伸7 min。扩增产物回收直接测序,查看测序图谱。被检测SNP位点是单峰(单等位基因表达)则为印记基因;在SNP位点检测到重叠双峰(双等位基因表达)则不是印记基因。
1.2.3 LINC24065在牛组织中的表达分析根据第2个EST簇中含有Poly(A)加尾信号的EST序列(Accession No.: EE355346),设计引物R2,并与引物(F,F1;R,R1)组成4对引物(F/R,F1/R,F1/R1,F1/R2),用于检测不同剪接体在自然繁殖牛和体细胞核移植牛组织中的表达。RT-PCR反应体系同1.2.2.2。PCR反应条件:95 ℃预变性3 min;95 ℃变性30 s,55 ℃退火,30 s,72 ℃延伸1 min,35个循环;72 ℃延伸7 min。引物F/R扩增可变剪接体LINC24065-V1和V2;引物F1/R扩增可变剪接体LINC24065-V3;引物F1/R1扩增可变剪接体LINC24065-V4;引物F1/R2扩增可变剪接体24065-V5和V6。本试验中所有用到的引物见表 1。
2 结果 2.1 牛LINC24065及其可变剪接体的序列结构分析用牛的大脑组织为RACE模板,5′RACE和3′RACE分别得到了2个序列,已提交到NCBI(Accession No.: MG757563、MG757564、MG757565、MG757566)。在UCSC数据库中比对后, 共得到18个外显子。根据RACE结果,在exon 1和exon 2上分别设计上游引物F和F1,在exon12a和exon 18上分别设计下游引物R和R1,组成4个引物对(F/R,F/R1,F1/R,F1/R1),进行RT-PCR,共得到了4个可变剪接体(图 1):LINC24065-V1、LINC24065-V2、LINC24065-V3和LINC24065-V4 (Accession No.:MG757567、MG757568、MG757569、MG757570)。F/R扩增得到LINC24065-V1和LINC24065-V2,片段长度分别是1 687和1 766 bp;F1/R的扩增产物是LINC24065-V3,长度为1 058 bp;F1/R1的扩增产物是LINC24065-V4,长度为1 306 bp;F/R1没有检测到扩增产物。可变剪接体LINC24065-V2比LINC24065-V1多exon 12;可变剪接体LINC24065-V3和LINC24065-V4的5′端都是从exon 2a开始,比exon 2少37 bp;可变剪接体LINC24065-V4的最后1个exon 12a包含了exon 12和exon 13。
根据第2个EST簇中有加尾位点的EST(Accession No.: EE355346)设计一个下游引物R2,与两个上游引物组成引物对(F/R2,F1/R2)进行RT-PCR。只有F1/R2扩增得到了2个可变剪接体LINC24065-V5和LINC24065-V6(Accession No.: MG757571和MG757572)(图 1),长度分别为1 200和1 325 bp。可变剪接体LINC24065-V5和LINC24065-V6的5′端从exon 2a开始,与前面获得的4个剪接体(LINC24065-V1~LINC24065-V4)相比,3′端多了3个exon(exon 19~exon 21)。与LINC24065-V6相比,LINC24065-V5缺失exon 12,LINC24065-V5的exon 20与LINC24065-V6的exon 20a 5′端相同,3′端比LINC24065-V6少33 bp,说明exon 20的3′端是可变剪接的位点。在6个可变剪接体中, exon 4(36 bp)和4a(9 bp)的3′端相同,exon 4a比exon 4的5′端缺失了27 bp,exon 4的5′端是可变剪接的位点。
用ORF Finder分别对LINC24065的6个剪接体进行分析,所有剪接体预测的开放阅读框(open read frame,ORF)均为小ORF,最长的ORF编码90个氨基酸;对编码的氨基酸序列进行分析,没有在这些小的多肽链上发现蛋白结构域,说明LINC24065基因是一个位于MEG8和MEG9基因间的ncRNA。
2.2 牛LINC24065的印记状态分析利用PCR产物直接测序法在6个可变剪接体都具有的exon 6上鉴定出1个SNP位点(rs135792171:C/T),其中2头自然繁殖牛(NR1和NR4)和3头体细胞核移植牛个体(SCNT1、SCNT2和SCNT8)为杂合子。
以杂合牛组织(心、肝、脾、肺、肾、肌肉和大脑)的cDNA为模板,对RT-PCR扩增产物(248 bp)直接测序(图 2A),发现LINC24065基因在自然繁殖牛的各组织中均为单等位基因(C)表达。而在杂合体细胞核移植个体的心、肝、脾、肺、肾和肌肉6个组织中,LINC24065基因也为单等位基因(C)表达,而在大脑中为单等位基因(T)表达(图 2B)。说明LINC24065在体细胞核移植牛大脑中与其他被检测组织的表达不同,印记状态发生了改变。
利用4对引物(F/R,F1/R,F1/R1,F1/R2)对LINC24065的6个剪接体在自然繁殖牛和体细胞核移植牛各组织中的表达进行分析。结果发现,6个剪接体在自然繁殖牛的各组织中都能检测到,并且这6个剪接体在大脑组织中表达均较高;而在肾中,LINC24065-V1、LINC24065-V2、LINC24065-V3和LINC24065-V4的4个剪接体的表达量较高;LINC24065-V3在肺中的表达量也较高。
在体细胞核移植牛的脾、肌肉和脑3个组织中,没有检测到LINC24065-V1的表达;在脾和大脑2个组织中,没有检测到LINC24065-V2的表达,在被检测的7个组织中,均没有检测到LINC24065-V3的表达;LINC24065-V4只检测到在脑中表达;LINC24065-V5和LINC24065-V6在大脑中没有检测到表达。以上结果表明,LINC24065的剪接体在体细胞核移植牛中的表达发生了变化(图 3)。
转录组测序发现,在哺乳动物中lncRNAs大量表达,最近的研究表明,lncRNAs在生物体的发育和基因表达调控中起着重要的作用[24]。lncRNAs被定义为长度大于200 nt,并缺乏有功能编码区的RNA转录物。但也有报道,50%的基因间lncRNAs可以编码多肽链,但它们往往没有生物学功能[13-15]。另外,根据结构和功能,lncRNAs被分为不同的类型:内含子lncRNAs(long intronic RNAs)、基因间lncRNAs(long intergenic ncRNA,lincRNA)、增强子lncRNAs(enhancer lncRNAs)和反义lncRNA(antisense lncRNAs)[7]。本试验中,在牛的DLK1-DIO3印记域中鉴定的转录物,位于基因MEG8和MEG9之间,其编码的6个剪接体有多个小的ORF,且均不具有翻译起始的保守Kozak序列(ACCAUGG),编码的多肽也不具有蛋白结构域。因此,将该转录物定义为基因间的lncRNA,并将其命名为LINC24065。lncRNA通常由多个短的外显子组成,具有多个可变剪接体[25]。在DLK1-DIO3印记域中,对人和鼠的研究发现,GTL2、MEG8和MEG9都是母源表达的非编码印记基因,并且都具有多个可变剪接体[26-27]。在前期的研究中发现,牛的GTL2有6个可变剪接体[28],MEG8有12个可变剪接体[29],MEG9有3个可变剪接体[30]。本试验中,LINC24065共包括21个外显子,除了exon 1为664 bp和exon 12a为741 bp以外,其它外显子都很短,多数为20~100 bp,最小的exon 19只有8 bp。这与lncRNA的结构特点是相一致的。绝大部分的lncRNAs被证实是RNA聚合酶Ⅱ编码的,并具有3′端Poly(A)尾巴[24]。然而,也有研究发现了缺乏3′端PolyA尾巴的lncRNAs,比如人中新发现的sno-lncRNAs[31]。本试验中剪接体LINC24065-V1、LINC24065-V2、LINC24065-V3和LINC24065-V4的3′端都没有Poly(A)尾巴,也没有发现Poly(A)加尾信号。然而LINC24065-V5和V6含有Poly(A)加尾信号,与已报道的大部分lncRNA转录方式相同。
在体细胞核移植动物中,围产期死亡率高及出生后表型异常是体细胞核移植成功率低的主要原因[32]。在克隆鼠中,DLK1-DIO3印记域的印记缺失和紊乱会导致早期胚胎死亡,同时,在全能性诱导细胞系中也发现了DLK1-DIO3印记域的紊乱[1]。DLK1-DIO3印记域中包含多种类型ncRNA,包括miRNAs、snoRNA、lincRNA、enhance lncRNA、antisense RNA、lncRNA和long intronic RNA,它们参与了不同的生物加工过程[33]。研究发现,DLK1-DIO3印记域中的ncRNA与细胞的全能性有关[26], 并且发现,lincRNA可以通过与miRNAs和转录因子相互作用来提高细胞的全能性[15, 26]。本研究发现,与自然繁殖牛不同,位于DLK1-DIO3印记域的LINC24065,在体细胞核移植牛中剪接体LINC24065-V3不表达,且其它剪接体的表达具有组织特异性,尤其是在体细胞核移植牛脑组织中表现出印记紊乱。说明LINC24065在体细胞核移植牛中的异常表达可能与其器官发育异常和新生死亡有关。由此推测,LINC24065可能参与了体细胞核重编程的过程。
4 结论本研究获得了一个位于DLK1-DIO3印记区域的基因间lncRNA(LINC24065), 分析了其剪接体在牛中的表达和印记状态,并发现其在体细胞核移植牛的组织中表达异常。本试验结果既丰富了牛DLK1-DIO3印记域的非编码RNA研究,又为进一步揭示DLK1-DIO3印记域在供体核重编程中的作用提供了一定的理论基础。
[1] | OKAE H, MATOBA S, NAGASHIMA T, et al. RNA sequencing-based identification of aberrant imprinting in cloned mice[J]. Hum Mol Genet, 2014, 23(4): 992–1001. DOI: 10.1093/hmg/ddt495 |
[2] | SHI W, ZAKHARTCHENKO V, WOLF E. Epigenetic reprogramming in mammalian nuclear transfer[J]. Differentiation, 2003, 71(2): 91–113. DOI: 10.1046/j.1432-0436.2003.710201.x |
[3] | BARTOLOMEI M S, FERGUSON-SMITH A C. Mammalian genomic imprinting[J]. Cold Spring Harb Perspect Biol, 2011, 3(7): a002592. |
[4] | BARLOW D P, BARTOLOMEI M S. Genomic imprinting in mammals[J]. Cold Spring Harb Perspect Biol, 2014, 6(2): a018382. DOI: 10.1101/cshperspect.a018382 |
[5] | MACDONALD W A. Epigenetic mechanisms of genomic imprinting:common themes in the regulation of imprinted regions in mammals, plants, and insects[J]. Genet Res Int, 2012, 2012: 585024. |
[6] | MALLORY A C, SHKUMATAVA A. LncRNAs in vertebrates:advances and challenges[J]. Biochimie, 2015, 117: 3–14. DOI: 10.1016/j.biochi.2015.03.014 |
[7] | ST.LAURENT G, WAHLESTEDT C, KAPRANOV P. The landscape of long noncoding RNA classification[J]. Trends Genet, 2015, 31(5): 239–251. DOI: 10.1016/j.tig.2015.03.007 |
[8] | CARNINCI P, KASUKAWA T, KATAYAMA S, et al. The transcriptional landscape of the mammalian genome[J]. Science, 2005, 309(5740): 1559–1563. DOI: 10.1126/science.1112014 |
[9] | CAO J N. The functional role of long non-coding RNAs and epigenetics[J]. Biol Proced Online, 2014, 16(1): 42. DOI: 10.1186/1480-9222-16-11 |
[10] | The ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project[J]. Nature, 2007, 447(7146): 799–816. DOI: 10.1038/nature05874 |
[11] | JOHNSSON P, LIPOVICH L, GRANDÉR D, et al. Evolutionary conservation of long non-coding RNAs; sequence, structure, function[J]. Biochim Biophys Acta, 2014, 1840(3): 1063–1071. DOI: 10.1016/j.bbagen.2013.10.035 |
[12] | LOWDON R F, JANG H S, WANG T. Evolution of epigenetic regulation in vertebrate genomes[J]. Trends Genet, 2016, 32(5): 269–283. DOI: 10.1016/j.tig.2016.03.001 |
[13] | MESEURE D, DRAK ALSIBAI K, NICOLAS A, et al. Long noncoding RNAs as new architects in cancer epigenetics, prognostic biomarkers, and potential therapeutic targets[J]. Biomed Res Int, 2015, 2015: 320214. |
[14] | CHEN X, SUN Y, CAI R, et al. Long noncoding RNA:multiple players in gene expression[J]. BMB Rep, 2018, 51(6): 280–289. DOI: 10.5483/BMBRep.2018.51.6.025 |
[15] | DENIZ E, ERMAN B. Long noncoding RNA (lincRNA), a new paradigm in gene expression control[J]. Funct Integr Genomics, 2017, 17(2-3): 135–143. DOI: 10.1007/s10142-016-0524-x |
[16] | LIU L, LUO G Z, YANG W, et al. Activation of the imprinted Dlk1-Dio3 region correlates with pluripotency levels of mouse stem cells[J]. J Biol Chem, 2010, 285(25): 19483–19490. DOI: 10.1074/jbc.M110.131995 |
[17] | ZENG T B, HE H J, ZHANG F W, et al. Expression analysis of AK003491, an imprinted noncoding RNA, during mouse development[J]. Genes Genet Syst, 2013, 88(2): 127–133. DOI: 10.1266/ggs.88.127 |
[18] | HAN Z B, LIU Q, HUANG Z J, et al. Expression and imprinting analysis of AK044800, a transcript from the Dlk1-Dio3 imprinted gene cluster during mouse embryogenesis[J]. Mol Cells, 2013, 35(4): 285–290. |
[19] | GU T T, HE H J, XING Y J, et al. Expression of non-coding RNA AB063319 derived from Rian gene during mouse development[J]. J Mol Histol, 2011, 42(2): 105–112. |
[20] | ZHANG M Y, ZHAO Y P, WANG G N, et al. An imprinted long noncoding RNA located between genes Meg8 and Meg9 in the cattle Dlk1-Dio3 domain[J]. Genetica, 2017, 145(1): 1–7. |
[21] | YANG W, LI D, WANG G, et al. Three intronic lncRNAs with monoallelic expression derived from the MEG8 gene in cattle[J]. Anim Genet, 2017, 48(3): 272–277. DOI: 10.1111/age.2017.48.issue-3 |
[22] |
杨文志, 张明月, 王冠楠, 等. 2个印记的基因间lncRNAs位于牛Dlk1-Dio3印记区域[J]. 畜牧兽医学报, 2016, 47(9): 1848–1852.
YANG W Z, ZHANG M Y, WANG G N, et al. Two imprinted long non-coding RNAs located in cattle Dlk1-Dio3 domain[J]. Acta Veterinaria et Zootechnica Sinica, 2016, 47(9): 1848–1852. (in Chinese) |
[23] | GONG G C, DAI Y P, FAN B L, et al. Production of transgenic blastocyst by nuclear transfer from different types of somatic cells in cattle[J]. Sci China Ser C Life Sci, 2004, 47(2): 183–189. DOI: 10.1360/03yc0015 |
[24] | CHEN Z, LI S, SUBRAMANIAM S, et al. Epigenetic regulation:a new frontier for biomedical engineers[J]. Annu Rev Biomed Eng, 2017, 19(1): 195–219. |
[25] | DEVESON I W, BRUNCK M E, BLACKBURN J, et al. Universal alternative splicing of noncoding exons[J]. Cell Syst, 2018, 6(2): 245–255. |
[26] | BENETATOS L, VARTHOLOMATOS G, HATZIMICHAEL E. DLK1-DIO3 imprinted cluster in induced pluripotency:landscape in the mist[J]. Cell Mol Life Sci, 2014, 71(22): 4421–4430. DOI: 10.1007/s00018-014-1698-9 |
[27] | DA ROCHA S T, EDWARDS C A, ITO M, et al. Genomic imprinting at the mammalian Dlk1-Dio3 domain[J]. Trends Genet, 2008, 24(6): 306–316. DOI: 10.1016/j.tig.2008.03.011 |
[28] | SU H, LI D J, HOU X H, et al. Molecular structure of bovine Gtl2 gene and DNA methylation status of Dlk1-Gtl2 imprinted domain in cloned bovines[J]. Anim Reprod Sci, 2011, 127(1-2): 23–30. DOI: 10.1016/j.anireprosci.2011.07.002 |
[29] | HOU X H, LI D J, SU H, et al. Molecular cloning, expression, and imprinting status of maternally expressed gene 8 (Meg8) in dairy cattle[J]. Genetika, 2011, 47(8): 994. |
[30] | ZHANG K, LI D J, WANG M N, et al. The differential expression of alternatively spliced transcripts and imprinting status of MEG9 gene in cows[J]. Anim Genet, 2014, 45(5): 660–664. DOI: 10.1111/age.12195 |
[31] | ZHANG X O, YIN Q F, CHEN L L, et al. Gene expression profiling of non-polyadenylated RNA-seq across species[J]. Genomics Data, 2014, 2: 237–241. DOI: 10.1016/j.gdata.2014.07.005 |
[32] | LI S J, LI Y X, DU W H, et al. Aberrant gene expression in organs of bovine clones that die within two days after birth[J]. Biol Reprod, 2005, 72(2): 258–265. DOI: 10.1095/biolreprod.104.029462 |
[33] | EDWARDS C A, MUNGALL A J, MATTHEWS L, et al. The evolution of the DLK1-DIO3 imprinted domain in mammals[J]. PLoS Biol, 2008, 6(6): e135. DOI: 10.1371/journal.pbio.0060135 |