第34卷第2期 海 洋 学 报 V0l_34。No.2 2012年3月 ACTA 0CEANOLOGICA SINICA March 2012 应用新一代测序技术测定大室别藻苔虫 线粒体基因组全序列 申欣 ,田美 ,朱长保 ,刘会莲。,赵方庆 (1.淮海工学院海洋学院,江苏连云港222005;2.中国科学院北京生命科学研究院,北京100101;3.中国科学 院海洋研究所,山东青岛266071) 摘要:线粒体基因组的获得传统上通常是采取长PCR结合鸟枪法或步移法测序。近年来新一代测序 技术蓬勃发展,以454,Solexa和SOLID测序平台为代表。应用新一代高通量测序技术(Solexa)并结 合巢式PCR扩增,完成了大室别藻苔虫(Membranipora grandicella)的线粒体基因组全序列。大室别 藻苔虫线粒体基因组是目前国际上获得的第一条苔藓动物软壁亚目线粒体基因组全序列,基因组全 长为15 861 bp,比已完成的4种苔藓动物线粒体基因组略大。大室别藻苔虫线粒体基因组包含13个 蛋白质编码基因、2个核糖体RNA基因和2O个转运RNA基因。通过与已测得的苔藓动物进行比 较,发现目前已完成的5个苔藓动物线粒体基因组的基因排列顺序显著不同。苔藓动物线粒体基因 组基因排列的比较,今后可能会成为探讨该类群系统演化关系的重要信息来源。 关键词:大室别藻苔虫;线粒体基因组;新一代测序技术;巢式PCR;基因排列 中图分类号:Q915.815 文献标忘码:A 文章编号:0253-4193(2012)02—0136—07 1 引言 诞生于2O世纪70年代的Sanger法是最早被 广泛使用的DNA测序技术,也是完成人类基因组 群体遗传分化的理想材料L2 J。线粒体基因组的获 得传统上通常是采取长PCR结合鸟枪法或步移法 测序。虽然PCR方法操作简单,对样品需求量少, 但是花费时间较长、工作量较大等问题,并且利用长 PCR扩增有时成功率不高,难以获得目的片段l5]。 苔藓动物(bryozoans)作为重要的海洋无脊椎 计划的基础,但是由于它测序通量低、费时费力,科 学家们一直在努力寻求通量更高、速度更快、价格更 便宜的测序技术。自2005年以来,以Roche公司 的454技术、Illumina公司的Solexa技术和ABI公 动物门类,现存6000余种。目前国际上对苔藓动物 线粒体基因组的研究还比较少,仅完成4个苔藓动 物物种的线粒体全基因组,包括多室草苔虫Bugula neritina、栉口目苔虫Flustrellidra hispida、颈链血 苔虫Watersipora subtorquata和扇形管孔苔虫T“一 bulipora flabellaris¨6 ]。大室别藻苔虫Membra nipora grandicella属于裸唇纲Gymnolaemata,唇 司的SOLID技术为代表的新一代测序技术相继诞 生。新一代测序技术又称高通量测序技术,主要特 点是测序通量高,测序时间和成本显著降低口]。 与单个基因相比,线粒体基因组是一个完整的 体系,具有信息量丰富和系统发育树结构稳定等优 点。由于线粒体基因组具有众多优势,使其成为研 究后生动物关键类群的起源、进化、系统发育关系及 收稿日期:2011-06—26;修订日期:201卜O9—26。 口目Cheilostomida,软壁亚目Malacostegina、膜孔 苔虫超科Membraniporoidea,膜孔苔虫科Membra一 基金项目:国家自然科学基金(40906067);中国科学院基金(YO64O21BJ1;086901 1BJ5);江苏省“青蓝工程”人才基金(苏教师[2010127号)。 作者简介:申欣(1981一),男,副教授,博士.研究方向为线粒体基因组学。E—mail;shenthin@163.corn 2期 申欣等:应用新一代测序技术测定大室别藻苔虫线粒体基因组全序列 niporidae。本研究利用Illumina Genome Analyzer 表1大室别藻苔虫线粒体基因组的特异引物 引物名称 (Solexa)新一代测序平台获得大室别藻苔虫线粒体 引物序列(5 一3 ) 基因组的部分序列。根据获得的部分序列设计引 物,进行巢式PCR和测序,最终获得大室别藻苔虫 的线粒体基因组全序列。本实验流程避开了长 PCR扩增等技术的限制,为其他海洋动物线粒体基 因组的获得提供重要的参考价值。 2材料和方法 2.1 样品 大室别藻苔虫采自于江苏连云港,样品清理后, 用95 乙醇固定备用。 2.2基因组DNA的提取 称取50 mg大室别藻苔虫样品放入培养皿中, 用蒸馏水洗涤,浸泡过夜。研磨后置于Eppendorf 管中,加入600 L的裂解液(40 mmol/dm。Tris— HCl,20 mmol/dm。醋酸钠、1 mmol/dm。EDTA, 1%SDSl pH一8.0)和5 L的蛋白酶K(20 rag/ tin。),充分混匀后,置于55℃水浴锅中硝化4 h。 4 000 r/min离心5min去除钙质沉淀,小心将上清 液转入新的Eppendorf管中。加入等体积的酚:氯 仿:异戊醇(25:24:1)抽提2次,等体积的氯仿: 异戊醇抽提1次。将上清液转入新的Eppendorf管 中,加入2倍体积的无水乙醇,充分混匀后置于 2O℃冰箱30 rain。12 000 r/rain离心10 min沉 淀DNA,7O 乙醇洗涤2次后置于室温下干燥。 50 I TE(含20 mg/cm。RNase)溶解DNA,用 0.6%的琼脂糖凝胶电泳检测其质量。 2.3 Solexa高通量测序和序列拼接 Illumina Genome Analyzer是一种基于单分子 簇的边合成边测序技术,它基于专有的可逆终止化 学反应原理,具体步骤包括文库制备、产生DNA 簇、上机测序和数据分析。高纯度的大室别藻苔虫 DNA经Illumina Genome Analyzer测序平台获得 序列,使用Abyss软件口叼进行序列拼接。 2.4组合PCR和巢式PCR扩增 拼接后得到的contigs在GenBank数据库中进 行BLAST比对,从中得到线粒体基因组序列信息, 设计本物种线粒体基因组的特异引物(引物名称及 序列见表1),进行组合PCR扩增(反应体系和反应 条件见表2,3)。PCR产物通过1 琼脂糖凝胶电 泳检测质量。 Mgr-cgl F12231 TTCGAGCAGTAGCCCAGACAATTT Mgr-cgl—F12415 CTTTGACTTAGCAGAGGGAGAATC Mgr-cgl—R1 36 TTAGTAGGGATGGAAGGGAAAATA Mgr-cgl—R266 AAGAGGGTATGTGAGAATTTTTAG Mgr-cg2一F2709 CTAACACACCCAAAGAACACCTGC Mgr—。cg2—。F2838 AACCAATAACCGCACAACTTACAT Mgr—。cg2—’R101 GTTGATCATATCGTAGGCGAGGGT Mgr-cg2一R258 AGGTACATGTGATAGCCGCAACTC 表2组合PCR的反应体系 组分 体积/uL ddH2O 1O×LA PCR buffer II(Mg plus) dNTP(2.5 mlTlO1・dm each) 引物1(10 mmol・dm ) 引物2(10 mmol・dm ) 模板 Taq酶(5 U・mm )0.2 1 预变性 2 变性 45 S 3 退火 45 s 4 延伸 2 rain 步骤2~4,35次循环 5 再延伸 10 rain 6 保存 由于组合PCR的扩增效率低或者产生了非特 异扩增产物,而巢式PCR则能消除非特异扩增产 物、增加扩增效率,所以以组合PCR的反应产物为 模板来进行巢式PCR扩增(巢式PCR的反应体系 和反应条件见表4,5)。用1 琼脂糖凝胶电泳检测 巢式PCR产物质量,纯化后用ABI 3730型测序 仪测序。 138 表4巢式PCR的反应体系 组分 ddH20 海洋学报34卷 2.5序列拼接及基因注释 体积/uL 18.21 2.5 2.0 1.0 1.0 0.1 用DNASTAR软件对测得的序列进行碱基识 别和序列拼接,从而获得线粒体基因组的全序列。 通过线粒体基因组的基因预测工具DOGMAE“ 对 蛋白质编码基因及2个rRNA基因进行预浸0。tR~ NA基因是通过tRNAscan~SE 1.21l_1 进行基因 预测。 10×LA PCR buffer II(Mg plus) dNTP(2.5 mmol・dm一0 each) 引物1(10 mmol・dm ) 引物2(10 mmol・dm ) 模板 Taq酶(5U-mm一。) 3结果与讨论 3.1 Solexa测序和BLAST比对 O.2 使用Abyssl5 软件对Illumina Genome Analyzer 测序结果进行拼接所获得的contigs,在GenBank数 1 2 预变性 变性 94 94 56 72 5 rain 45 S 45 s 1 rain 据库中与苔藓动物线粒体基因组进行BI AST相似 性比对,得到大室别藻苔虫线粒体基因组的部分序列 (2个contigs,长度分别为12 540和2 983 bp)。将其 3 4 退火 延伸 在GenBank上与已测得大室别藻苔虫线粒体lrRNA 序列进行两两比对,发现与lrRNA吻合(图1)。从图 1可以看出,其序列相似性达到99.33 ,因此Solexa 测序后获得的两个contigs为大室别藻苔虫线粒体基 步骤2~4,35次循环 5 6 再延伸 72 12 保存 因组部分序列。 Score= 536 bits《290), Expect ie-155 Identities:295/297{99奄',Gaps=2/297 cI%》 Strand=Plus/Plus Query 11929 11988 58 Sb]ct 1 uery 11989 Q王2O畦8 sbjc七 S9 uery 12049 Q118 王21O8 Sbjct 王王9 uery 12109 Q7g Sb3ct 王-178 aaagc乞tcctaaa0 趣最矗鑫孽乞乞々乞l已乞C趣七譬鑫taaaaaag 12168 l l l l l l l l l l l l l l l l i l l l l l l l l l l l i l l I l l l l l l i 238 置222S 295 uery 12169 矗aa嚣七。嚣七乞乞氇a撬藏g趣attaaaaaa矗穗 Ql l l l l l l l l l l l l l l I l l l l l l l l l l l sb3ct 239 图1 BI AST两两比对的结果 3.2组合PCR和巢式PCR扩增结果 由于在使用引物组合Mgr—cgl—F12415/Mgr cg2一R258进行PCR扩增时出现了非特异性条带 (见图2),因此使用引物组合Mgr—cgl—F12415/ 根据已获得的线粒体基因组部分序列设计特异 引物,引物名称和序列如表1所示。将这些引物随 机组合进行PCR扩增,其中只有2种组合可以得到 目的条带(见图2,3)。 Mgr—cg2一R101进行巢式PCR,扩增得到特异性条 带(见图4)。 140 海洋学报34卷 (表6),这与已完成的4个苔藓动物线粒体基因组 存在差异 一。。。 共有3 357个氨基酸。蛋白质编码基因总体的A+ T含量为68.9 ,如果仅统计密码子的第三位,则 其A+丁含量上升至77.6 。 大室别藻苔虫线粒体基因组的蛋白质编码基因 表6大室别藻苔虫线粒体基因组的基因分布特征 2期 申欣等:应用新一代测序技术测定大室别藻苔虫线粒体基因组全序列 141 3.5核糖体RNA与转运RNA 3.6基因排列 大室别藻苔虫线粒体基因组的两个rRNA基 因都编码在a链上,lrR 位于tRNA 与 ~ NA 之间,srRNA位于 NA 与tRNA 之问, 2个核糖体之间只间隔了1个tRNA基因(tR— 目前已经完成的苔藓动物线粒体基因组共有4 条,即多室草苔虫(接收号:NC一010197;裸唇纲、唇 口目)、颈链血苔虫(接收号:NC~011820;裸唇纲、唇 口目)、栉口目苔虫F.hispida(接收号:NC一 NA )。大室别藻苔虫lrRNA基因的长度为 1 273 bp,其srRNA基因的长度为871 bp。大室别 藻苔虫的线粒体基因组共编码2O个tRNA基因,总 008192;裸唇纲、栉口目)和扇形管孔苔虫(接收号: EU563927;狭唇纲、管孔目),而且基因排列顺序显 著不同,说明在苔藓动物线粒体基因组的内部经历 长度为1 279 bp;与后生动物线粒体基因组的标准 了大规模的基因重排过程(图6)[6 ]。 组成相比,缺少 NA 和 NAry 基因。 大室别藻苔虫 多室草苔虫 颈链血苔虫 栉口目苔虫 扇形管孔苔虫 图6苔藓动物线粒体基因组的基因排列 下划线标注的基因在8链上编码 4结论 现象;对13个蛋白质编码基因都使用了完全终止 密码子TAA;与后生动物线粒体基因组的标准组 本论文基于Illumina Genome Analyzer(Sol— 成相比,缺少tRNA胁和 NAD 基因;具有独特的 exa)新一代测序平台并结合巢式PCR扩增方法, 基因排列顺序。 获得了大室别藻苔虫的线粒体基因组全序列。大 本文测定的大室别藻苔虫线粒体基因组及与目 室别藻苔虫线粒体基因组是目前国际上获得的第 前已完成的4个苔藓动物的线粒体基因组相比,大 一条软壁亚目的线粒体基因组全序列。通过对其 室别藻苔虫具有独特的基因排列顺序;5个苔藓动 基本结构特征的分析,发现了与其他苔藓动物线 物线粒体基因组的基因排列顺序显著不同,说明在 粒体基因组相比,大室别藻苔虫线粒体基因组具 苔藓动物线粒体基因组的内部经历了大规模的基因 有一些显著的特点:大室别藻苔虫线粒体基因组 重排过程。苔藓动物线粒体基因组基因排列的比 的长度为15 861 bp,与其他苔藓动物相比较大;控 较,今后可能会成为探讨该类群系统演化关系的重 制区也较大,长度为1 057 bp;没有出现基因重叠 要信息来源。 参考文献: [1]王曦,t ̄Jl,我,王立坤,等.新一代高通量测序数据的处理与分析[J].生物化学与生物物理进展,2010,37(8):834--846 142 海洋学报34卷 [22 HELFENBEIN K G,FOURCADE H M,VANJANI R G,et a1.The mitochondrial genome of Paraspadella gotoi is highly reduced and reveals that chaetognaths are a sister group to protostomes[J],Proe Natl Acad Sci USA,2004,101(29):10639--10643. [3]DELLAPORTA S L,XU A,SAGASSER S,et a1.Mitochondrial genome of Trichoplax adhaerens supports placozoa asthe basal lower metazoan phylum[J].Proc Natl Acad Sei USA,2006,103(23):8751—8756. [4] SHEN X,MA XY,REN JF,et a1. A ClOSe phylogeneticrelationship between Sipuncula and Annelida evidenced from the complete mito— chondrial genome sequence of Phascolosoma esculenta[J].BMC Genomics,2009(10):136—146. [5] 申欣,吴志刚.单环刺蜢线粒体基因组全序列的获得——长PCR结合鸟枪法测序r-J].海洋科学,2010,34(12):26—29. r6]WAESCHENBACH A M,TELFORD J,PORTER J S,et a1.The complete mitochondrial genome of Flustrellidra hispida and the phy logenetic position of Bryozoa among the Metazoa[J].Mol Phylogenet Evol,2006,40(1):195 207. [7]JANG KH,HWANG U W.Complete mitochondrial genome of Bugula neritina(Bryozoa,Gymnolaemata,Cheilostomata):phylogenetic position of Bryozoa and phylogeny of lophophorates within the Lophotr。choz0a[J].BMC Genomics,2009,10:167. r8]SUN MA,WU ZG,SHEN X,et a1.The complete mitochondrial genome of Watersipora subtorquata(Bryozoa,Gymnolaemata,Cheilos— tomida)with poylogentic consideration of Bryozoa[J].Gene,2009,439(1-2):17 24. [9]SUN MA,SHEN X,LIU HL,et a1.Complete mitoehondrial genome of Tubulipora flabellaris(Bryozoa:Stenolaemata):the first rep resentative from the class Stenolaemata with unique gene order[J].Marine Genomics,2011,doi:10.1016/j.margen.2011.03.006. [1o]SIMPSON J T,WONG K,JACKMAN S D,et a1.ABYSS:a parallel assembler for short read sequence data[J].Genome Res.2009,19 (6):1117—1123. r11]WYMAN S K,JANSEN R K,BOORE J L.Automatic annotation of organellar genomes with DOGMA[J].Bioinformatics,2004,20 (17):3252—3255. [12]LOWE T M,EDDY S R.tRNAscan--SE:a program for improved detection of transfer RNA genes in genomic sequence[J].Nucleic Acids Res.1997,25(5):955—964. Determination of Membranipora grandicella complete mitochondrial genome sequence based on next generation sequencing technology SHEN Xin .TIAN Mei ,ZHU Changbao ,LIU Huilian。,ZHAO Fangqing。 (1.College of Marine Science。Huaihai Institute of Technology,Lianyungang 222005,China;2.Beijing Institutes oJ LiJ’ Science.Chinese Academy of Sciences,Beijing 100101,China;3.Institute oJ Oceanology,Chinese Academy oJ Sciences, Qingdao 266071,China) Abstract:Traditionally,the mitochondrial genome sequences were usually obtained by shotgun or primers— walking combination with long PCR.The next-generation sequencing technologies are developing fastly in re— cent years,such as 4 5 4,Solexa and SOLID sequencing platform.Membranipora grandicella complete mito— chondrial genome sequence was determined based on next—generation high-throughput sequencing technology (Solexa)and nested PCR amplification.The complete mitochondrial genome of M.grandicella is 1 5,8 6 1 bp in length,which is the first representative from the suborder Malacostegina(Bryozoa),and is relatively larger when compared with mtDNAs of other study bryozoans.The mitochondrial genome contains 1 3 protein coding genes,two ribosomal RNAs and 2 0 transfer RNAs.Compared with other study bryozoans,gene arrange— ments of five bryozoans mitoehondrial genomes are significantly different.Comparison of bryozoans mitochon— drial gene arrangements can be important information sources for exploring the phylogenetic relationships with— in the group. Key words:Membranipora grandicella;mitochondrial genome;next—generation sequencing;nested PCR; gene arrangement