加拿大团队利用PacBio技术破译“筑坝高手”海狸的基因组
生物通 · 2017/01/23
在建筑学方面,海狸筑坝的高超能力给了人类不少启示。在生物学方面,人类又能从海狸基因组中获得哪些启示呢?近日,加拿大的团队测序并分析了加拿大海狸(Castor canadensis)的基因组。他们在《G3: Genes, Genomes, Genetics》杂志上报道了这项研究的成果。


在建筑学方面,海狸筑坝的高超能力给了人类不少启示。在生物学方面,人类又能从海狸基因组中获得哪些启示呢?近日,加拿大的团队测序并分析了加拿大海狸(Castor canadensis)的基因组。他们在《G3: Genes, Genomes, Genetics》杂志上报道了这项研究的成果。

多伦多大学和病童医院的分子遗传学家Stephen Scherer是这篇文章的资深作者。他在文中写道:“这项研究为基因组组装带来了新见解,也为海狸及啮齿动物的进化带来了重要的基因组学资源。”

海狸是北美最大的啮齿动物。一只完全长成的海狸长约30英寸(76厘米),体重达35-60磅(16-27 千克)。北美海狸绝大多数生活在落基山脉和加拿大北部。 它们栖息在林地的各种水域,如池塘、湖泊以及溪流。

长期以来,海狸一直是重要的生态和经济来源。正如Scherer及其同事所解释的,在加拿大,“海狸是一个标志性的国家象征”,其中部分原因是海狸的皮毛及其他产品作为经济动力,推动早年英国和法国的殖民扩张,最终导致加拿大成立。

在这项研究中,Scherer及其同事利用Pacific Biosciences单分子测序和de novo组装,对海狸的肌肉组织和白细胞进行测序,以鉴定其基因组特征。他们的研究对象是一只在魁北克出生、目前住在多伦多动物园的海狸,名叫Ward。

这个团队利用PacBio RS II单分子实时测序技术分析了海狸的基因组DNA,并从混合样品中提取出线粒体序列,组成了近17,000个碱基的线粒体基因组。

为了完成27亿个碱基的de novo基因组组装,研究人员还融合了Illumina的HiSeq X仪器上产生的短片段基因组序列。他们还利用HiSeq 2500仪器,对安大略皇家博物馆中收藏的冰冻海狸组织中的肌肉组织进行RNA测序,并将基因组与转录组进行比较。

在组装基因组的同时,研究人员开始注释基因组,鉴定可能与人类疾病、啮齿动物的牙列以及其他过程相关的重复序列和蛋白编码区。他们指出,对海狸基因组的进一步研究可能有助于揭开海狸在北美的历史以及它对环境和人群迁移的影响。

此外,在上周末的动植物基因组大会上,美国俄勒冈州立大学领导的海狸测序计划也展出了一些成果。研究人员指出,他们利用Illumina测序技术对海狸基因组进行测序和组装,获得了17种不同海狸组织的转录组数据,并对加拿大海狸及19个其他物种进行了系统发育分析。

查看更多
  • De novo genome and transcriptome assembly of the Canadian beaver (Castor canadensis)

    The Canadian beaver (Castor canadensis) is the largest indigenous rodent in North America. We report a draft annotated assembly of the beaver genome, the first for a large rodent and the first mammalian genome assembled directly from uncorrected and moderate coverage (< 30 ×) long-reads generated by single-molecule sequencing. The genome size is 2.7 Gb estimated by k-mer analysis. We assembled the beaver genome using the new Canu assembler optimized for noisy reads. The resulting assembly was refined using Pilon supported by shortreads (80 ×) and checked for accuracy by congruency against an independent short-read assembly. We scaffolded the assembly using the exon-gene models derived from 9805 full-length open reading frames (FL-ORFs) constructed from the beaver leukocyte and muscle transcriptomes. The final assembly comprised 22,515 contigs with an N50 of 278,680 bp and an N50-scaffold of 317,558 bp. Maximum contig and scaffold lengths were 3.3 and 4.2 Mb, respectively, with a combined scaffold length representing 92% of the estimated genome size. The completeness and accuracy of the scaffold assembly was demonstrated by the complete and precise exon placement for 91.1% of the 9,805 assembled FL-ORFs and 83.1% of the BUSCO (Benchmarking Universal Single-Copy Orthologs) gene set used to assess the quality of genome assemblies. Well-represented were genes involved in dentition and enamel deposition, defining characteristics of rodents with which the beaver is well-endowed. The study provides insights for genome assembly and an important genomics resource for Castoridae and rodent evolutionary biology.

    展开 收起
发表评论 我在frontend\modules\comment\widgets\views\文件夹下面 test