测序技术精度对精准医学的影响
生物通 · 2016/03/07
新一代测序技术在精准医疗中的地位不可或缺,可谓是精准医疗的“先行者”。最近,在Genome Medicine上发表的一项研究显示,大多数在医学上具有重要意义的基因,都位于人类基因组中比较复杂、难以分析的区域,目前难以获得准确的序列信息。


2015年1月20日,美国总统奥巴马在国情咨文中提出“精准医学计划”,希望精准医学可以引领一个医学新时代。在奥巴马宣布启动精准医学计划的一年后,中国当前正在确定它自己的更大型的项目计划。2015年12月9日至12日,由中国药理学会药物基因组学专业委员会主办、上海交通大学Bio-X研究院与康昱盛承办的国际精准医学与未来健康前沿研讨会暨全国第三届药物基因组学学术大会,在上海隆重召开。中国政府有望在今年3月批准它的下一个五年计划之后正式宣布该计划。尽管目前尚不清楚将会投入多少资金——但几乎可以确定的是,会比美国2.15亿美元的计划规模更大,投入资金更多。

新一代测序技术(NGS)在精准医疗中的地位不可或缺,可谓是精准医疗的“先行者”。最近,在《Genome Medicine》杂志上发表的一项研究报告显示,大多数在医学上具有重要意义的基因,都位于人类基因组中比较复杂、难以分析的区域,目前难以获得准确的序列信息。通常,这些医学上重要的基因中有五分之一,用今天的基因测序方法来进行破译,是具有挑战性的,这些基因区域中的信息,可能对于患者的诊断或治疗计划至关重要。

为了优化医疗护理,预测疾病风险并选择适当的药物,就需要我们准确解释每位患者的遗传密码。因此,斯坦福大学研究人员在这项研究中,强调了测序误差会带来的医学影响。

这些误差包括假阳性(识别并不在那里的基因突变)和假阴性(未能检测到合理的致病突变)。两者都可能对病人的治疗产生深远的影响。例如,在BRCA2基因(这个著名的基因与遗传性乳腺癌和卵巢癌相关)中的假阳性突变,可能导致手术风险的降低,如双侧乳腺切除术和卵巢切除术。因此,一个错误识别的突变可能导致激进的和不必要的手术。

斯坦福大学研究团队使用美国国家标准与技术研究所(NIST)提供的一份金标准的基因组序列。这个基因,属于一名欧洲血统的女性,此前通过五种不同的测序技术而被测序。NIST研究团队结合来自所有五种技术的结果,在技术允许的基因组区域中,开发一种可靠的共有序列。他们在这名捐赠者77%的基因组中获得了一种可靠的共有序列。

通过研究捐赠者基因组中这些“高可信度”的区域,如何与已知引发人类疾病的3300个基因重叠,研究人员发现,对于这些基因当中的593个基因来说,不到一半的关键蛋白编码区,位于可能被可靠测序的区域。

有一组疾病基因(56个,包括BRCA2),被美国医学遗传学和基因组学学院(ACMG)视为医学上最“可行的”。现在,ACMG指南需要临床基因检测实验室,来筛选所有接受外显子组或基因组测序的患者,以在这56个基因中寻找致病突变,这些基因与一些可治疗的疾病相关,从遗传性癌症危到及生命的心律失常。例如,患者最初可能进行了测序以确定他们的自闭症原因,但也被告知在BRCA2中有一个偶然发现,目的都是预测或预防疾病。

斯坦福大学的研究人员发现,对这些医学上的重要基因来说,每个基因的蛋白质编码区通常只有80%能够被可靠地测序。

这项研究还表明,目前确定的大多数致病突变,位于易于测序的区域。具体来说,致病突变被分类到ClinVar数据库中,超过80%的位于NIST基因组的高置信区域内。此外,这些ClinVar突变绝大多数(超过98%)位于独特DNA序列的延伸部位,我们知道这里很容易测序。

这些结果强调,需要某种测序的方法,更好地渗透到很难测序的基因组区域,从而准确地揭示目前有可能被掩盖的致病突变。

本文第一作者、来自斯坦福大学的Rachel Goldfeder说:“随着这项技术从实验室转向临床,我们需要能够准确、可靠地测定整个基因组的序列,因为错误的信息会导致不适当的医疗保健。好消息是,在这种情况下,使用当前的方法,我们能够可靠地测定77%的供体基因组被。现在的挑战是,把我们的努力集中在其他23%的基因组,即基因组中难以捉摸的区域。只有这样我们才能实现精确医学的全部潜力。”

所有文章仅代表作者观点,不代表本站立场。如若转载请联系原作者。
查看更多
  • Medical implications of technical accuracy in genome sequencing

    Background As whole exome sequencing (WES) and whole genome sequencing (WGS) transition from research tools to clinical diagnostic tests, it is increasingly critical for sequencing methods and analysis pipelines to be technically accurate. The Genome in a Bottle Consortium has recently published a set of benchmark SNV, indel, and homozygous reference genotypes for the pilot whole genome NIST Reference Material based on the NA12878 genome. Methods We examine the relationship between human genome complexity and genes/variants reported to be associated with human disease. Specifically, we map regions of medical relevance to benchmark regions of high or low confidence. We use benchmark data to assess the sensitivity and positive predictive value of two representative sequencing pipelines for specific classes of variation. Results We observe that the accuracy of a variant call depends on the genomic region, variant type, and read depth, and varies by analytical pipeline. We find that most false negative WGS calls result from filtering while most false negative WES variants relate to poor coverage. We find that only 74.6 % of the exonic bases in ClinVar and OMIM genes and 82.1 % of the exonic bases in ACMG-reportable genes are found in high-confidence regions. Only 990 genes in the genome are found entirely within high-confidence regions while 593 of 3,300 ClinVar/OMIM genes have less than 50 % of their total exonic base pairs in high-confidence regions. We find greater than 77 % of the pathogenic or likely pathogenic SNVs currently in ClinVar fall within high-confidence regions. We identify sites that are prone to sequencing errors, including thousands present in publicly available variant databases. Finally, we examine the clinical impact of mandatory reporting of secondary findings, highlighting a false positive variant found in BRCA2.

    展开 收起
发表评论 我在frontend\modules\comment\widgets\views\文件夹下面 test