美国国立卫生研究院“冷对”基因数据隐私新挑战

2012-04-13 11:00 · Obam

研究人员找到一个方法可以连接一个人的基因到某一公共研究数据库里其匿名的基因数据上。但是,美国国立卫生研究院(NIH)作为最大的此类数据库的拥有者之一,表示不打算采用任何新步骤预防某些人利用这种办法破坏基因隐私。这与NIH四年前的反应形成鲜明对比。

导读:研究人员找到一个方法可以连接一个人的基因到某一公共研究数据库里其匿名的基因数据上。但是,美国国立卫生研究院(NIH)作为最大的此类数据库的拥有者之一,表示不打算采用任何新步骤预防某些人利用这种办法破坏基因隐私。这与NIH四年前的反应形成鲜明对比。

美国国立卫生研究院“冷对”基因数据隐私新挑战

美国国立卫生研究院“冷对”基因数据隐私新挑战

本周发表的一篇极具“挑衅性”的论文提到,研究人员找到一个方法可以连接一个人的基因到某一公共研究数据库里其匿名的基因数据上。但是,美国国立卫生研究院(NIH)作为最大的此类数据库的拥有者之一,表示不打算采用任何新步骤预防某些人利用这种办法破坏基因隐私。这与NIH四年前的反应形成鲜明对比,当时,一个相类似的研究促使它将基因数据从其公共网站中取了出来。

那时,NIH将来自于数百人的单核苷酸多态性(SNP)数据张贴在了网上,以为不会破坏隐私。但是,随后有科学家在《公共科学图书馆—遗传学》(PloS Genetics)上发表文章指出,如果他们有某个人的DNA样本,他们可以在一个公共DNA数据库中连接到该人的SNP结果。如此一来,NIH和维康基金会不得不将这些数据从公共网站上撤了下来。现在,NIH只允许通过认证的研究者下载这些SNP数据。

对于特殊类型的基因数据而言,这种准入壁垒并不常见,例如通过研究组织样本中的RNA水平分析测量基因活性。因为这类基因表达数据被认为不是起源于某个人,研究人员已经定期存放RNA结果到公共数据库中,例如,NIH的基因表达综合(GEO)数据库。

但是,纽约市西奈山医学院的Eric Schadt和同事在《自然—遗传学》(Nature Genetics)发表的论文提到,他们发现了生成基于个体的基因表达结果的个人SNP“主页”,或一个DNA“条码”的方法。这就意味着,原则上讲,如果有人有一个储存在GEO参与者的DNA样本,他将能够设计出一个SNP条码,用它来与GEO样品进行匹配,寻找参与者的生物数据。

尽管与2008年PloS Genetics发表的论文相似,但是NIH此时并未忧虑。NIH的一份声明提到,NIH认为不需要改变自己的数据共享模式。美国国家人类基因组研究所发言人Larry Thompson解释道,Schadt团队需要极为复杂的统计工具,并且这不是一个简单的事情。Schadt则并不期望NIH采取新的数据访问限制,而是希望强调,事实上可能没有方法能够完全保证个人基因数据安全。

关键词: 卫生