Science子刊:AI助力遗传性疾病诊断提速,抢获重症新生儿生机

2019-04-28 09:04 · 杜姝

雷迪儿童基因组医学研究所(RCIGM)的研究人员利用机器学习过程和临床自然语言处理(CNLP)在创纪录的时间内诊断罕见的遗传疾病。


Kingsmore博士,世界上最快的全基因组测序实现分子诊断记录保持者。图片来源:RCIGM

据统计,北美每年有4%的新生儿受到遗传性疾病的影响,遗传性疾病也成为新生儿死亡的主要原因。约占15%的儿童入住医院同样受到罕见的遗传性疾病侵袭。

圣地亚哥Rady儿童基因组医学研究所(RCIGM)从2017年7月开始进行基因组测序,以指导对新生儿和儿科重症监护患者的医疗干预。2018年2月,RCIGM研究人员通过快速全基因组测序流程,平均为19小时,打破了吉尼斯世界纪录。

继续此项研究,RCIGM建立了一条自动化管道,用于分析电子健康记录和基因组序列的数据,从而为患有疑似遗传性疾病的住院(通常是重症)儿童与时间进行赛跑。通过减少对基因组数据的劳动密集型人工分析的需求,受监督的自动化管道节省了大量时间。RCIGM团队联合Fabric Genomics、Illumina共同在《Science Translational Medicine》杂志上发表了相关研究结果。

“这是RCIGM团队的真正开创性工作,通过使用AI快速准确地分析全基因组序列来挽救患病新生儿的生命。”Scripps Research分子医学教授Eric Topol博士表示。


DOI: 10.1126/scitranslmed.aat6177


2岁的Sebastiana Manuel是Rady儿童基因组医学研究所(RCIGM)的患者之一,他们从快速的全基因组中受益。图片来源:Rady儿童基因组医学研究所

具体来说,该项研究基于快速全基因组测序rWGS)技术得以实现,用以筛选从儿童血液样本中发现的数千个遗传异常的整个基因组成。

其中,rWGS管道中的关键组件来自Illumina,包括Nextera DNA Flex文库制备,通过NovaSeq 6000的全基因组测序和S1流动细胞格式。其他管道元素包括Clinithink的临床自然语言处理平台CliX ENRICH,可以快速梳理患者的电子病历,自动提取关键的表型信息。

机器学习系统的另一个核心要素是由Diploid提供的MOON。MOON使用AI自动化基因组解释,以自动过滤和排列可能的致病变体。基于医学文献的自然语言处理的深度表型整合是推动此自动化解释的关键特征之一。MOON花了五分钟时间来表明全基因组中450万个变异体中的因果突变。

此外,Alexion将罕见疾病与数据科学专业知识相结合,使得临床信息转换为可计算的格式,提高指导变异解释的时效性。基因测序数据在研究人员的监督下被输入自动化计算平台中,利用Fabric Genomics基于AI算法的OPAL(现称Fabric Fabric)软件来确定自动化管道的信息输出。

“使用机器学习平台并不能取代人类专家。相反,它会增强人类专家的能力,”RCIGM统计科学家,该研究的第一作者Michelle Clark博士说,“通过及时的靶向治疗,快速的基因组测序可以改善患有遗传性疾病的重病儿童的结果。”

“有些人称之为人工智能,而我们认为它是增强型智能,”RCIGM总裁兼首席执行官Stephen Kingsmore表示:“患者护理始终以医生作为开始和结束。通过利用AI的力量,可以精准地确定遗传性疾病的根本原因,同时迅速向重症监护医生提供这些关键信息,以挽救病情严重的新生儿生命。”

减少经验稀缺的临床医学遗传学家对耗时的人工分析和数据解释的需求,增加基因检测过程的自动化,从而可以消除了WGS临床应用的障碍。虽然rWGS这条新管道需要适应不同的医院系统使用,但这种自动化工具可以帮助临床医生加快准确的遗传疾病诊断,也能加速患者护理的救命变化。

参考文献:

[1] Diagnosis of genetic diseases in seriously ill children by rapid whole-genome sequencing and automated phenotyping and interpretation

[2] Researchers use machine-learning system to diagnose genetic diseases

[3] Rapid, AI-Powered Genetic Disease Diagnosis for Critically Ill Infants