区块链助力生命大数据!第三届GCTA引领大科学、大数据、大合作

2018-10-26 18:09 · buyou

10月26日,第三届基因组云计算技术开发者大会(GCTA 2018)在深圳国家基因库召开。生物技术(BT)和信息技术(IT)的融合,云计算的风起云涌,将我们带入了一个解读生命密码、认识疾病本源、重新定义健康的新纪元。

第三届GCTA由华大基因和亚马逊AWS主办,秉承“共享、共为”的精神,涵盖三大主题:Big Data for Life(生命大数据)、Cloud Computing for Omics(生物信息云计算)、Artificial Intelligence & Bio-Intelligence(人工智能与生物智能)。


先锋议题吸引了众多来自海内外的学界精英、产业领袖,300多名专业人士一起参加了本次盛会,共同揭秘生命大数据给人类带来的巨大影响。


中国科学院院士、华大基因理事长杨焕明在致辞中指出,生命就是数字,而数字化的过程首先就是阅读生命的语言DNA序列,它们是生命之书的基础字母。今天我们又有一种新的语言,它由0和1两个数字组成,可以描绘无限多的可能。


中国高科技产业化研究会副理事长刘延宁在致辞中,从顶层设计的高度提出了非常高屋建瓴的建议。她指出,基因科技的跨学科合作、形成共识,关键在于科学决策。


华大基因CEO尹烨在致辞中表示,风云际会,GCTA不知不觉已到第三届,每个人都有个人基因组的时代即将到来。人类正在完成BT到IT的连接,不断接近生物的真知。

大规模人群研究成为精准医疗的基础

生命大数据不仅能带来巨大的科学发现,也能助力产业做出突破。大会上,来自牛津大学的Zhengming Chen教授作了题为《Big Cohorts, Big Dataand Precision Medicine》的演讲。他指出,对于精准医疗、精准健康来说,队列研究非常重要。在科学不断发展的过程中,研究者需要通过不同人群的研究,才能找出更好的发病规律和个体化的治疗方式。好的研究不能是信息孤岛,一个研究中真正的数据价值来源于完整的、整合的、多病种、多组学的数据,我们才能真正解读生命之书。


近年来,关于大规模人群的研究在世界各地如火如荼地开展,并不断发布相关成果,标志着生命科学产业已经从单个样本的检测和诊断,正式进入了大数据时代。大会上,华大基因大数据总监金鑫博士分享了“百万中国人基因组计划”的最新进度和成果,发布了“炎黄”指数YH index,对标中国基因组数据在全球已完成基因测序数据中的比例,为研究者提供参考。

此外,来自加州大学伯克利分校的Rasmus Nielsen教授、Stephen Francis教授,费城儿童医院的朱元坤教授,中科院北京基因组研究所的曾长青教授,辛辛那提儿童医院的Ge Zhang教授,微基因CEO陈钢博士等专家学者和商业领袖分别从遗传、疾病、妊娠、精准医疗等多个维度分享了最新的科研及商业动向,剖析生命大数据的重要影响及作用。

区块链助力生命大数据

生命就是大数据。作为大会的主办方之一,华大基因CEO尹烨带来“生命周期表”的发布。该项目旨在通过基因测序对物种进行数据挖掘,发现隐藏在数据背后的生命规律。项目以哺乳动物作为首期测序对象,已有超过127科物种被“科长”认领。“科长”将通过众筹的方式,推动该科物种的基因组分析、解读和知识传播,从而使该物种得到更多的了解和保护。


此外,借助区块链技术,生命周期表实现了众筹资金流向可溯源、数据应用挖掘可监管、科普科研价值可反馈,未来将有望成为一个多主体合作交互、多层次数据应用、多维度惠益分享的物种基因数据应用生态体系。

BT与IT融合构建行业新机会

爆炸式的数据产出对海量信息的传输、存储、计算及分析提出了新的挑战。如何及时获取、快速分析、安全储存这些庞大的数据是研究者们急需解决的问题。围绕大数据所产生的存、读、懂、写、存、用也成为业内人士争相追捧的焦点,并为BT+IT行业带来了新市场、新挑战、新需求。

国内测序龙头企业华大基因,早在2015年就和阿里云、英特尔进行合作共同推出大规模生物信息分析平台BGI Online,为用户免费提供最新版的基因组分析工具箱GATK4的使用授权。会上,华大基因正式发布了BGI Online V3.0版本。


近年来,知名互联网公司也都纷纷进场,布局生命大数据。会上,来自亚马逊AWS的代闻先生作了主题为《AWS云超能:助力基因检测和生物信息分析》的分享,来自微软的徐明强博士则作就微软与精准医疗作了主题分享。此外,腾讯云、阿里云、华为等企业的代表也分享了各自在在生命科学产业的经典产品和成果,并就未来如果解密和储存生命奥妙进行了畅想。

同时,业界专注于生物信息分析的企业如聚道科技、人和未来、达仁基因、荣之联的代表也纷纷在现场分享了各自的行业经验。华大智造算法开发方向负责人谢寅龙也就MegaBOLT生信分析加速器作了相关分享。据了解,该产品不仅能够支持常规的WGS/WES加速分析,而且还能够支持特定领域的深入应用加速分析。其中肿瘤数据分析加速系统MegaBOLT Somatic,计算加速15倍以上。此外,结合云计算技术,MegaBOLT还将在BGI online云平台上线,为基因数据分析提供更灵活、更高效的解决方案。

GCTA凝聚行业共识

大数据时代,基因组学在生命科学研究、疾病研究和健康等领域的应用越来越普遍,相关数据产出呈井喷之势。数据获取、存储、分析、应用、标准化与安全性等,均亟待行业共识。中国电子技术标准研究院专家宋继伟先生在现场做了《物联网与基因信息标准化》的专业分享。

华大基因在2016年发起第一届基因组云计算技术开发者大会,以探讨生物信息云计算技术及产业发展为主题,聚焦行业现状、解读技术标准、解决应用问题,旨在将生物信息领域、云计算领域的科学研究、技术开发、产业服务等力量联合起来,共同推动生物信息云计算领域的国内外交流与创新。

首届GCTA于2016年在深圳顺利召开,为基因组和云计算两大领域开创了产业协作的先河,成立“中国生物信息云计算产业联盟”,设立“大咖论道”论坛、“GCTA精锐奖”,发布了“SZIndex”,引起巨大轰动。2017年,第二届GCTA大会发起中国“基因数据分析标准流程语言协作组”、GCTA路演精英秀,还发布“SA Index”指数,引领风气之先。如今,GCTA已成为业界的标志性大会。