专访 | 百迈客创始人兼董事长郑洪坤:用大数据之器破海洋生物基因组学之谜

2019-09-11 09:12 · 杜姝

青岛百迈客生物科技有限公司开业暨海洋生物基因大数据研究中心成立典礼在青岛黄岛区隆重举行。这标志着百迈客生物在海洋科研领域又迈出新的一步,在青岛这座滨海城市扬帆起航。

青岛百迈客生物科技有限公司开业暨海洋生物基因大数据研究中心成立典礼在青岛黄岛区隆重举行。这标志着百迈客生物在海洋科研领域又迈出新的一步,在青岛这座滨海城市扬帆起航。

生物探索十分有幸能够采访到百迈客创始人兼董事长郑洪坤先生和中国科学院海洋研究所研究员相建海老师。他们两人分别从产业和科研两个角度为我们细致地讲述了建立海洋生物基因大数据平台是海洋基因组学研究不断完善的必经之路,而百迈客在这一完善过程中不仅仅要扮演好参与者的角色,还要努力成为海洋生物基因研究大数据方向的先锋探索者和引领者。


产研对话:SLAF-seq技术助力海洋生物基因组科研

海洋生物是生物学研究的重要领域,也是破解人类起源之谜的重要板块。自1997年起,美国便开始有计划的开展对罗非鱼、对虾和牡蛎等海洋生物的基因组研究,并且多个海洋蓝藻基因组计划也相继启动。虽然我国起步较晚,但目前也已启动了扁藻、螺旋藻、牡蛎、对虾等基因组计划。正如相建海老师所说:由于海洋生物基因组大、杂合度高、拼接难度大成为了全球研究海洋生物基因组的最大困扰。

工欲善其事,必先利其器。为了破解凡纳滨对虾的基因组密码以便更好地培育对虾,实现其经济价值和生物研究价值,相建海老师在基因测序的道路上开始了新的征程。多次尝试使用二代测序技术都没有办法完成对虾的基因组图谱的重组,但在一次偶然的机会下他发现来自百迈客公司自主研发的SLAF-seq技术可以很好的完成这一问题。该技术前期利用生物信息学方法,对目标物种的参考基因组(或已知BAC序列)进行系统分析,设计标记开发方案,后期根据前期的方案,构建SLAF-seq文库,筛选特异性长度片段进行高通量测序,将获得测序深度和质量满足要求的SLAF片段来代表目标物种的全基因组信息。于是产研互助,世界上第一个凡纳滨对虾的基因组图谱在我国率先完成了,很快也在国际期刊《scientific reports》杂志上发表这一重大成果,获得了国际上认可。

自此,百迈客公司自主研发的SLAF-seq技术奠定了在海洋生物基因研究上不可或缺的重要地位。

共建共享:基因大数据平台提高公共基因利用率

数据是观测生物遗传信息的重要基础,不同生物的遗传数据可谓是科研道路上必不可少的战略性资源,但目前这种资源却存在利用不足或者资源浪费的现象。

相建海老师对此提出了自己的建议:搭建生物大数据平台势在必行,这是发展海洋生物基因组学研究必不可少的事情。特别如何共建共享生物领域的公共数据?如何利用数据不断地更新迭代以完善生物基因组图谱信息?更重要的是,如何把数据转化为生产力,服务生物经济的发展,如何将数据转化为科研动力,服务生物科研的前进。

面对这些问题,百迈客公司提出了自己的回答。而这一回答的答案便是:建立海洋生物基因大数据平台。百迈客创始人兼董事长郑洪坤先生为我们介绍到:自高通量基因测序发展的十几年时间以来,业界已经积攒了许多数据,但这些数据的公共利用率却不是很高。据了解,面对海量的数据不知从何下手、有效的数据不能得到专业性的转化成为了阻碍基因公共数据利用率的两座大山。

既然问题已经很明显了,那解决问题就很容易了。郑洪坤先生表示:让数据库的数据可用,让可用数据有工具再利用便是这一大数据平台搭建的出发点。

如何搭建这一大数据平台,郑洪坤先生及其团队有着自己的步骤和想法,他告诉生物探索记者:首先,我们从海洋生物信息的科研需求入手,打造一个海洋生物多组学数据库。该数据库包含了基因组、转录组、表观组、代谢组、蛋白组等各种类型组学的数据,把科研所需的数据一网打尽,为科研人员提供多方位全覆盖的帮助。在这里,不仅可以帮助科研人员减少测序成本的浪费,也能够提高基因公共数据的利用率,为数据更新迭代做出努力。

第二,既然有了数据,如何才能把数据背后的价值挖得更加透?我们想要打造一个类似人工智能的交互平台,依靠海量的基因公共数据,利用互联网大数据算法技术,为科研人员提供相关建议和解决方案。例如,科研人员通过测序技术得出了海洋生物的一些数据,但并不清楚这些数据能为科研提供何种帮助。这时,大数据的交互分析便成为了科研亟需的工具了。它就像一个人工智能科学家,帮助你解读数据信息,帮你找到合适的工具、甚至我们可以设想它能够帮助你找到研究的新突破口。


基因+:产业化支撑海洋生物信息产业发展

如今,大数据平台的正式成立成为了新的开端,至于以后的发展如何,郑洪坤先生也表示将继续依托“基因+”多元化的发展理念,将海洋生物基因组学的研究推向新的高潮。但要坚持这一发展理念,也存在重重困境。

首先是生物信息人才的流失。郑洪坤先生表示:为什么IT行业不存在人才流失呢?是因为产业的支撑能力。随着产业的不断发展,产业价值的不断丰富,给足了在此行业的工作人员安定定求发展的信心。如果如果想要留住专业的生物信息人才,我目前能想到的方法还是以互联网商业化的形式将他们留住。举个例子,如果市场需要一个基因组的解读软件,而恰好由我们的专业团队开发出来了,他们的付出就应该得到回报,而这个回报可以是金钱。随着在市场上用这个软件的人越来越多用,他能够得到的回报也就更多,也让他有更多的信心和动力去不断地对此软件进行更新迭代。通过商业化的模式,有投入有回报,持续迭代,就有可能将其发展成为一个具有市场强竞争力的产品。

其次是商业模式的选择。既然要用商业化的方式留住人才,也就逃不开谈到平台的盈利模式。与会期间也有很多科研学者建议将此作为免费的科研服务平台,对此郑洪坤先生也表达了自己的意见:目前我们团队所设想的盈利模式可能很贴近互联网的盈利模式,是将其放置一个相对长时间的周期里面来看的。开始投入市场的时候,可能会是免费试用的模式。因为初出茅庐的我们需要的是流量和培养用户的体验感,让用户不断地给我们提意见进行改进。当我们的改进达到稳定可持续的状态时,我们需要的便是用户的黏度了,也就是当用户真正认可了我们的服务与价值,也就会很自愿地对我们的产品买单。


结语

在采访的最后,郑洪坤先生还讲述了自己对这一海洋生物基因大数据平台的一些设想:大势所趋,高通量的基因测序技术将不断在海洋生物基因组学领域中不断发展壮大。但我们不应只停留在基因检测的维度,而应该将基因检测出的数据进一步地应用在产业上。目前我们可知的有两大应用方向,一个是基因编辑,另一个是生物合成。或许在这些领域我们将带来不一样的思考和变革以帮助海洋生物基因组学研究的不断发展,助力蓝色海洋经济的全面发展。