伯豪生物转化医学服务平台
威斯腾促销
贝康招聘

遗传变异对基因表达有何影响?33种肿瘤类型免费在线查询

2017/11/23 来源:生物探索
分享: 
导读
为揭示癌症组织中遗传变异对基因表达的影响,美国华人学者和华中科技大学的研究人员合作将癌症基因组图谱计划中的数据,进行了一系列的表达定量性状遗传位点分析,并构建了在线数据平台,提供免费查询和浏览。


近期,国际学术期刊Nucleic Acids Research 在线发表了一项最新研究成果,报道了针对33种肿瘤类型、近万样本的eQTL分析。

这项工作由美国德州大学健康科学中心韩冷教授 (https://med.uth.edu/bmb/labs/han/labnews/)和华中科技大学公共卫生学院缪小平教授共同合作完成。龚静博士为第一作者。

癌症eQTL分析非常必要

全基因组关联研究(GWAS)可以为疾病或性状的遗传病因研究提供线索。分析显示,GWAS发现的与疾病相关的风险位点大多数位于基因的非编码区域并在调控区域富集,这些结果提示疾病相关位点可能主要通过调控基因表达来发挥作用。

所以想进一步剖析疾病,将遗传变异与基因表达数据的整合在一起,就要用到表达定量性状遗传位点(eQTLs) 分析。它是研究遗传变异功能及分子生物学机制的重要方法。然而,目前eQTL研究主要集中在血液样本和正常组织中,而有研究在通过肿瘤样本和正常样本的对比之后,发现大量eQTLs具有肿瘤特异性。针对癌症,尤其是多癌症的eQTL分析非常缺乏。

运用癌症基因组计划数据进行分析

为了揭示癌症中遗传变异对基因表达的影响,作者利用癌症基因组图谱计划(TCGA) 项目中33种肿瘤类型的9196个肿瘤样本的基因型和基因表达数据,进行了一系列的eQTL分析。一共发现了5606570个可以顺式调控基因表达的cis-eQTLs和231210个可以远程调控基因的trans-eQTLs。

研究发现,eQTL的发现数量随着样本量的增加而增加。由于全基因组eQTL分析需要同时具有多个样本的全基因组基因型数据(一般用芯片获得)和基因表达量数据(一般用测序技术获得),会花费大量经费,因此一般研究样本量都较少。而TCGA中有多个癌症样本量超过400,乳腺癌中样本量达到1092例,因此该研究用美国癌症基因组图谱计划的数据进行分析将有助于eQTL的发现。

另外,作者通过整合eQTLs与临床预后信息和GWAS数据,发现了22212个跟生存相关的eQTLs和337131个跟GWAS位点重合的eQTLs。

pancanQTL数据库概述:(A)pancanQTL四个数据集,包括cis-eQTLs,trans-eQTLs,生存相关的eQTLs和GWAS相关的eQTLs。(B)PancanQTL的搜索框。(C)cis-eQTLs 数据集中eQTL示意图。(D)与生存时间相关的eQTL Kaplan-Meier plot示意图。图片来源:Nucleic Acids Research

数据库平台pancanQTL提供免费查询

为了促进研究成果的利用,作者构建了数据库平台pancanQTLhttp://bioinfo.life.hust.edu.cn/PancanQTL),供其他研究者免费查询、浏览。该pancanQTL数据库上线一个月,即有来自13个国家近500次的数据访问。

该研究为认识不同癌症组织和不同个体中基因变异和基因表达的关联带来了新启示,有助于增强遗传变异在肿瘤的发生与发展中发挥的潜在生物学功能的理解,促进遗传和癌症相关研究领域的发展。

参考资料

PancanQTL: systematic identification of cis-eQTLs and trans-eQTLs in 33 cancer types.Nucleic Acids Research, 2017, gkx861 

本网站所有注明“来源:生物探索”的文字、图片和音视频资料,版权均属于生物探索所有,其他平台转载需得到授权。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(editor@biodiscover.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。