德睿智药|Frontiers in Medicine论文|基于机器学习开发适用于中国人群的衰老评估指标

2021-11-23 13:31 · 生物探索

最新研究研究使用机器学习(ML)方法建立了一个基于中国中老年人群的生物年龄测量方法,并证明了基于机器学习的生物年龄与疾病发生率及死亡率间存在密切联系。

摘要

近日,德睿智药团队与浙江大学、昆山杜克大学在《Frontiers in Medicine》(影响因子5.1)联合发表论文。该研究使用机器学习(ML)方法建立了一个基于中国中老年人群的生物年龄测量方法,并证明了基于机器学习的生物年龄与疾病发生率及死亡率间存在密切联系,同时发现基于机器学习的生物年龄相较于以往方法具有优势。德睿智药团队负责该研究的建模与数据分析相关工作。

1637646027344221.png

01 研究背景

根据第七次全国人口普查公布的结果,中国60岁及以上人口达2.6亿,占总人口比重已超18%[1]。随着老龄化加剧而来的,是各种疾病发病率的提升。截止2018年底,我国老年人中患有一种以上慢性病的比例高达75%,患病人数接近1.9亿[2]。因此,制定老龄化措施,如尽早识别高危疾病患者,对于应对我国老龄化问题至关重要。

评估患病风险的一个重要指标是个体的衰老程度,生物学年龄(BA),即根据正常机体生理学上和解剖学上的发育状态所推算出来的年龄,被认为是比个体实际年龄更准确的老化指标。近年来,机器学习(ML)在评估BA方面的作用受到越来越广泛的认可,然而大多数研究以欧美人群为主,缺乏对中国人群特异性基于ML的BA指标评估研究。因此,需要进一步验证ML-BA在评估个体衰老程度方面的准确性及在中国人群中的应用价值。

02 基于机器学习的生物学年龄的建立

这项由德睿智药与高校科研团队共同带来的最新研究,旨在应用几种ML算法来开发新的更准确的衰老量度,例如梯度提升回归树、梯度增强机、随机森林、CatBoost、支持向量机和AdaBoost回归器。研究使用的数据源自一项始于2011年的调查——中国健康与养老追踪调查,覆盖全国28个省、150个县/区和450个村庄/城市社区,参与者每隔2年接受1次随访,在6年随访期内共接受了3次随访,报告其基本日常生活活动(BADL)、工具性日常生活活动(IADL)以及上、下肢功能状况。

经过筛选后,这项新研究对9771名年龄在45-85岁之间的参与者数据进行了分析。这些参与者平均年龄为59.1岁(SD = 9.2) ,男性和女性的平均年龄为59.8(SD=9.1)岁和58.5(SD=9.2)岁。其中44.6%的参与者年龄在60岁或60岁以上,53.5%的参与者为女性。研究人员构建了一个二元变量来评估自基线以来6年随访期内的参与者死亡发生率。

研究团队基于19项生物标志物使用表1中的方法进行训练,发现梯度提升回归树表现最佳(表1),于是基于该模型计算了参与者ML-BA。

1637646072995036.png

表1:不同ML模型的平均绝对误差、均方误差、均方根误差和R平方值

03 基于机器学习的生物学年龄的验证

为了验证ML-BA,研究团队通过回归模型确定了ML-BA与疾病发生率和死亡率间的关联,研究团队也建立了经典的基于Klemera Doubal(KD)方法的BA,并比较其与ML-BA和对应结局之间的关联强度。

在与健康的关联方面,ML-BA和KDM-BA均与随访期4年内参与者身体残疾率显著相关,不过相较之下ML-BA的关联度更高。在未调整任何协变量的模型中,参与者的ML-BA每增加1年,BADL、IADL存在障碍的几率均增长6%,上肢、下肢行动障碍的几率分别增长4%和7%(表2)。在与随访期6年内死亡率的相关性方面,ML-BA和KDM-BA均与死亡风险呈正相关,数值每增加一年,死亡率风险分别增加16%和10%。

1637646105998324.png

表2:CA、ML-BA或KDM-BA与残疾率和死亡率的未调整关联

在调整模型中的年龄协变量后,ML-BA和KDM-BA仍然与随访期4年内参与者身体残疾率、6年内死亡率风险显著相关(表3)。ML-BA和KDM-BA每增加一年,参与者的死亡率分别增加7%(OR=1.07,95%CI=1.05,1.09)和5%(OR=1.05,95%CI=1.04,1.07)。

1637646127927367.png

表3:在全样本中调整CA后,ML-BA和KDM-BA与残疾率和死亡率间的关联

04 结论

这项研究建立了首个基于中国人群的ML-BA,并证明该指标可用于预测老年人的残疾和死亡。该结论进一步支持了基于ML计算的BA作为生物老化标志物的潜力,以及在帮助人们对中国普通老年人进行健康风险分级中的作用。今后,ML-BA或可作为评估健康老龄化指标,为我国及其他国家应对老龄化问题提供重要参考。昆山市政府资助了这项研究。

关于德睿智药

德睿智药专注于创新机制药物及难成药靶点药物研发,拥有三个专有技术平台,即一站式AI驱动的药物发现平台Molecule Pro™,分子动力学平台Molecule Dance™及知识图谱平台PharmKG™。公司AI医药解决方案被Deep Pharma Intelligence评为“2018-2020全球最重要的11个AI药物研发突破性成就之一”。目前德睿智药已与多家上市医药公司开展商业合作并得到认可。

原文链接:

1.A machine learning-based aging measure among middle-aged and older Chinese adults: the China Health and Retirement Longitudinal Study