社交媒体状况协助诊断抑郁症
南方周末 · 2019/01/23
我们在社交媒体上的表现或许会“泄露”抑郁症的迹象,现在机器学习技术和大数据优势正帮助科学家找出抑郁症和语言之间的确切关系。


图片来自于:pixabay

本文转载自“南方周末”。

长期以来,科学家一直试图找出抑郁症和语言之间的确切关系,现在机器学习技术和大数据优势正帮助他们实现这一目标。这项技术也有望在将来作为辅助手段,协助临床医生更早地发现其他神经系统疾病。

我们在社交媒体上的表现或许会“泄露”抑郁症的迹象。美国宾夕法尼亚大学和石溪大学的研究人员发现,利用特定的算法扫描Facebook用户发布的帖子,寻找“眼泪”和“感觉”等抑郁症语言的标记词,就能比医生提前3个月发现用户潜在的心理健康问题,提早做出防范,相关研究成果发表在近期的《美国科学院院报》(PNAS)上。

语言的潜在含义

2018年3月,英国皇家精神科医学院的维扬?理查兹(Veryan Richards)在《柳叶刀-精神病学》(The Lancet Psychiatry)发表的一篇评论文章中,讨论了语言在心理健康护理中的重要性。在心理治疗过程中,心理学家和精神病学家很快就能通过分析病人的语言模式来诊断包括自闭症、抑郁症和躁狂症在内的精神疾病。理查兹认为,语言具有强大的影响力,因此,应该更加努力地去使用语言来挖掘潜在的心理健康问题。

使用社交媒体的人会在媒体平台上透露许多个人信息。很多时候,这是有目的而为之的,因为用户可以分享他们的生活状态和政治观点等。但同时也可能会暴露一些用户自身完全没有意识到的事情,比如心理健康的恶化状况。所以科学家认为在社交媒体广泛使用的年代,一个人在社交媒体上交流方式的细微变化可能会揭示出抑郁症或创伤后应激障碍(PTSD)等心理疾病的发病征兆。

现在许多人将传感器穿在身上,通过监测心率、呼吸来达到预防疾病的目的。科学家们也在考虑人类的语言是否可以用来监测一段时间内的心理活动,从而提前得知几天、几周、几个月甚至是几年后,心理状态的走向。现在,计算机算法似乎正逐渐“进化”出这一功能,科学家正努力进行着将人类的语言风格和模式转化成算法的研究。一种新的心理健康评估手段可能会出现,它是基于客观、定量和自动化的分析我们所说和所写的词汇来实现的。

预测心理状况

长期以来,科学家一直试图找出抑郁症和语言之间的确切关系,现在科技正帮助我们实现这一目标。与疾病的生物或物理标记相比,这是一个未开发的新维度。

2014年,WWBP(世界幸福项目)创始人、宾夕法尼亚大学的约翰内斯·艾什斯塔德(Johannes Eichstaedt)开始思考,社交媒体是否有可能预测用户的心理健康状况,尤其是抑郁症。6年来,在宾夕法尼亚大学积极心理学中心和石溪大学人类语言分析实验室中参与世界幸福项目的研究人员一直在挖掘词语的使用是如何反映人类内心的感受和满足感的问题,他们把社交媒体与健康记录数据相结合,来寻找问题的答案。

这一次,研究人员在筛选志愿者的时候另辟蹊径,他们没有选择那些自称患有抑郁症的参与者,而是招募那些同意分享Facebook状态和电子病历信息的志愿者,从这些数字档案中识别出数据,然后用机器学习技术分析用户的心理状态,进而筛选出真正患有抑郁症的人。有近1200人同意提供这两种数字档案。其中,114人在医疗记录中显示他们曾被诊断患有抑郁症。随后,研究人员将所有被诊断为抑郁症的志愿者与5名没有被诊断为抑郁症的志愿者的数据进行了比对。为了建立这个算法,他们还回顾了524292个Facebook数据,这些数据来自于每个抑郁症患者在被诊断出患有抑郁症前几年的数据,以及对照组在同一时间内的数据。在确定了使用频率最高的单词和短语后,对200个主题进行建模,找出他们所谓的“抑郁相关的语言标记”。最后,比较了参与者使用这种措辞的方式和频率。

艾什斯塔德认为,利用这些数据可以作为一种不引人注目的抑郁诊断筛查形式,同时他们将搜查目标限定在单个词汇而非语句上,这就增加了搜索的范围,具有现实的应用价值。这些发现或许会为发现和帮助抑郁症患者提供了一种潜在的新方法,因为毕竟不是所有人都愿意向心理医生敞开心扉。当然,这项研究还是存在一些局限性,例如样本的地域性、人种的局限性等。

除此之外,2018年年初,《临床心理学》(Clinical Psychological Science)上刊登的一篇文章,同样揭示了一组可以帮助准确预测某人是否患有抑郁症的词汇。英国雷丁大学的研究人员把语言划分为内容和风格两部分。语言的内容指的就是我们陈述的意义或主题。他们发现,那些有抑郁症状的人会使用过多的负面形容词和副词来表达他们的情绪,比如“孤独”“悲伤”或“悲惨”。代词的使用也让人非常讶异,有抑郁症状的人偏向使用的单数形式的第一人称代词(如“我”、“我自己”和“我”),第二人称代词和第三人称代词(如“他们”、“她们”或“她/他”)的使用明显较少。这种代词的使用模式表明,抑郁症患者更关注自己,与他人联系较少。

研究人员认为,代词实际上比消极情绪词更可靠地识别抑郁症状。而语言的风格则是取决于我们如何表达自己。从一开始,心理学家就预测那些患有抑郁症的人对世界的看法会更加黑白分明,所以这会在他们的语言风格中体现出来。在这项研究中,科学家对64个不同的在线心理健康论坛进行了大数据文本分析,调查了6400多名成员。结果发现,绝对主义语词比代词或消极情绪语词更适合作为心理健康论坛的抑郁症标记词。

有效的辅助手段

世界卫生组织估计,全世界超过3亿人患有抑郁症,自2005年以来,这个数字增加了近18%,心理疾病患者往往不愿意吐露自己的心声,对于自闭症、抑郁症以及创伤后应激障碍患者,接受心理治疗的过程有时候并不愉快,所以拥有更多发现和筛选工具是重要的协助手段。

理解抑郁症的语言可以帮助理解抑郁症患者的思维方式,研究人员将自动文本分析与机器学习结合起来,从自然语言文本样本(如博客文章)中对各种心理健康状况进行分类筛选。这种分类已经超过了由训练有素的治疗师做出的分类。重要的是,机器学习的分类还会随着提供更多的数据和开发更复杂的算法而改进。

如今的研究人员拥有强大的算法和大数据集的优势,这是前几代科学家所无法做到的。这两件事给了科学家更多的信心。他们认为,量化精神障碍的各个方面是可能的,而且它们也指向了精神病学以外的应用。这项技术也有望在将来作为有效的辅助手段,协助临床医生更早地发现其他神经系统疾病,如帕金森病、阿尔茨海默病和亨廷顿氏舞蹈症。

所有文章仅代表作者观点,不代表本站立场。如若转载请联系原作者。
查看更多
发表评论 我在frontend\modules\comment\widgets\views\文件夹下面 test