Facebook 帖子可以预测疾病和心理健康状况
- 仅通过 Facebook 帖子就可以预测糖尿病、抑郁症、焦虑症和精神病等疾病。
- 与基因组信息一样,社交媒体内容能够个性化医疗保健。
超过 20 亿人在社交媒体平台上分享他们日常生活的信息,通常会透露他们的个性、情感和人口统计数据。预计到 2021 年,这一数字将超过 30 亿[每月活跃社交媒体用户],约占总人口的 1/3。
此类信息包含人口层面的有用健康信号。最近,宾夕法尼亚医学院和石溪大学的研究人员将患者的电子病历 (EMR) 与他们的社交媒体数据联系起来,以识别某些疾病标志物。
研究团队包括 999 名同意分享他们的医疗记录和社交媒体信息的患者。他们分析了大约 949,000 个包含超过 2000 万个单词的 Facebook 状态更新。每个参与者的帖子至少包含 500 字。
研究人员使用自然语言处理——人工智能的一个子领域——关注人类(自然)和计算机语言之间的交互——将每个参与者的语言编码为 700 维患者语言编码。
然后,他们根据样本内的患病率和 Elixhauser 合并症指数将参与者 EMR 的诊断分为 21 组。
换句话说,研究人员分析了 [Facebook 帖子的] 语言模式——单词、句子、一堆相关单词——以及它们与 21 个标准 EMR 诊断类别的联系。
总体而言,他们使用了三个模型来检查对患者的预测能力——
- 第一个模型分析了 Facebook 帖子的语言
- 第二个使用了性别和年龄等人口统计数据。
- 第三个模型合并了两个数据集。
参考:PLOS ONE | DOI:10.1371/journal.pone.0215476 |石溪大学
结果
Facebook 内容大大提高了预测 21 种疾病类别中的 18 种的准确性。事实证明,它在预测糖尿病、怀孕、抑郁、焦虑、精神病和其他心理健康状况方面非常有效。
事实上,与传统的人口统计因素(性别、年龄和种族)相比,Facebook 帖子更有效地预测了 10 个类别。
与编码的社交媒体语言相关联的医学诊断可作为筛查工具,用于阐明疾病流行病学。
与基因组信息一样,社交媒体内容能够个性化医疗保健。通过检查多种疾病,研究人员可以更好地了解这些疾病之间的关系,从而为医学人工智能提供新的应用。
阅读:科学家发现并修复阿尔茨海默病的遗传风险因素
为了进一步改进结果,未来的研究可以比较不同人口群体的患者和 Twitter 等其他平台上披露的健康相关数据的差异。
工业技术