新的 DNA 工具可预测身高、骨密度和教育程度
- 一种基于机器学习算法的新工具可以通过查看一个人的遗传密码来预测他的身高。
- 该工具甚至可以说明他的足跟骨密度和他在职业生涯中可能达到的教育水平。
生物体的大部分功能都由它们的 DNA 控制(包括它们如何发育、生存和繁殖)。因此,人们可以利用遗传密码来预测生物的性质。
密歇根州立大学的研究人员首次使用包含数千人信息的数据集,包括他们独特的基因型和特征,开发出一种新工具,可以精确预测人们的身高,甚至可以评估他们患癌症和癌症等危重疾病的风险。心脏病。
该工具适用于机器学习算法,该算法分析基因组以预测不同的人类特征。它可以提供特定于个人的数据,包括他/她的足跟骨密度和他/她可能达到的教育水平。当然,应用程序并不止于此。
训练数据集和验证
你问他们从哪里得到这些数据集?好吧,他们收集了英国近 50 万成年人的完整基因组成,并将这些数据提供给机器学习算法。数据来自国际健康信息资源英国生物银行。
传统的基因检测技术寻找一个人染色体或基因中的特定变异,而该模型考虑了几个基因组变异,并开发了一个基于数万个差异的预测程序。
该算法分析遗传密码和每个人的身高。逐渐地,它从每个人的数据中学习并尝试确定是否存在任何模式。最终,算法变得足够聪明,可以通过查看一个人的基因组来确定他/她的身高。
参考:遗传学 | doi:10.1534/genetics.118.301267 |密歇根州立大学
到目前为止,该算法已经针对 3 个结果(身高、骨密度和可达到的教育水平)进行了验证,现在它可以用于预测与健康风险相关的其他复杂特征,如乳腺癌和糖尿病。
在验证测试中,该模型能够以大约 1 英寸的平均误差预测人的身高。尽管骨密度和教育水平的成就预测指标表现不佳,但它们足够精确,可以检测出患有骨质疏松症(骨密度降低的一种情况)或在学校学习困难的高风险人群。
下一步是什么?
该工具将使医生能够尽快干预患者护理并延迟/预防疾病,推进精准健康的实践。
研究人员计划通过利用更多样化的数据集来提高模型的准确性。这将使医生能够精确绘制疾病风险和关键特征的遗传结构。
阅读:关于 DNA 的 26 个你可能不知道的有趣事实
将来,基因组测试可能会像血型测试一样简单。据研究人员称,这将花费近 50 美元。如果他们获得成功,早期干预将挽救数百万人的生命和数十亿美元的治疗费用。
工业技术