新 AI 可以检测新闻来源是否准确或有政治偏见
- 新的机器学习算法专注于新闻来源,而不仅仅是抓取个人声明,以检测虚假和偏见新闻。
- 对于新的新闻文章,它的准确率高达 70%。
- 只需要 150 个内容即可确定来源是否可信。
社交媒体平台使任何人都可以非常轻松地在互联网上共享和传播信息。这导致了假新闻的泛滥,这些假新闻通常是为了改变人们的情绪和影响政治选举等重大事件,或者通过展示广告来吸引流量和创收。
虽然许多科技巨头正在投入大量资源来构建自己的假新闻检测系统,但麻省理工学院和卡塔尔计算研究所的研究人员认为,检测假新闻的最佳策略是关注新闻来源,而不仅仅是分析个人声明。
使用这种方法,他们开发了一种基于机器学习的新方法,可以确定来源是否值得信赖。基本上,它表征整个新闻媒体,预测报道的真实性。
它如何确定有偏见的新闻?
该系统背后的想法是,如果一个网站以前发布过错误的事实,他们很有可能会再次发布。分析此类网站上的其他内容可以帮助系统首先确定哪些网站可能会这样做。
为了可靠地识别假新闻,人们可以在文章中寻找常见的语言特征,如结构、复杂性和情感。例如,大多数假新闻使用情感、主观和夸张的语言。
在这项研究中,他们对源自
的几个特征进行了实验- 来自目标新闻来源的内容,
- 其 Twitter 帐户和维基百科页面
- 其网址结构
- 它获得的访问者数量
他们从网站媒体偏见/事实核查中收集数据。在人工审核员的帮助下,该网站检查了近 2000 个新闻网站的真实性和偏见,包括热门媒体来源和瘦内容农场。
参考:arXiv:1810.01765 |麻省理工学院
这些数据被输入到机器学习模型中,该模型被开发用于以与人工审查网站相同的方式对来源进行分类。该模型产生了令人印象深刻的结果:对于新的新闻文章,它在确定文章是否具有低、中或高的真实性方面达到了 65% 的准确率,在确定内容是否右倾方面的准确率达到了 70%,左倾,或中等。
图片来源:麻省理工学院
研究人员声称,该系统只需要 150 个内容即可准确判断源网站是否可信。因此,它可以在虚假新闻在互联网上广泛传播之前过滤掉。
下一步是什么?
研究人员目前正在研究该系统,以提高其准确性并使其与传统的事实分析器结合使用。如果系统在特定主题上提供“奇怪或令人困惑”的输出,手动审核平台可以快速检查这些结果并确定应给予不同观点的有效性。
作者还生成了一个开源数据集,其中包含近千个标有准确性和偏差分数的新闻网站。他们还计划推出移动应用程序,帮助人们走出政治泡沫。此外,他们还将尝试训练系统以使用其他语言。他们希望超越右/左偏见,并对与其他地区更相关的其他形式的偏见进行建模。
阅读:一种检测社交网站上虚假 ID 的新通用算法
此类算法可以帮助人们了解虚假网站的外观以及他们倾向于发布的文章类型。
工业技术