U乐国际(中国)·集团 - AI告诉你的新闻，可能一半都是错的…

越来越多的人开端用谈天机器人（也便是现在狭义上的AI）来获取新闻。

在这些形色各异的谈天框中，人们往往只需要输入一句问题，就能马上得到一段口气天然、逻辑完好的答复。但这儿，一个问题也在不断显现：所以，AI说得对么？

近来，BBC与欧洲播送联盟（EBU）发布的一份联合研讨

陈说

给出了警示性的定论：这或许不太行。

据介绍，这项研讨邀请了来自18个国家、14种言语的22家公共媒体安排，对ChatGPT、Copilot、Gemini和Perplexity四款干流AI帮手进行了体系评价。记者们提出了实在的新闻问题，从“谁是现任教宗”到“美国为什么轰炸也门”，然后逐个检查AI的答复。成果显现，45%的答复存在严峻过错，而如果把纤细问题也算上，犯错份额高达81%。

研讨指出，最遍及的过错呈现在信息来历上。约三分之一的答复存在严峻的引证问题——要么供给了与内容无关的来历，要么给出过错链接，乃至直接假造出处。Google的Gemini在这方面体现最差，72%的答复在来历上呈现显着过错；ChatGPT的问题率为24%，Copilot和Perplexity则为15%。有的AI会把虚拟的链接伪装成新闻网站地址，有的则在引证公共媒体时破绽百出，把他人宣布的观念当作新闻安排的情绪。

除了无关引证，AI也常常生成过错的引语、混杂现实与观念、误用挖苦内容。Gemini曾在答复“马斯克是否做了纳粹还礼”时引证法国播送电台的一个挖苦节目，误把诙谐片段当作现实，还添加了不雅观遣词。此外，它在引证“Radio France”的说法时，却链接到英国《每日电讯报》的视频。而在触及宗教与政治人物的发问中，AI的时刻紊乱尤为常见。BBC的测验发现，本年5月，多款AI仍答复“现任教宗是方济各”，却一起注明他已于四月逝世；在其他问题中，它们也频频混杂现任与上一任领导人，将德国总理、北约秘书长等职位搞错。

BBC以为，这些问题并非偶然。比较半年前的初度测验，AI答复质量的确有所改善，严峻过错份额从51%下降到37%，但仍远未到达牢靠水准。尤其在非英语环境下，问题更为严峻——英文答复往往顺便可验证的实在来历，而其他言语中，AI不只引证紊乱，更简单省掉布景信息、缺少语境阐明。

更令人担忧的，是用户信任的增长速度。BBC与Ipsos的查询显现，约三分之一的英国成年人、以及近一半35岁以下用户信任AI可以精确地总结新闻内容。更杂乱的是，当AI犯错时，42%的受访者会一起质疑AI和新闻安排自身的可信度。换言之，即便过错来自AI，人们也倾向于以为“媒体不谨慎”。这意味着，新闻安排的公信力正被一种它们无法控制的体系悄然耗费。

当然，这样的信任也离不开AI的自傲。正如咱们所感受到的那样，简直全部AI帮手都会用坚决的口吻陈说信息，即便它们并不确认，也不会阐明“我不清楚”或“这条音讯未被证明”。剖析称，这种“过度自傲”是AI练习方法的成果：言语模型被奖赏输出确认性的答案，而不是表达不确认性。关于普通用户而言，这种口气反而更简单让人服气。

但也正是在这样的布景下，AI正在敏捷进入人们的日常日子。无论是查找引擎里的摘要答案、工作软件中的智能帮手，仍是交际渠道上主动生成的新闻提要，它们都在改动人们与信息的联系。曩昔，人们经过新闻安排阅览事情；现在，他们经过AI阅览新闻。AI成为了“中间层”，担任挑选、安排、归纳，乃至在必定程度上决议了“哪些内容值得被看到”。这种便当正在带来一种新的依靠——当答案总能马上呈现时，人们也就更少去诘问它从哪里来。

这些问题也不只仅是新闻职业的烦恼。跟着AI帮手被整合进查找、学习、医疗和交际场景中，越来越多的人开端依靠它们来了解国际。AI的每一次“总结”，都在代替一次考虑；每一次生成的“观念”，都或许含糊现实与态度的界限。它让信息更简单被触达，也让判别变得更难。

或许，最值得重视的不是AI偶然犯错，而是这种依靠正在构成的速度。人们正在习气向机器发问，而不是去寻觅原始的答案。当全部信息都以AI的口吻被复述时，新闻自身也开端失掉鸿沟，而这其间的剧本也将终究变成：不是AI说错了什么，而是咱们开端习气不去分辩真与假。

新闻详情

AI告诉你的新闻，可能一半都是错的…｜Landing AI