关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2503人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

时隔23年,国米和罗马再次在意甲至少10轮过后同分领跑

懂球帝 浏览 2489

清华大学推出RLinf-VLA:让机器人在虚拟世界中自学成才的新框架

科技行者 浏览 2542

加兰:本希望在场上帮助马竞更多,会找一天回去告别

懂球帝 浏览 1780

首播6集热度高达9100!好评如潮,观众直呼:“看完不敢上厕所”

娱乐圈笔娱君 浏览 2794

支付宝下架首页AQ广告,回应“内斗”传闻,网友:感觉就是一场营销

红星资本局 浏览 2742

不敌王楚钦,松岛辉空:满脑子只有不甘心,混双应该能复仇

懂球帝 浏览 2044

2025造车新势力变局:“鸿零米”改变“蔚小理”格局

21世纪经济报道 浏览 1789

迪亚曼蒂:在广州有卖鳄鱼肉和鳄鱼皮的,简直不可思议

懂球帝 浏览 3340

赵丽颖新剧翻车!热搜宣传是朱媛媛遗作,网友怒斥剧方吃人血馒头

萌神木木 浏览 1745

薛鹤翔:马士基开舱偏低,打乱旺季预期节奏

首席经济学家论坛 浏览 2516

“东风Jeep”要来了?Jeep全球高层到访武汉

网易汽车 浏览 2043

《阿凡达3》第一波真实口碑解禁,国内票价却令人咋舌!

娱乐圈笔娱君 浏览 2041

见好就收?年末基金“攻守战”,基金经理操作不一

券商中国 浏览 2221

网友预约26元深夜上门开锁结果被收1300元 商家回应

潇湘晨报 浏览 7959

沃尔沃中国未来姓沃还是姓吉?

禾颜阅车 浏览 2920

为什么没什么人争论该买油车还是买电车了

路咖汽车 浏览 973

美联储理事沃勒:CEO们称AI将致大量裁员,3月利率决议取决于2月劳动力数据

华尔街见闻官方 浏览 993

真正的独立女性,从不在深夜委屈自己

她刊 浏览 723

从39%到15%,瑞士对美关税协议达成

环球网资讯 浏览 2554

《求是》杂志特约评论员:改善和稳定房地产市场预期

365财经plus 浏览 1831

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 1479
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1