关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2725人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

诺奖化学奖一得主是巴勒斯坦难民 家中8个兄弟姐妹

扬子晚报 浏览 19361

“精准”归来:戴尔正式宣布推出"Pro Precision"工作站产品线

IT之家 浏览 603

49 岁马伊琍公布喜讯,终于等到这一天

动物奇奇怪怪 浏览 2571

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 2886

哔哩哔哩CEO陈睿:优质创作者是社会的财富丨2025世界互联网大会

红星资本局 浏览 2511

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 2614

上海97-77大胜浙江,李弘权18分,吴前15分,兰道夫27+5

懂球帝 浏览 2013

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者 浏览 2726

网红嘴哥捐款10万元驰援李亚鹏

娱慧 浏览 1694

票房从57.7亿跌到1.28亿,我感慨:这块金字招牌算是砸了

靠谱电影君 浏览 2257

丫邦组合与凤凰组合会师决赛

体坛周报 浏览 3277

全新A6L领衔 一汽奥迪2026年新车预览

网易汽车 浏览 1017

扫码即飞!西安街头现身共享无人机

环球网资讯 浏览 2518

国电高科新专利可提高卫星设备的工作可靠性

财闻 浏览 569

发现新疆戈壁"为人民服务"标语遭破坏 博主决定去修复

极目新闻 浏览 8276

【中超】埃杜加西亚梅开二度 9人深圳客场2比1三镇

体坛周报 浏览 2671

俄"默许"朱拉尼相关提案 中国在联合国动用一票否决权

梁讯 浏览 13440

SEMA改装展亮相 凯美瑞GT-S概念车官图发布

车质网 浏览 2676

埃迪-豪联赛对前东家伯恩茅斯7场不胜,并列英超最长纪录

懂球帝 浏览 3565

梁靖崑2-3张本智和!决胜局被逆转太保守!男团0-1落后日本!

篮球资讯达人 浏览 2910

接近量产状态 小米YU7 GT再次现身纽北赛道

车质网 浏览 2439
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1