关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者350人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄黑海港口设施遭袭,乌军证实实施火力打击

潇湘晨报 浏览 212

欧洲高颜值王室访华:曾与高中老师结婚 二婚嫁入王室

上游新闻 浏览 12273

网友曝腾讯视频半夜跳转恐怖片,亲历网友:瞬间头皮发麻

Tech星球 浏览 18340

微软CEO纳德拉:全球正在就人工智能形成广泛共识

网易科技报道 浏览 12236

张柏芝扎"便便头"亮相,这是放飞自我?

冯新明说说 浏览 19177

电影《花千骨》官宣定档,陈都灵李程彬领衔主演

网易娱乐 浏览 13607

74岁刘松仁瘦脱相,口齿不清疑中风,坚持丁克晚年凄凉!

缘木不求娱 浏览 11823

别克至境L7:新能源赛道,没有人能靠旧身份活下去

AutoBusiness 浏览 1193

萧亚轩自曝不生娃原因:弟妹已经帮自己生完了

网易娱乐 浏览 14790

15岁女儿被票选为"最好看星二代" 翁虹首度回应

扒圈818 浏览 18509

身段美不美?用腰带说话

YOKA网 浏览 12882

美英空袭胡塞武装:典型的外科手术式打击

环球网资讯 浏览 12522

姚明:中国篮球的大环境是好的;篮协某种程度是要做园艺师

懂球帝 浏览 11841

巴黎时装周刘诗诗美出新高度!越来越好看的关键点原来在这儿!

LinkFashion 浏览 445

星光730灵犀动力获中汽中心高品质混动认证等奖项

网易汽车 浏览 206

一文解读杨振宁的百年人生密码 曾与爱因斯坦做同事

北京日报客户端 浏览 2664

学而思发布学习机新品xPad2 Pro系列,搭载学而思九章大模型

网易科技报道 浏览 12869

事实证明,中年女性穿的贵比扮嫩更重要,这么穿就很提升气质

静儿时尚达人 浏览 10325

余秋雨夫妇手牵手逛街!男方头发花白马兰仍优雅

盖饭娱乐官方号 浏览 16301

科技巨头在讨好英伟达,又想自研AI芯片摆脱英伟达

网易科技报道 浏览 12376

谢孟伟拘留期满被释放,连发两条视频召集粉丝

娱慧 浏览 935
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1