关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者43人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥斯卡社媒发文:重要的客场拿分

直播吧 浏览 15039

NASA局长给申请研究月球样品开绿灯:必须通过审查

观察者网 浏览 62130

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 18543

张小斐、金泰梨、长泽雅美都剪短发了,有的翻车有的惊艳,哪款最值得借鉴?

黎贝卡的异想世界 浏览 11066

Vogue这一夜太抓马了

细语 浏览 357

内塔尼亚胡:以色列将不得不做出"痛苦且重大"让步

环球网资讯 浏览 1244

悲喜交加,葛优出演了一部载入史册的佳作!

幕味儿 浏览 396

申花保住中超颜面!跃居东亚第5,打破首尔不败纪录,连破2魔咒

奥拜尔 浏览 403

深夜突发!碧桂园彻底摊牌,遇到成立以来最大危机

易简财经 浏览 14311

小米YU7交付量突破4万台 推出高端定制服务

网易汽车 浏览 1005

巴以冲突两周年 加沙“仿佛已从地图上被抹去”

环球网资讯 浏览 591

中国海警驱离侵闯黄岩岛近海菲海警船

界面新闻 浏览 11839

媒体:中美元首会晤让赖清德坐立不宁、寝食难安

环球时报新闻 浏览 11182

颧骨突出就会显老显凶?做到这2点就能高级有气质

小陈聊搭配 浏览 14564

拒绝被逆转,曼联本赛季英超领先后保持不败

懂球帝 浏览 112

不愧是舒淇,好“生猛”的一部剧

时尚COSMO 浏览 569

马刺加时134-130爵士取季前赛3连胜,文班22+7,贝利20+7

懂球帝 浏览 587

软银清仓英伟达,孙正义套现415亿

YOUNG财经 浏览 36

还记得这个名场面吗?科林斯断头台砸扣MVP恩比德

直播吧 浏览 14775

美军新锐舰队为应对中国大举集结 集结地却远在夏威夷

枢密院十号 浏览 4965

沙尘天气19日或杀回马枪,北京等多地将再次受到影响

趣看热点 浏览 614301
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1