关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者39人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

在新劳资协议的限制下 勇士目前只剩底薪可以使用

直播吧 浏览 14893

帕普·戈麦斯即将复出

体坛周报 浏览 418

"最恨踢假球"的李铁栽了 足坛落马人员被查前屡唱高调

上游新闻 浏览 73939

东阿阿胶急需新舵手

斑马消费 浏览 18726

网络安全AI说丨警惕U盘里的“不速之客”

海外网 浏览 1164

东航MU5735飞行事故调查进展公布

中国民航局网站 浏览 18801

张柏芝与向太的关系彻底崩塌?

涵豆说娱 浏览 954

小鹏汽车联席总裁顾宏地:预计公司今年将更快增长

界面新闻 浏览 11925

谢林汉姆:库尼亚是曼联从平庸到优秀的关键,愿他能保持状态

懂球帝 浏览 156

中公教育董事长直播鞠躬道歉:欠的钱我们一定会还完

21世纪经济报道 浏览 63183

马蒂诺:我们不能只关注门票销售情况,一味让球星不断上场

直播吧 浏览 12272

张一山把烤肠吃涨价是怎么回事?本人回应会找老板聊聊

趣看热点 浏览 26235

波兰外长访乌 泽连斯基称愿与波兰分享实战经验

看看新闻Knews 浏览 1068

瑞银30亿瑞郎拿下瑞信 5万亿美元“巨无霸”诞生了

每日经济新闻 浏览 104317

倪妮新剧旗袍造型好美 中式穿搭永不过时

她读 浏览 19212

8.88万起售 还带8155芯片与L2辅助驾驶

My车轱辘 浏览 1124

追了《夏花》之后,更想去旅行了!

瑞丽网 浏览 18989

不理多国"最后警告" 胡塞武装再在红海引爆炸弹

环球时报国际 浏览 12355

油头粉面别演穷人!《命悬一生》几个镜头告诉你,真穷人是什么样

娱乐圈笔娱君 浏览 565

华为在台13家品牌店将仅剩一家

爱集微 浏览 15894

56岁陈红颜值回春,参加路演不惧高清镜头,她满脸皱纹依旧美丽

温柔娱公子 浏览 600
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1