关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2579人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊媒发布小学被炸瞬间 战斧导弹从天而降

潇湘晨报 浏览 631

消息称小米汽车部分门店将开放端到端辅助驾驶体验

IT之家 浏览 2511

E句话| 恭喜,他们生三娃了!

仙女事件簿 浏览 2633

还在磨合纽卡夏窗花近2.8亿欧,英超开局仅1胜3平1负排第13

直播吧 浏览 3461

消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

IT之家 浏览 1487

辽宁舰正常演训 日本为何炒作所谓“雷达照射”问题

澎湃新闻 浏览 2128

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 2778

曝尊界明年将推6款新车 超豪汽车市场要变天了?

正在说车 浏览 1768

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 940

小S二女儿疑曝出恋情,在墨尔本和一男子游玩

小徐讲八卦 浏览 1527

恩里克:我们在23分钟内丢了3个球?那是对手球员的实力所致

懂球帝 浏览 2858

丹麦国防部:若美国武力夺岛 丹麦士兵可先开枪再请示

环球网资讯 浏览 12000

工银安盛迎来准80后总精算师,总经理尚未正式就任

财经众议院 浏览 1721

终于来了!山东签约新大外弥补内线隐患,但陈培东感冒将缺席一场

篮球资讯达人 浏览 1689

拉什福德社媒鼓励球队:这是马拉松不是短跑,我们会继续战斗

懂球帝 浏览 2613

里尔老板:乔纳森不是典型9号球员,预料到他会遇到一些困难

懂球帝 浏览 2512

E句话| 女星放弃抢救病危丈夫,儿子当场质问?

仙女事件簿 浏览 1447

鲁媒:苏超决赛变成青训对决,别被所谓“草根”赛事蒙蔽双眼

懂球帝 浏览 2709

特朗普:我100%会加税 欧洲等着吧

澎湃新闻 浏览 10665

宝藏BOSS冯擎峰:是CTO,也是CEO

网易汽车 浏览 2552

存强制退市风险 *ST长药涉嫌财务造假遭立案

北京商报 浏览 2513
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1