关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者592人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2024款ID.3新增车型正式上市 限时优惠价14.2888万元

行车视线 浏览 13093

特斯拉入门级新车谍照曝光 在Model Y旁“小”鸟依人

智车情报局 浏览 12600

向佐让药水哥买保险,向佐和药水哥是在上演大型连续剧吗!

趣看热点 浏览 26046

100年不过时的衣服,长这样

LinkFashion 浏览 16693

今秋最撩的“薄外套+裙子”,谁穿谁美!

Yuki女人故事 浏览 1831

苹果卖不动了?降价史无前例,iPhone 15系列首次跌穿五千大关

上游新闻 浏览 12719

8月24日,世界干了一件大事!

牛弹琴 浏览 14655

李书福呼吁把安全放第一位:多少新能源车企在走入歧途?

钛媒体APP 浏览 16047

借助配饰的力量,穿搭瞬间点睛

瑞丽伊人风尚 浏览 19777

千亿百济神州“王牌抗癌药”又摊上事了?

野马财经 浏览 11346

以色列宣布:将扣押的数百名活动人士驱逐出境

环球时报国际 浏览 1007

德甲身价涨幅榜:奥利塞暴涨3000万第1,阿德耶米、于帕上榜

懂球帝 浏览 997

普林斯:DPOY不仅是个人荣誉 球队表现占比大所以戈贝尔>浓眉

直播吧 浏览 10786

台名嘴:大陆对高市早苗提出抗议的层级越来越高

环球时报新闻 浏览 10582

电池容量竞赛升级?零跑、小米布局80度大电池增程车型

汽车点评AC 浏览 1477

多纳鲁马:曼奇尼和巴洛特利都推荐我来,他们让我更坚定选择

懂球帝 浏览 684

29岁女白领荒野求生半月瘦成"闪电":睡觉时放一把刀

都市快报橙柿互动 浏览 12167

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 843

美议员:乌军改变冲突局面极不可能 将迎"最困难时期"

环球网资讯 浏览 86158

歼20不再藏着掖着:就算看的到也追不上

浏览 10836

王心凌吴克群被偶遇,曾多次合体同游逛街,被扒出多个同款饰品

扒虾侃娱 浏览 375
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1