关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者652人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梦碎IPO,又一大忽悠炸雷了

投资家 浏览 588

速战速胜!东部战区陆军某旅开展空地协同演练

环球网资讯 浏览 18289

俄外长称俄正与北约和欧洲处于“真正的战争”之中

澎湃新闻 浏览 1499

外国投资者7月美债持仓再创新高,加拿大、中国、印度持仓下降

华尔街见闻官方 浏览 1591

“银发经济”走强 乳企开启新赛道

南方都市报 浏览 12619

这项技术已不被日本卡脖子了!

网易财经 浏览 15957

泽连斯基称俄乌冲突正接近结束 克宫回应乌方矛盾表态

环球网资讯 浏览 875

年度大戏0宣传,却让马东向“金主”折腰?这综艺究竟什么来头?

毒舌电影 浏览 11193

好家伙!《武林外传》姐妹篇开播差评一片,观众差评理由出奇一致

娱乐圈笔娱君 浏览 12870

邀50名大陆学生访台被挡 马英九有意找陆委会主委面谈

环球网资讯 浏览 90314

字节大模型策略:自研加平台

晚点LatePost 浏览 15532

付笛生儿子在欧洲演出!夫妻俩打扮朴素甜蜜约会

盖饭娱乐官方号 浏览 14848

一加Ace 6T官宣:全球首发骁龙8 Gen5

快科技 浏览 539

针织+半裙,秋天最经典搭配,好看又减龄!

LinkFashion 浏览 1982

他靠演反派爆火却对同事女儿一见钟情

张发林 浏览 1545

前特斯拉顶级高管:NACS热潮略有夸张 要警惕充电垄断

财联社 浏览 15306

拍完被雪藏3年,小沈阳新片观众不买账,成本超1亿,预售仅6万

靠谱电影君 浏览 757

2020届名人堂,科比的妻子瓦妮莎代表他进行了演讲

趣看热点 浏览 26073

"网红局长"被嘲丑出圈后画风突变 官方:不必过分解读

封面新闻 浏览 105545

Stein:若错过哈登火箭将全力追范弗里特 狄龙也一直是火箭的目标

直播吧 浏览 15337

美联储官员还谨慎但债市更乐观:欢呼加息周期结束、迎接明年初降息

华尔街见闻官方 浏览 14645
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1