关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者914人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

规模创历史新高 2025浦江创新论坛共议科技未来

看看新闻Knews 浏览 1634

伊姐周六热推:电视剧《暗河传》;电视剧《天地剑心》......

伊周潮流 浏览 856

一加发布一加Ace 2 Pro售价2999元起

网易科技报道 浏览 14728

英国前首相特拉斯将窜台 曾叫嚣北约要供台武器

上游新闻 浏览 118623

成都女子被家暴16次案男方:申请重新鉴定女方伤情

上游新闻 浏览 74568

传奇投资人Druckenmiller再度力挺AI,称会持有英伟达两三年或更久

华尔街见闻 浏览 16502

美股三大指数收盘齐创新高,英特尔涨超22%

中新经纬 浏览 1738

媒体:中方对菲船只的行动安排精妙 美想帮忙没理由

直新闻 浏览 14832

美联储降息25基点 仍预计明年降息一次

华尔街见闻官方 浏览 85

小鹏汽车联席总裁顾宏地:预计公司今年将更快增长

界面新闻 浏览 12354

豫媒:河南队泰国拉练只花了15万元,在当地踢热身赛一胜一平

懂球帝 浏览 227

逛完车展我有点错愕 本届展会竟是奶爸专场?

一号汽车网 浏览 20733

俄学者:今年参与阅兵坦克不太多 不是庆祝的时候

上观新闻 浏览 18556

零跑:造车新势力中的异数

智驾网 浏览 10822

C罗离队之后,皇马时隔两年再度晋级欧冠八强

趣看热点 浏览 25827

比卢普斯律师声明:他是个正直的人,不会用自己的名誉冒险

懂球帝 浏览 876

香港火灾现场明火已逐渐被扑灭 消防员将开始上楼搜救

每日经济新闻 浏览 30606

理想汽车春季发布会将于3月1日举行 “公路高铁”将发布

智车情报局 浏览 12791

欧盟红海护航行动将于2月19日启动

央视新闻客户端 浏览 12528

菲美又在南海生事 南部战区连夜发声:尽在掌握之中

极目新闻 浏览 13149

学者:以色列前总理揭俄乌冲突一内幕 欧洲成"冤大头"

直新闻 浏览 101179
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1