关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12388人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

3nm制程M3芯片将上线?消息称苹果或于下半年更新iMac产品

财联社 浏览 19275

世界最大冰山已融化分裂,全球海平面上升或提速

趣看热点 浏览 25203

宁愿净身出户,也要与闫妮离婚的邹伟现状如何?

律便利 浏览 1313

2名以方被扣押人员失联 卡桑旅要求以军暂停空袭24小时

极目新闻 浏览 1478

趁春光大好,赶紧法式一下!

瑞丽网 浏览 19451

五年十代攻关 浙大成功培育高锌水稻“全能选手”

环球网资讯 浏览 969

继詹姆斯续约后,浓眉5年1.9亿续约湖人詹眉继续携手!

趣看热点 浏览 25627

浙江广东会师全运男篮决赛,辽宁四川将争夺铜牌

懂球帝 浏览 620

共和党女议员发表争议言论 认为美国应该"一分为二"

环球时报新闻 浏览 231812

影响中国历史的六大政变:第一个让人惋惜,最后一个让人愤怒

趣看热点 浏览 26153

软件巨头做硬件产品,为什么常失败?

谷仓新国货研究院 浏览 15420

第73集团军某旅装甲分队开展多课目综合训练

极目新闻 浏览 12805

印尼回应"是否加入金砖":正在权衡晋升成员国的好处

环球时报新闻 浏览 73764

“耳环风波”半年后 18岁黄杨钿甜首次发文

现代快报 浏览 5861

64岁麦当娜状况堪忧,橡胶脸明显走路需儿子搀扶

好丹 浏览 14783

香港五级大火令人揪心 一众明星发声

天启大世界 浏览 340

专家:台湾问题解决了 中美关系才会真正正常化

北京日报客户端-长安街知事 浏览 90779

女甲第8轮综述:海南琼中女足8战全胜高居榜首,广州女足1分垫底

直播吧 浏览 16009

闻泰科技营收147亿的半导体资产被荷兰政府冻结

每日经济新闻 浏览 981

能成为下一款“Model 3”? Rivian R2将于3月7日亮相

乐选爱车 浏览 12534

蜜雪冰城开卖啤酒:价格5.9元至14.9元不等 只能外带

极目新闻 浏览 5024
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1