关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位11962人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

经济日报:加大分红回购 激发市场活力

经济日报 浏览 12387

春天还是衬衫叠穿最好看 时髦又高级

小陈聊搭配 浏览 19620

卫宁健康实控人周炜犯单位行贿罪一审获刑一年半,其子被提名为非独董

红星资本局 浏览 52

热巴工作室再发无效声明 评论区大失控

萌神木木 浏览 14843

韩媒曝李俊昊林允儿恋爱,合作新剧前就已交往

网易娱乐 浏览 15686

邮报:利物浦等队密切关注塞门约,伯恩茅斯估价超7500万镑

懂球帝 浏览 395

英前首相为伊拉克战争辩护 宣称比俄对乌行动“正义”

环球网资讯 浏览 116188

错过靳东,嫁给父亲看中的女婿,如今她怎么样了

楠楠自语 浏览 361

斗鱼回应监管进驻:将优化内容审核机制

网易科技报道 浏览 17639

“食安AI博士”智能体首秀进博会!

文汇报 浏览 210

大回血,股票型ETF一周猛增1000亿元!上周两明星产品遭“反噬”,但资金“越跌越买”|ETF规模周报

每经牛眼 浏览 348

世界杯预选赛国足以3-1战胜叙利亚,晋级世界杯亚洲区12强赛

趣看热点 浏览 26249

郑恺苗苗带孩子自驾出游,小姨子随行再惹争议

不八卦会死星人 浏览 15384

降入20万价格区间 曝廉价版特斯拉即将国产

车质网 浏览 591

入秋第一件打底衫!你买这3件,太好看了!

Yuki女人故事 浏览 582

仰望U9将于2月25日上市!售价或超百万,配蝴蝶门

汽车网评 浏览 11910

问界新M5 Ultra全新一轮OTA升级 ADS 4全面上车

网易汽车 浏览 1011

又见天价离婚,冻结上市公司股权34亿!

诗与星空 浏览 551

余承东:华为对赛力斯的投入在增加 不会涉及20万价位以下市场

财联社 浏览 18595

集邦咨询:预估2024年折叠手机出货量约1780万部 占智能手机市场仅1.5%

智通财经 浏览 10423

总投资约 2 亿元,长江首艘光伏发电豪华游轮“美维凯璇”首航

IT之家 浏览 1009
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1