压缩算法为大语言模型“瘦身”
据美国科学促进会旗下网站11月19日报道,瘦身美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,压缩语能精简大型语言模型(LLM)的算法海量数据,为LLM“瘦身”。模型这项算法不仅有助保护数据隐私、瘦身节约能源、压缩语降低成本,算法还能推动LLM在手机和笔记本电脑上高效使用。模型 团队举例称,瘦身当人们使用ChatGPT时,压缩语请求会被发送到OpenAI公司的算法后端服务器进行处理。这一过程不仅成本高昂、模型能耗巨大,瘦身通常还很慢。压缩语如果用户想要使用消费级图形处理单元运行LLM,算法就需要对这些LLM进行压缩。 CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。 虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。 团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。 不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 东坡社区开展腊八节志愿服务活动_
- 买冰箱什么品牌最好最实用(世界顶级冰箱品牌有哪些)
- 教程知识:xbox控制台打不开解决方法
- 教程知识:盗贼之海win7是否能玩详情
- “天长好人”捐资装路灯 点亮乡村幸福“夜色”_
- 教程知识:win102004关机变重启解决方法
- Python3.10终于添加了一些急需的功能
- 空调三级能效的含义是什么(空调一二三级能效表示什么意思)
- 千秋街道:依法维护权益 共筑满意消费_
- 华为荣耀play5系历年几月上市时间(荣耀Play5上市时间是什么时候)
- 民生信用卡积分如何全额兑换(民生信用卡如何获得积分)
- Yubico发布带有指纹识别器的安全密钥
- 人身险预定利率上限9月或存调整窗口
- Chandrayaan
- 小狗吸尘器d9007拆解图(小狗D
- 金立w900s如何给信息加密(金立W900s该机系统内置加密功能吗)
- 赚麻了!四大发电央企2024年狂揽301亿元,分红规模超111亿元
- 三星的浏览器现在可用于其WearOS智能手表
- AppleWatch7的快速充电仅适用于一根特定的电缆
- 诺基亚c6刚出来价格(诺基亚c6价格是多少)
- 搜索
-
- 友情链接
-