压缩算法为大语言模型“瘦身”
据美国科学促进会旗下网站11月19日报道,瘦身美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,压缩语能精简大型语言模型(LLM)的算法海量数据,为LLM“瘦身”。模型这项算法不仅有助保护数据隐私、瘦身节约能源、压缩语降低成本,算法还能推动LLM在手机和笔记本电脑上高效使用。模型 团队举例称,瘦身当人们使用ChatGPT时,压缩语请求会被发送到OpenAI公司的算法后端服务器进行处理。这一过程不仅成本高昂、模型能耗巨大,瘦身通常还很慢。压缩语如果用户想要使用消费级图形处理单元运行LLM,算法就需要对这些LLM进行压缩。 CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。 虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。 团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。 不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。
- 最近发表
- 随机阅读
-
- 美國總統拜登下令獨立審查特朗普遭槍擊集會
- 台灣的「生活工資」該給多少(下):想在台北活得有尊嚴,每個月得花多少錢?
- 瓦格納兵變後續動向一次看:為何俄國離不開傭兵?俄要查西方間諜是否涉入,拜登急澄清
- 日本常見姓氏(上):佐藤原來是「左衛門的藤原」,那高橋是「在高處架起的橋」嗎?
- 样品的采集、制备和保存(三)
- 專任只需9學分、「專案教師」一學期要教16學分,台大、北科、東華都被點名
- 《戒和同修》:人物雙寫的詩歌技藝,生命的遲疑與輕逸盤旋
- 台大地質系團隊發現918地震位移裂縫,證明玉里斷層已活動數千年
- 《食品用透明质酸钠》及其检测方法团体标准专家评审会圆满结束
- 獅子山共和國總統大選:執政黨1%之差避開決選獲勝,選委會遭質疑有造假嫌疑
- 【專訪】2023新點子實驗場藝術家李慈湄、李奧森:emo是換一種聆聽與敘事方式,打開觀眾的想像
- 進擊的巨人:噁心的我與噁心的你
- 外交部發言人毛寧回應「拜登退選」:是美國內政 不作評論
- 健保部分負擔新制7月上路:醫院慢箋首次調劑需收取部分負擔,醫院急診將依層級別定額收費
- 《認同而不出櫃》:中國傳統觀念束縛同性戀者,為了盡孝「自然而然地」進入同直婚
- 日本老牌魚店推出冷凍握壽司,「液體凍眠」技術讓壽司半年後依然鮮美可口
- 美國16歲女孩遭警察擊斃 當地已發生多起涉警方槍擊事件
- 歐盟提「經濟安全戰略」方案,將管制先進半導體、量子電腦、AI科技輸出,劍指中國
- 第七十三屆柏林影展,入圍作品觀映筆記(二):競賽單元與論壇單元
- 【專訪】HUSH《娛樂自己》:置身於孤獨才能感受到自身之外,人生就不會無趣
- 搜索
-
- 友情链接
-