当前位置：首页 > 百科

解决传统架构记忆瓶颈 MiniMax发布新一代模型

1月15日，解决架构记忆“AI六小虎”之一的传统MiniMax发布并开源了新一代01系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。瓶颈该系列模型使用多项突破性创新，布新以大规模应用线性注意力机制打破了Transformer传统架构的代模记忆瓶颈。

未来，解决架构记忆AI智能体有望成为最重要的传统产品形态，由于智能体处理的瓶颈任务变得越来越复杂，涉及的布新数据量也越来越大，单个智能体的代模记忆以及多个智能体协作间的上下文都会变得越来越长。因此，解决架构记忆长上下文能力与多模态处理能力的传统提升至关重要。

技术上，瓶颈MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的布新级别，受益于此次架构创新，代模该系列模型在处理长输入的时候具有非常高的效率，接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑，MiniMax选择模型参数量为4560亿，其中每次激活459亿，能够高效处理400万token的上下文，将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型，MiniMax-01随着输入长度变长，性能衰减最慢。

值得注意的是，MiniMax还开源了Text-01模型、VL-01模型的完整权重，以便于更多开发者做有价值、突破性的研究。MiniMax方面表示，“我们认为这有可能启发更多长上下文的研究和应用，从而更快促进Agent时代的到来，二是开源也能促使我们努力做更多创新，更高质量地开展后续的模型研发工作。”

上一篇

水中氯化物溶液标准物质：精准标样，助力水质氯化物检测
下一篇

甲醇精馏装置增设先进控制系统作用浅谈

解决传统架构记忆瓶颈 MiniMax发布新一代模型

相关推荐

福建厦门：33家商事主体涉嫌转让营业执照被列入严重违法失信名单

以色列國防軍稱空襲加沙地帶中部多個哈馬斯軍事據點

《细胞》调查“人体胚胎干细胞”论文—新闻—科学网

天下財經週報：降級了，但不要高興太早！｜天下雜誌

水利部、最高检部署整治黄河流域未经批准取水等问题_

天下晨間新聞　疫情升溫，中國受益？｜天下雜誌

解决传统架构记忆瓶颈 MiniMax发布新一代模型

相关推荐

福建厦门：33家商事主体涉嫌转让营业执照被列入严重违法失信名单

以色列國防軍稱空襲加沙地帶中部多個哈馬斯軍事據點

《细胞》调查“人体胚胎干细胞”论文—新闻—科学网

天下財經週報：降級了，但不要高興太早！｜天下雜誌

水利部、最高检部署整治黄河流域未经批准取水等问题_

天下晨間新聞 疫情升溫，中國受益？｜天下雜誌

天下晨間新聞　疫情升溫，中國受益？｜天下雜誌