MiniMax M3模型正式发布,1M上下文原生多模态AI能力解析

手机乐园 · 发表于 2026-6-1 13:24:14

近日，MiniMax正式推出全新M3大模型，这也是国内首个同时集齐前沿Coding能力、1M超长上下文和原生多模态三大核心能力的开源模型，在架构、性能与服务上都带来了不少新突破。

一、自研架构优化，兼顾百万上下文与运行效率

M3模型采用了自研的MSA稀疏注意力架构（MiniMax Sparse Attention），通过两步式的索引与稀疏分支设计，优化了KV分块与算子逻辑，在百万Token上下文场景下，计算量仅为上代模型的1/20，预填充速度提升9倍以上，解码速度提升15倍以上，运行效率比Flash-Sparse-Attention等开源方案提升4倍以上，百万上下文的效果也能近乎持平全注意力机制，既解决了长上下文的算力瓶颈，也保证了内容理解的准确性。

二、核心性能全面升级，多场景能力亮眼

在Coding能力上，M3在SWE-Bench Pro测试中成绩超越GPT-5.5、Gemini 3.1 Pro，接近Opus 4.7水平；SVG-Bench综合得分也优于Opus 4.7，代码生成、调试与优化能力表现突出。
多模态方面，模型原生支持图像、视频输入与电脑桌面操控，在OmniDocBench文档理解测试中的表现强于Gemini 3.1 Pro，图文、视频内容的解析与处理能力进一步提升。
Agent自主能力也是这次的重点升级，M3在面向自主Agent的端到端评测Claw-Eval上获得最高分，实机演示中能自主运行12小时，完整复现ICLR获奖论文的核心实验，还能完成多轮CUDA算子优化，将GPU峰值利用率从7.6%提升至71.3%，为AI自动化任务提供了更强的支持。

三、服务与定价方案，兼顾不同用户需求

针对开发者与企业用户，M3提供了灵活的API定价方案，按上下文长度分为两档，支持thinking（复杂推理）与non-thinking（低延迟）模式切换，同时提供默认与优先通道。限时活动期间，M3 API（≤512K）上线7天内可享5折优惠，用户能用接近M2系列的价格体验新模型能力。
此外，模型还推出了Token Plan订阅服务，不同档位的订阅提供了远高于Claude同类产品的月度Token容量，能满足高频使用用户的需求。

目前MiniMax M3已正式开放相关服务，大家对这款兼具长上下文、多模态与Agent能力的新模型有什么看法，对它的实际应用场景有哪些期待？

手机乐园 · 发表于 2026-6-1 13:25:21

这个赛道好安静啊

手机乐园 · 发表于 2026-6-1 13:25:40

我还是喜欢叫它海螺。😃

MiniMax M3模型正式发布,1M上下文原生多模态AI能力解析

相关帖子