查看: 7|回复: 2

MiniMax M3模型正式发布,1M上下文原生多模态AI能力解析

[复制链接]

445

主题

60

回帖

1955

积分

版主

积分
1955
发表于 昨天 13:24 | 显示全部楼层 |阅读模式
近日,MiniMax正式推出全新M3大模型,这也是国内首个同时集齐前沿Coding能力、1M超长上下文和原生多模态三大核心能力的开源模型,在架构、性能与服务上都带来了不少新突破。

一、自研架构优化,兼顾百万上下文与运行效率

M3模型采用了自研的MSA稀疏注意力架构(MiniMax Sparse Attention),通过两步式的索引与稀疏分支设计,优化了KV分块与算子逻辑,在百万Token上下文场景下,计算量仅为上代模型的1/20,预填充速度提升9倍以上,解码速度提升15倍以上,运行效率比Flash-Sparse-Attention等开源方案提升4倍以上,百万上下文的效果也能近乎持平全注意力机制,既解决了长上下文的算力瓶颈,也保证了内容理解的准确性。

二、核心性能全面升级,多场景能力亮眼

在Coding能力上,M3在SWE-Bench Pro测试中成绩超越GPT-5.5、Gemini 3.1 Pro,接近Opus 4.7水平;SVG-Bench综合得分也优于Opus 4.7,代码生成、调试与优化能力表现突出。
多模态方面,模型原生支持图像、视频输入与电脑桌面操控,在OmniDocBench文档理解测试中的表现强于Gemini 3.1 Pro,图文、视频内容的解析与处理能力进一步提升。
Agent自主能力也是这次的重点升级,M3在面向自主Agent的端到端评测Claw-Eval上获得最高分,实机演示中能自主运行12小时,完整复现ICLR获奖论文的核心实验,还能完成多轮CUDA算子优化,将GPU峰值利用率从7.6%提升至71.3%,为AI自动化任务提供了更强的支持。

三、服务与定价方案,兼顾不同用户需求

针对开发者与企业用户,M3提供了灵活的API定价方案,按上下文长度分为两档,支持thinking(复杂推理)与non-thinking(低延迟)模式切换,同时提供默认与优先通道。限时活动期间,M3 API(≤512K)上线7天内可享5折优惠,用户能用接近M2系列的价格体验新模型能力。
此外,模型还推出了Token Plan订阅服务,不同档位的订阅提供了远高于Claude同类产品的月度Token容量,能满足高频使用用户的需求。

目前MiniMax M3已正式开放相关服务,大家对这款兼具长上下文、多模态与Agent能力的新模型有什么看法,对它的实际应用场景有哪些期待?
upload.webp
upload.webp
万狸温馨提示:理性消费
1.数码选品:先定用途,再比参数,拒绝 “加点钱更好” 的超支诱惑。
2.购车决策:看平台生命周期,算长期使用成本,刚需比潮流更重要。
3.重点提醒:多查真实评价,少信首发噱头,买得对远比买得新划算。
4.交流准则:聊产品讲实际体验,不抬杠不诋毁品牌,友善分享。
5.氛围维护:遇到分歧先理性沟通,不贴“粉黑”标签,温馨交流。
回复

使用道具 举报

445

主题

60

回帖

1955

积分

版主

积分
1955
 楼主| 发表于 昨天 13:25 | 显示全部楼层
这个赛道好安静啊
回复 点赞 踩踩

使用道具 举报

445

主题

60

回帖

1955

积分

版主

积分
1955
 楼主| 发表于 昨天 13:25 | 显示全部楼层
我还是喜欢叫它海螺。😃
回复 点赞 踩踩

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注QQ群
手机版|小黑屋|万狸社区-免费活跃数码论坛,手机/电脑/汽车+旅游美食游戏兴趣社区

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|桂ICP备16003785号

在本版发帖
联系客服
QQ客服返回顶部