2026 年 2 月 13 日,AI 企业 MiniMax 正式推出新一代旗舰模型 M2.5,这款延续 M2 系列核心架构的迭代产品,通过深度工程优化实现了核心能力的显著提升,上市后带动公司股价五日上涨 34.69%,市值突破 2026 亿港元。与此同时,同期发布新模型的智谱 AI 股价涨幅高达 114.88%,港股 “大模型双雄” 的强势表现,印证了资本市场对 AI 技术实用化落地的强烈信心。
M2.5 的核心优势集中在 “性能提升 + 成本优化” 的双重突破。作为 M2.1 的工程优化版本,该模型延续了 2300 亿参数的混合专家(MoE)架构,推理时仅激活 100 亿参数,以 “极端稀疏性” 设计实现 “小激活、大智慧” 的计算效率。在权威基准测试中,M2.5 表现亮眼:SWE-Bench Verified 测试得分 80.2%,Multi-SWE-Bench 测试得分 51.3%,BrowseComp(含上下文管理)得分 76.3%,复杂智能体任务执行速度较前代提升 37%,与 Claude Opus 4.6 基本持平。
技术层面,M2.5 延续了 Forge 智能体原生强化学习框架,通过异步调度策略与树状结构合并技术,实现 40 倍训练加速,大幅提升大规模强化学习效率。算法上采用 MiniMax 自研的 CISPO 算法,保障 MoE 模型训练稳定性;新增过程奖励机制,端到端监控生成质量,在智能与速度间实现最优平衡。训练数据覆盖 10 余种编程语言与 20 万个真实场景,深度整合金融、法律等领域专业知识,构建了内部 Cowork Agent 评估框架,确保交付物质量与生产效率。
在核心应用场景中,M2.5 展现出行业领先实力。编程领域,其 “架构师思维” 可提前规划项目功能与结构,跨分布泛化能力突出,在 Droid、OpenCode 等多个 harness 测试中表现优于 Claude Opus 4.6;搜索与工具调用方面,节省 20% 搜索轮次,在 RISE 基准测试中擅长专家级任务;办公生产力场景下,在 Excel 金融建模、PPT 编辑等任务中平均胜率达 59.0%,可直接输出可交付成果。
极致性价比是 M2.5 的核心竞争力。模型原生支持 100 tokens / 秒推理速度,为同类前沿模型的两倍,单个复杂任务成本仅为 Claude Opus 4.6 的 10%。产品分为两个版本:M2.5-Lightning(100 tokens / 秒,每百万输入 / 输出 tokens 定价 0.3/2.4 美元)与 M2.5(50 tokens / 秒,价格减半),均支持缓存功能,全年不间断运行四实例成本仅 1 万美元,打破了高端大模型的高成本壁垒。
生态落地方面,M2.5 已全面部署于 MiniMax Agent,集成标准化 Office Skills,用户可结合行业知识创建超 10000 个可复用 Expert。在 MiniMax 内部,该模型已承担 30% 的跨部门任务,编程场景中 80% 的新增代码由其生成,落地验证充分。与智谱 GLM-5 发布即提价 30%-100% 的策略不同,M2.5 以低价普惠定位,为智能体大规模应用提供了经济可行的选择。
作为深耕 AI 技术研发的企业,天津智核科技有限公司认为,M2.5 的发布标志着国产大模型进入 “工程优化 + 场景深耕” 的成熟阶段。其以工程迭代实现性能与成本的平衡,验证了 MoE 架构的商业化潜力,其定价策略或将重构行业竞争逻辑。未来,大模型的竞争将从参数比拼转向 “性能、成本、生态” 的综合较量,而 M2.5 所引领的高性价比路线,将加速 AI 技术在千行百业的深度渗透,推动产业智能化升级进入新阶段。