🇨🇳 MiniMax

MiniMax M2.5 Highspeed

MiniMax M2.5 的更高吞吐版本，适合对延迟更敏感的生产场景。

文本图像

价格与参数

输入价格（/百万 tokens）	￥4.20
输出价格（/百万 tokens）	￥16.80
缓存价格（/百万 tokens）	￥0.42
上下文窗口	204,800 tokens
最大输出	16,384 tokens
更新时间	2026-03-12
文档链接	官方文档
价格来源	查看来源

价格说明

这里按 MiniMax 官方按量付费页面展示高吞吐档价格。

站内保留了旧 slug，避免已有链接失效，但展示名已经更新到当前型号口径。

价格入口

适合场景

适合图文问答、视觉理解和需要多模态输入的工作流。

上下文达到 204,800 tokens，足以覆盖大多数企业知识问答和多轮工作流。

成本怎么评估

输入价格为￥4.20/百万 tokens，更适合对质量要求更高的任务。

输出价格为￥16.80/百万 tokens，如果你的任务输出较长，预算要重点关注这一项。

粗略估算时，可以先把“输入 tokens 占比”和“输出 tokens 占比”拆开看，再决定是优先压缩提示词，还是优先控制生成长度。

缓存价格为￥0.42/百万 tokens，当系统提示和重复上下文占比较高时更有价值。

怎么选

如果你需要图文混合输入，可以优先把 MiniMax M2.5 Highspeed 和其他多模态模型放在一起比较。

选择 MiniMax M2.5 Highspeed 时，建议同时看输入价格、输出价格、上下文窗口和供应商生态，不要只看单一单价。

如果你已经在使用 MiniMax 的其他模型，优先比较同供应商的高低配型号，迁移成本通常更低。

不太适合什么场景

如果你的任务以长输出为主，MiniMax M2.5 Highspeed 的输出成本会放大整体预算，适合先和更低输出价模型比较。

快速判断顺序

第一步先确认任务是不是需要多模态输入，避免能力过剩或能力不足。

第二步根据请求结构看成本重心：高频短输入更看输入价，长生成任务更看输出价。

第三步再结合上下文窗口和供应商生态，确认它是否适合落到你的生产链路里。