输入关键词开始搜索文章、分类或标签

MofCloud Article
MofCloud 15 Dec, 2025 FinOps

从 Bessemer 的《AI 状况报告》中能学到什么:未来 12 个月的 FinOps 实战手册

从 Bessemer 的《AI 状况报告》中能学到什么:未来 12 个月的 FinOps 实战手册。

从 Bessemer 的《AI 状况报告》中能学到什么:未来 12 个月的 FinOps 实战手册

AI 已经不再是“可选项”。它就是新的云——更快、更响、更贵(如果你不控制的话)。Bessemer 风投最新的报告把这一点讲得非常清楚:AI 已经成为云软件的重力中心,并且以一种会惩罚薄弱单位经济性的速度在扩张。——Bessemer Venture Partners

下面是给非风投出身的人一句话翻译:

  • 上一波云浪潮用了好几年才重塑预算结构。
  • 这一波 AI 浪潮用几个季度就能做到。Bessemer 报告显示,有的 AI 公司在大约 18 个月内就达到了 ~1 亿美元的年经常性收入(ARR);即便是那些增长更稳健的公司,也在 4 年内达到这一水平。而以往顶级云公司通常需要大约 7 年。这就是你现在预算时要面对的加速现实。——Bessemer Venture Partners

那么——FinOps 和工程领导到底应该怎么应对?这里有五个教训。


1) 把 AI 当作一级工作负载,而不是“顺手加的功能”

我们看到的最大误区是:试图把 AI 硬套进旧的云成本模型里。别这么做。
现在真正的成本驱动因素已经变成了:Token、上下文长度、工具调用、Agent Step、评测运行、编排重试
如果你不去衡量它们,它们就会直接吞掉你的利润。

该怎么做

  • 按工作流追踪指标
    • CPT(每千 Token 成本)
    • CPR(每次成功请求成本)
    • CPAM(每 Agent 分钟成本)
  • 从“账号级毛利”转向“工作流级毛利”,作为核心运营指标。
  • 像管理 CPU 和 出网流量一样管理 AI
    对 Token 数、上下文长度、重试次数、工具调用深度设预算。

为什么这和 Bessemer 的结论一致

Bessemer 把 AI 公司的增长分成了“冲刺型(Blitz)”和“可持续型(Durable)”。
可持续型同样能很快做到 1 亿美元 ARR —— 但前提是真正有利润
你的工作,就是让公司站在这一侧。——Bessemer Venture Partners


2) 浏览器正在变成 AI 运行时态,也正在变成新的成本中心

Bessemer 指出了一个关键变化:浏览器将成为 Agentic AI 的主要交互入口
这意味着:长时间运行的会话、跨标签页推理、工具链调用、自动化循环——
这些看起来“人畜无害”的行为,实际上会在账单上疯狂打印数字。

现在不加控制,之后一定会为此买单。——Bessemer Venture Partners

该怎么做

  • 按 Agent 分钟、按执行动作做预算,而不是只看请求次数。
  • 通过策略限制复杂度
    • 单任务最大步骤数
    • 递归深度
    • 最大上下文长度
  • 给每个会话打标签:团队 / 功能 / 客户 / 工作流,
    确保 Showback 能准确落到责任人头上。

3) 评测(Evals)和行为溯源(Lineage)不是“加分项”,而是 COGS

公开基准并不能反映你真实的业务工作流。
Bessemer 认为:私有、可落地、可信的评测,会成为 AI 上线前的硬性门槛。
而这些工作是要花钱的——
如果你不把它们算进成本,就一定会产品定价偏低、预算持续失控。——Bessemer Venture Partners

该怎么做

  • 给每套评测体系设定月度成本额度,并跟踪
    每提升 1 分质量所付出的成本
  • 上线前通过“双重门槛”
    • 质量评分达到最低要求
    • 单位成本(CPT / CPR)不超过上限
  • 像管理可用性 SLO 一样管理数据血缘和漂移
    如果你无法证明模型行为稳定可信,就不要推到生产环境。

4) 增长还是可持续性 —— 有意识地选择毛利

Bessemer 总结了两种典型路径:

  • 冲刺式增长(Blitz)
    大约 1.5 年做到 ~1 亿美元 ARR,但往往伴随脆弱的留存率,以及很薄、甚至为负的毛利。
  • 可持续增长(Durable)
    大约 4 年做到 ~1 亿美元 ARR,同时保持 约 60% 的毛利率

你要先决定:你想成为什么样的公司,然后再让定价、路由策略和长期承诺与这个选择保持一致。——Bessemer Venture Partners

该怎么做

  • 建立一套“价格阶梯”的调用路径
    快且便宜 / 标准 / 高质量 / 重工具 / 视频 等不同档位。
  • 自动路由到最低成本、但能满足质量要求的路径
    当质量差异不大时,默认向下切换成本档位
  • 基于可量化单位谈承诺(Token、步骤数、分钟、GB):
    与模型和 GPU 供应商谈 commit,同时设置利用率护栏,避免“买了用不完”。

5) 整合浪潮即将到来 —— 在并购发生前,先统一你的成本视图

Bessemer 预计,传统巨头会通过并购“买入”AI 能力
翻译成大白话就是:在变简单之前,你的技术栈只会先变得更复杂

要想在并购 Day-1 活下来,你需要的不是更多报表,而是一套统一的成本账本
能在不同模型厂商、推理网关和 GPU 集群之间,把计量单位拉到同一标准。——Bessemer Venture Partners

该怎么做

  • 把所有消耗统一进一个成本账本
    Token 输入/输出、步骤数、Agent 分钟、存储、出网流量。
  • 按团队、按工作流做 Showback,让责任归属一目了然。
  • 用这套账本证明整合后的 ROI
    并据此与更少的供应商谈 阶梯式量价优惠

面向成长型公司 vs 成熟型企业

如果你是一家成长型公司

  • 速度是你的武器,但它会成倍放大糟糕的单位经济。
  • 第 1 周就把监控打起来,别等规模上来。
  • 对 Token、步骤数、上下文长度设硬性上限
  • 只为你能证明的成本定价,别靠感觉。

如果你是一家成熟型企业

  • 你本来就有一套复杂的治理体系,把它自然扩展到 AI
    • 评测门槛(Eval Gates)
    • 行为溯源
    • 工作流级别的毛利
  • 要有心理预期:AI 重塑预算结构的速度,
    会和你经历过的任何一次平台级变革一样快——
    甚至比上一轮云计算还要快。现在就开始规划。——Bessemer Venture Partners

总结(Bottom Line)

Bessemer 想表达的不是“都去当创业公司”,
而是一句话:AI 是新的云,但速度是 2~5 倍

如果 AI 已经进入你的产品,
那么 FinOps 就不再是后台职能,而是你的商业模式本身

现在就把这套能力建起来,
否则当用户规模真正起飞时,你会眼睁睁看着毛利蒸发。——Bessemer Venture Partners


联系我们

有任何云成本管理的需求或问题?欢迎通过以下方式联系我们!

公众号

Mofcloud 微信公众号二维码

企业微信客服

Mofcloud 企业微信客服二维码

业务咨询

contact@mofcloud.com

技术社区

mofcloud/issuer

地址

北京市海淀区自主创新大厦 5层

Article Tags
Recommended Reading

推荐阅读

从相近主题中继续阅读,延伸这篇文章涉及的技术背景与实践视角。

AWS 成本管理的五大最佳实践
FinOps 12 Nov, 2024
Related Insight

AWS 成本管理的五大最佳实践

如果您是 AWS 用户,您可能希望优化您的 AWS 成本管理策略。挑战在于,随着公司的发展,工作量也会增加。每增加一个工作量,成本就会相应增加。由于工作量众多,管理成本很困难,尤其是当您拥有多个 AWS 账户时。 因此,企业通常会选择使

M

MofCloud

AI / Cloud / FinOps

阅读文章
云成本管理面临哪些常见挑战?
FinOps 12 Nov, 2024
Related Insight

云成本管理面临哪些常见挑战?

如果您没有有效的云成本管理计划,管理云数据成本可能会是一件复杂的事情。随着远程和混合工作模式的兴起,越来越多的企业将工作负载迁移到云平台,以提供无缝的数据访问。然而,这种迁移也带来了云成本管理的挑战。 云成本的主要组成部分包括: -

M

MofCloud

AI / Cloud / FinOps

阅读文章
针对 SaaS 的三个关键云成本管理技巧
FinOps 12 Nov, 2024
Related Insight

针对 SaaS 的三个关键云成本管理技巧

在云计算环境中,云成本因多种因素不断攀升,因此 云成本管理 变得至关重要。通过有效的管理策略,您可以优化软件应用程序、虚拟机和存储等资源的使用,从而降低运营支出。 根据 Statista 的一项研究,超过 40% 的受访者认为

M

MofCloud

AI / Cloud / FinOps

阅读文章