从 Bessemer 的《AI 状况报告》中能学到什么:未来 12 个月的 FinOps 实战手册
从 Bessemer 的《AI 状况报告》中能学到什么:未来 12 个月的 FinOps 实战手册。
AI 已经不再是“可选项”。它就是新的云——更快、更响、更贵(如果你不控制的话)。Bessemer 风投最新的报告把这一点讲得非常清楚:AI 已经成为云软件的重力中心,并且以一种会惩罚薄弱单位经济性的速度在扩张。——Bessemer Venture Partners
下面是给非风投出身的人一句话翻译:
- 上一波云浪潮用了好几年才重塑预算结构。
- 这一波 AI 浪潮用几个季度就能做到。Bessemer 报告显示,有的 AI 公司在大约 18 个月内就达到了 ~1 亿美元的年经常性收入(ARR);即便是那些增长更稳健的公司,也在 4 年内达到这一水平。而以往顶级云公司通常需要大约 7 年。这就是你现在预算时要面对的加速现实。——Bessemer Venture Partners
那么——FinOps 和工程领导到底应该怎么应对?这里有五个教训。
1) 把 AI 当作一级工作负载,而不是“顺手加的功能”
我们看到的最大误区是:试图把 AI 硬套进旧的云成本模型里。别这么做。
现在真正的成本驱动因素已经变成了:Token、上下文长度、工具调用、Agent Step、评测运行、编排重试。
如果你不去衡量它们,它们就会直接吞掉你的利润。
该怎么做
- 按工作流追踪指标:
- CPT(每千 Token 成本)
- CPR(每次成功请求成本)
- CPAM(每 Agent 分钟成本)
- 从“账号级毛利”转向“工作流级毛利”,作为核心运营指标。
- 像管理 CPU 和 出网流量一样管理 AI:
对 Token 数、上下文长度、重试次数、工具调用深度设预算。
为什么这和 Bessemer 的结论一致
Bessemer 把 AI 公司的增长分成了“冲刺型(Blitz)”和“可持续型(Durable)”。
可持续型同样能很快做到 1 亿美元 ARR —— 但前提是真正有利润。
你的工作,就是让公司站在这一侧。——Bessemer Venture Partners
2) 浏览器正在变成 AI 运行时态,也正在变成新的成本中心
Bessemer 指出了一个关键变化:浏览器将成为 Agentic AI 的主要交互入口。
这意味着:长时间运行的会话、跨标签页推理、工具链调用、自动化循环——
这些看起来“人畜无害”的行为,实际上会在账单上疯狂打印数字。
现在不加控制,之后一定会为此买单。——Bessemer Venture Partners
该怎么做
- 按 Agent 分钟、按执行动作做预算,而不是只看请求次数。
- 通过策略限制复杂度:
- 单任务最大步骤数
- 递归深度
- 最大上下文长度
- 给每个会话打标签:团队 / 功能 / 客户 / 工作流,
确保 Showback 能准确落到责任人头上。
3) 评测(Evals)和行为溯源(Lineage)不是“加分项”,而是 COGS
公开基准并不能反映你真实的业务工作流。
Bessemer 认为:私有、可落地、可信的评测,会成为 AI 上线前的硬性门槛。
而这些工作是要花钱的——
如果你不把它们算进成本,就一定会产品定价偏低、预算持续失控。——Bessemer Venture Partners
该怎么做
- 给每套评测体系设定月度成本额度,并跟踪
每提升 1 分质量所付出的成本。 - 上线前通过“双重门槛”:
- 质量评分达到最低要求
- 单位成本(CPT / CPR)不超过上限
- 像管理可用性 SLO 一样管理数据血缘和漂移:
如果你无法证明模型行为稳定可信,就不要推到生产环境。
4) 增长还是可持续性 —— 有意识地选择毛利
Bessemer 总结了两种典型路径:
- 冲刺式增长(Blitz):
大约 1.5 年做到 ~1 亿美元 ARR,但往往伴随脆弱的留存率,以及很薄、甚至为负的毛利。 - 可持续增长(Durable):
大约 4 年做到 ~1 亿美元 ARR,同时保持 约 60% 的毛利率。
你要先决定:你想成为什么样的公司,然后再让定价、路由策略和长期承诺与这个选择保持一致。——Bessemer Venture Partners
该怎么做
- 建立一套“价格阶梯”的调用路径:
快且便宜 / 标准 / 高质量 / 重工具 / 视频 等不同档位。 - 自动路由到最低成本、但能满足质量要求的路径;
当质量差异不大时,默认向下切换成本档位。 - 基于可量化单位谈承诺(Token、步骤数、分钟、GB):
与模型和 GPU 供应商谈 commit,同时设置利用率护栏,避免“买了用不完”。
5) 整合浪潮即将到来 —— 在并购发生前,先统一你的成本视图
Bessemer 预计,传统巨头会通过并购“买入”AI 能力。
翻译成大白话就是:在变简单之前,你的技术栈只会先变得更复杂。
要想在并购 Day-1 活下来,你需要的不是更多报表,而是一套统一的成本账本,
能在不同模型厂商、推理网关和 GPU 集群之间,把计量单位拉到同一标准。——Bessemer Venture Partners
该怎么做
- 把所有消耗统一进一个成本账本:
Token 输入/输出、步骤数、Agent 分钟、存储、出网流量。 - 按团队、按工作流做 Showback,让责任归属一目了然。
- 用这套账本证明整合后的 ROI,
并据此与更少的供应商谈 阶梯式量价优惠。
面向成长型公司 vs 成熟型企业
如果你是一家成长型公司
- 速度是你的武器,但它会成倍放大糟糕的单位经济。
- 第 1 周就把监控打起来,别等规模上来。
- 对 Token、步骤数、上下文长度设硬性上限。
- 只为你能证明的成本定价,别靠感觉。
如果你是一家成熟型企业
- 你本来就有一套复杂的治理体系,把它自然扩展到 AI:
- 评测门槛(Eval Gates)
- 行为溯源
- 工作流级别的毛利
- 要有心理预期:AI 重塑预算结构的速度,
会和你经历过的任何一次平台级变革一样快——
甚至比上一轮云计算还要快。现在就开始规划。——Bessemer Venture Partners
总结(Bottom Line)
Bessemer 想表达的不是“都去当创业公司”,
而是一句话:AI 是新的云,但速度是 2~5 倍。
如果 AI 已经进入你的产品,
那么 FinOps 就不再是后台职能,而是你的商业模式本身。
现在就把这套能力建起来,
否则当用户规模真正起飞时,你会眼睁睁看着毛利蒸发。——Bessemer Venture Partners
联系我们
有任何云成本管理的需求或问题?欢迎通过以下方式联系我们!
公众号

企业微信客服

业务咨询
技术社区
地址
北京市海淀区自主创新大厦 5层