Gemini 3.1 Flash Preview 的输入价格和输出价格哪个更重要?
如果你的请求提示很长,输入价格更关键;如果你的任务输出很长,比如生成报告或代码,输出价格对总成本影响更大。
Gemini 3.1 Flash Preview 的价格页聚焦输入、输出与缓存成本,适合用来做模型预算和调用成本预估。
| 输入价格(/百万 tokens) | $0.30 |
|---|---|
| 输出价格(/百万 tokens) | $2.50 |
| 缓存价格(/百万 tokens) | $0.07 |
| 上下文窗口 | 1,048,576 tokens |
| 最大输出 | 65,536 tokens |
| 价格来源 | 查看来源 |
这是 Google 官方定价页中的预览型号价格。
预览版价格和可用性可能调整得更快,正式切生产前建议再核对一次官方页。
如果你的请求提示很长,输入价格更关键;如果你的任务输出很长,比如生成报告或代码,输出价格对总成本影响更大。
适合做第一轮估算,但生产成本还会受到缓存命中、返回长度、重试率和请求结构影响,建议结合真实流量继续验证。