Gemini API文档-模型 第8章:价格

内容分享3小时前发布
0 0 0

开始时可免费使用,享受慷慨的限制额度,然后在生产就绪的应用程序中按使用量付费进行扩展。

Ⅰ. 免费版

适用于开始使用 Gemini API 的开发人员和小型项目。

✅ 有限访问特定模型✅ 免费的输入和输出令牌✅ 可访问 Google AI Studio✅ 内容用于改进我们的产品*

免费开始使用

Ⅱ. 付费版

适用于需要更高用量和高级功能的生产应用程序。

✅ 为生产部署提供更高的速率限制✅ 可访问上下文缓存✅ 批量 API(降低 50% 成本)✅ 可访问 Google 最先进的模型✅ 内容用于改进我们的产品*

升级到付费版

Ⅲ. 企业版

适用于在安全性、支持和合规性方面有定制需求的大规模部署,由 Vertex AI 提供支持。

✅ 包含付费版所有功能,并可选择访问:✅ 专属支持渠道✅ 高级安全与合规性✅ 预配置吞吐量✅ 基于使用量的折扣(根据用量)✅ ML 运维、模型花园等

联系销售

Ⅳ 名词

标准模式:你发送一个请求,模型会尽快处理并返回结果。这是一个同步的过程,你会在请求发出后的几秒钟内(甚至更短)得到响应。
批量模式:批量模式是为了高效、经济地处理海量数据任务而设计的。

特性 标准模式 批量模式
响应方式 同步、实时 异步、延迟
延迟 (秒级) (分钟到小时级)
计费方式 按请求/Token,单价较高 按Token,有大幅折扣,单价低
吞吐量 单个或少量请求 海量请求
资源竞争 可能遇到 不会遇到
最佳场景 交互式应用、实时推理 离线数据处理、大规模非紧急任务

如何选择?

如果你的应用是与用户实时交互的,比如一个聊天界面或一个需要即时响应的工具,请选择标准模式。如果你有成千上万条数据需要处理,并且不要求立刻拿到结果(比如 overnight 处理),那么批量模式将是更经济、更高效的选择。

8.1. Gemini 3 Pro 预览版


gemini-3-pro-preview

在 Google AI Studio 中试用

世界领先的多模态理解模型,也是我们迄今为止最强大的代理和氛围编码模型。

8.1.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $2.00,提示词 <= 20 万令牌 $4.00,提示词 > 20 万令牌
输出价格(包含思考令牌) 不可用 $12.00,提示词 <= 20 万令牌 $18.00,提示词 > 20 万令牌
上下文缓存价格 不可用 $0.20,提示词 <= 20 万令牌 $0.40,提示词 > 20 万令牌 $4.50 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费),之后(即将推出)$14 / 1,000 次搜索查询
通过 Google 地图进行落地 不可用 不可用
用于改进我们的产品

8.1.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $1.00,提示词 <= 20 万令牌 $2.00,提示词 > 20 万令牌
输出价格(包含思考令牌) 不可用 $6.00,提示词 <= 20 万令牌 $9.00,提示词 > 20 万令牌
上下文缓存价格 不可用 $0.20,提示词 <= 20 万令牌 $0.40,提示词 > 20 万令牌 $4.50 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费),之后(即将推出)$14 / 1,000 次搜索查询
通过 Google 地图进行落地 不可用 不可用
用于改进我们的产品

8.2. Gemini 2.5 Pro


gemini-2.5-pro

在 Google AI Studio 中试用

我们先进的多用途模型,擅长编码和复杂推理任务。

8.2.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $1.25,提示词 <= 20 万令牌 $2.50,提示词 > 20 万令牌
输出价格(包含思考令牌) 免费 $10.00,提示词 <= 20 万令牌 $15.00,提示词 > 20 万令牌
上下文缓存价格 不可用 $0.125,提示词 <= 20 万令牌 $0.25,提示词 > 20 万令牌 $4.50 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 不可用 10,000 RPD(免费),之后 $25 / 1,000 次落地提示词
用于改进我们的产品

8.2.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.625,提示词 <= 20 万令牌 $1.25,提示词 > 20 万令牌
输出价格(包含思考令牌) 不可用 $5.00,提示词 <= 20 万令牌 $7.50,提示词 > 20 万令牌
上下文缓存价格 不可用 $0.125,提示词 <= 20 万令牌 $0.25,提示词 > 20 万令牌 $4.50 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 不可用 不可用
用于改进我们的产品

8.3. Gemini 2.5 Flash


gemini-2.5-flash

在 Google AI Studio 中试用

我们的首个混合推理模型,支持 100 万令牌的上下文窗口并具有思考预算。

8.3.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.30(文本 / 图像 / 视频) $1.00(音频)
输出价格(包含思考令牌) 免费 $2.50
上下文缓存价格 不可用 $0.03(文本 / 图像 / 视频) $0.1(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 免费,最多 500 RPD(与 Flash-Lite RPD 共享限制) 1,500 RPD(免费,与 Flash-Lite RPD 共享限制),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 500 RPD 1,500 RPD(免费),之后 $25 / 1,000 次落地提示词
用于改进我们的产品

8.3.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.15(文本 / 图像 / 视频) $0.50(音频)
输出价格(包含思考令牌) 不可用 $1.25
上下文缓存价格 不可用 $0.03(文本 / 图像 / 视频) $0.1(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费,与 Flash-Lite RPD 共享限制),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 不可用 不可用
用于改进我们的产品

8.4. Gemini 2.5 Flash 预览版


gemini-2.5-flash-preview-09-2025

在 Google AI Studio 中试用

基于 2.5 Flash 模型的最新模型。2.5 Flash 预览版最适合需要思考的大规模处理、低延迟、高吞吐量任务以及代理用例。

8.4.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.30(文本 / 图像 / 视频) $1.00(音频)
输出价格(包含思考令牌) 免费 $2.50
上下文缓存价格 不可用 $0.03(文本 / 图像 / 视频) $0.1(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 免费,最多 500 RPD(与 Flash-Lite RPD 共享限制) 1,500 RPD(免费,与 Flash-Lite RPD 共享限制),之后 $35 / 1,000 次落地提示词
用于改进我们的产品

8.4.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.15(文本 / 图像 / 视频) $0.50(音频)
输出价格(包含思考令牌) 不可用 $1.25
上下文缓存价格 不可用 $0.03(文本 / 图像 / 视频) $0.1(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费,与 Flash-Lite RPD 共享限制),之后 $35 / 1,000 次落地提示词
用于改进我们的产品

8.5. Gemini 2.5 Flash-Lite


gemini-2.5-flash-lite

在 Google AI Studio 中试用

我们最小且最具成本效益的模型,为大规模使用而构建。

8.5.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格(文本、图像、视频) 免费 $0.10(文本 / 图像 / 视频) $0.30(音频)
输出价格(包含思考令牌) 免费 $0.40
上下文缓存价格 不可用 $0.01(文本 / 图像 / 视频) $0.03(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 免费,最多 500 RPD(与 Flash RPD 共享限制) 1,500 RPD(免费,与 Flash RPD 共享限制),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 500 RPD 1,500 RPD(免费),之后 $25 / 1,000 次落地提示词
用于改进我们的产品

8.5.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格(文本、图像、视频) 不可用 $0.05(文本 / 图像 / 视频) $0.15(音频)
输出价格(包含思考令牌) 不可用 $0.20
上下文缓存价格 不可用 $0.01(文本 / 图像 / 视频) $0.03(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费,与 Flash RPD 共享限制),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 不可用 不可用
用于改进我们的产品

8.6. Gemini 2.5 Flash-Lite 预览版


gemini-2.5-flash-lite-preview-09-2025

在 Google AI Studio 中试用

基于 Gemini 2.5 Flash Lite 的最新模型,针对成本效益、高吞吐量和高品质进行了优化。

8.6.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格(文本、图像、视频) 免费 $0.10(文本 / 图像 / 视频) $0.30(音频)
输出价格(包含思考令牌) 免费 $0.40
上下文缓存价格 不可用 $0.01(文本 / 图像 / 视频) $0.03(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 免费,最多 500 RPD(与 Flash RPD 共享限制) 1,500 RPD(免费,与 Flash RPD 共享限制),之后 $35 / 1,000 次落地提示词
用于改进我们的产品

8.6.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格(文本、图像、视频) 不可用 $0.05(文本 / 图像 / 视频) $0.15(音频)
输出价格(包含思考令牌) 不可用 $0.20
上下文缓存价格 不可用 $0.01(文本 / 图像 / 视频) $0.03(音频) $1.00 / 1,000,000 令牌每小时(存储价格)
通过 Google 搜索进行落地 不可用 1,500 RPD(免费,与 Flash RPD 共享限制),之后 $35 / 1,000 次落地提示词
用于改进我们的产品

8.7. Gemini 2.5 Flash 原生音频(实时 API)


gemini-2.5-flash-native-audio-preview-09-2025

在 Google AI Studio 中试用

我们的 实时 API 原生音频模型,针对更高质量的音频输出进行了优化,具有更好的节奏、语音自然度、详尽性和情绪。

预览版模型在稳定前可能会发生变化,并且有更严格的速率限制。

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.50(文本) $3.00(音频 / 视频)
输出价格(包含思考令牌) 免费 $2.00(文本) $12.00(音频)
用于改进我们的产品

实时 API 还包括半级联音频生成模型:


gemini-live-2.5-flash-preview
:价格与原生音频模型相同。
gemini-2.0-flash-live-001
:输入 $0.35(文本),$2.10(音频 / 图像 / 视频),输出:$1.50(文本),$8.50(音频)

这些模型即将被弃用。

8.8. Gemini 2.5 Flash 图像 🍌


gemini-2.5-flash-image

在 Google AI Studio 中试用

我们的原生图像生成模型,针对速度、灵活性和上下文理解进行了优化。文本输入和输出的定价与 2.5 Flash 相同。

预览版模型在稳定前可能会发生变化,并且有更严格的速率限制。

8.8.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.30(文本 / 图像)
输出价格 不可用 $0.039 每张图片*
用于改进我们的产品

8.8.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.15(文本 / 图像)
输出价格 不可用 $0.0195 每张图片*
用于改进我们的产品

[*] 图像输出定价为每 1,000,000 令牌 $30。输出分辨率最高为 1024x1024px 的图像消耗 1290 令牌,相当于每张图片 $0.039。

8.9. Gemini 2.5 Flash 预览版 TTS


gemini-2.5-flash-preview-tts

在 Google AI Studio 中试用

我们的 2.5 Flash 文本转语音音频模型,针对性价比高、低延迟、可控的语音生成进行了优化。

预览版模型在稳定前可能会发生变化,并且有更严格的速率限制。

8.9.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.50(文本)
输出价格 免费 $10.00(音频)
用于改进我们的产品

8.9.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.25(文本)
输出价格 不可用 $5.00(音频)
用于改进我们的产品

8.10. Gemini 2.5 Pro 预览版 TTS


gemini-2.5-pro-preview-tts

在 Google AI Studio 中试用

我们的 2.5 Pro 文本转语音音频模型,针对强大、低延迟的语音生成进行了优化,可实现更自然的输出和更易引导的提示词。

预览版模型在稳定前可能会发生变化,并且有更严格的速率限制。

8.10.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $1.00(文本)
输出价格 不可用 $20.00(音频)
用于改进我们的产品

8.10.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.50(文本)
输出价格 不可用 $10.00(音频)
用于改进我们的产品

8.11. Gemini 2.0 Flash


gemini-2.0-flash

在 Google AI Studio 中试用

我们最平衡的多模态模型,在所有任务上都具有出色的性能,拥有 100 万令牌的上下文窗口,并为代理时代而构建。

8.11.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.10(文本 / 图像 / 视频) $0.70(音频)
输出价格 免费 $0.40
上下文缓存价格 免费 $0.025 / 1,000,000 令牌(文本/图像/视频) $0.175 / 1,000,000 令牌(音频)
上下文缓存(存储) 不可用 $1.00 / 1,000,000 令牌每小时
图像生成定价 免费 $0.039 每张图片*
调优价格 不可用 不可用
通过 Google 搜索进行落地 免费,最多 500 RPD 1,500 RPD(免费),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 500 RPD 1,500 RPD(免费),之后 $25 / 1,000 次落地提示词
用于改进我们的产品

8.11.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.05(文本 / 图像 / 视频) $0.35(音频)
输出价格 不可用 $0.20
上下文缓存价格 不可用 $0.025 / 1,000,000 令牌(文本/图像/视频) $0.175 / 1,000,000 令牌(音频)
上下文缓存(存储) 不可用 $1.00 / 1,000,000 令牌每小时
图像生成定价 不可用 $0.0195 每张图片*
调优价格 不可用 不可用
通过 Google 搜索进行落地 不可用 1,500 RPD(免费),之后 $35 / 1,000 次落地提示词
通过 Google 地图进行落地 不可用 不可用
用于改进我们的产品

[*] 图像输出定价为每 1,000,000 令牌 $30。输出分辨率最高为 1024x1024px 的图像消耗 1290 令牌,相当于每张图片 $0.039。

8.12. Gemini 2.0 Flash-Lite


gemini-2.0-flash-lite

在 Google AI Studio 中试用

我们最小且最具成本效益的模型,为大规模使用而构建。

8.12.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.075
输出价格 免费 $0.30
上下文缓存价格 不可用 不可用
上下文缓存(存储) 不可用 不可用
调优价格 不可用 不可用
通过 Google 搜索进行落地 不可用 不可用
用于改进我们的产品

8.12.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.0375
输出价格 不可用 $0.15
上下文缓存价格 不可用 不可用
上下文缓存(存储) 不可用 不可用
调优价格 不可用 不可用
通过 Google 搜索进行落地 不可用 不可用
用于改进我们的产品

8.13. Imagen 4


imagen-4.0-generate-001
,
imagen-4.0-ultra-generate-001
,
imagen-4.0-fast-generate-001

在 Google AI Studio 中试用

我们最新的图像生成模型,具有显著更好的文本渲染和整体图像质量。

预览版模型在稳定前可能会发生变化,并且有更严格的速率限制。

免费版 付费版,每张图片价格(美元)
Imagen 4 快速图像价格 不可用 $0.02
Imagen 4 标准图像价格 不可用 $0.04
Imagen 4 超高清图像价格 不可用 $0.06
用于改进我们的产品

8.14. Imagen 3


imagen-3.0-generate-002

在 Google AI Studio 中试用

我们先进的图像生成模型,可供 Gemini API 付费层的开发人员使用。

免费版 付费版,每张图片价格(美元)
图像价格 不可用 $0.03
用于改进我们的产品

8.15. Veo 3.1


veo-3.1-generate-preview
,
veo-3.1-fast-generate-preview

试用 Veo 3.1

我们最新的视频生成模型,可供 Gemini API 付费层的开发人员使用。

预览版模型在稳定前可能会发生变化,并且有更严格的速率限制。

免费版 付费版,每秒价格(美元)
Veo 3.1 标准视频带音频价格(默认) 不可用 $0.40
Veo 3.1 快速视频带音频价格(默认) 不可用 $0.15
用于改进我们的产品

注意: 在某些情况下,音频处理问题可能会阻止视频生成。仅当视频成功生成时,您才会被收费。

8.16. Veo 3


veo-3.0-generate-001
,
veo-3.0-fast-generate-001

试用 Veo 3

我们稳定的视频生成模型,可供 Gemini API 付费层的开发人员使用。

免费版 付费版,每秒价格(美元)
Veo 3 标准视频带音频价格(默认) 不可用 $0.40
Veo 3 快速视频带音频价格(默认) 不可用 $0.15
用于改进我们的产品

注意: 在某些情况下,音频处理问题可能会阻止视频生成。仅当视频成功生成时,您才会被收费。

8.17. Veo 2


veo-2.0-generate-001

试用 API

我们先进的视频生成模型,可供 Gemini API 付费层的开发人员使用。

免费版 付费版,每秒价格(美元)
视频价格 不可用 $0.35
用于改进我们的产品

8.18. Gemini 嵌入


gemini-embedding-001

试用 API

我们最新的嵌入模型,比之前的版本更稳定且具有更高的速率限制,可供 Gemini API 免费层和付费层的开发人员使用。

8.18.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.15
用于改进我们的产品

8.18.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $0.075
用于改进我们的产品

8.19. Gemini Robotics-ER 1.5 预览版


gemini-robotics-er-1.5-preview

在 Google AI Studio 中试用

Gemini Robotics-ER,全称 Gemini Robotics-Embodied Reasoning,是一个思考模型,可增强机器人理解和与物理世界交互的能力。

8.19.1. 标准模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 $0.30(文本 / 图像 / 视频) $1.00(音频)
输出价格(包含思考令牌) 免费 $2.50
通过 Google 搜索进行落地 免费,最多 500 RPD(与 Flash-Lite RPD 共享限制) 1,500 RPD(免费,与 Flash-Lite RPD 共享限制),之后 $35 / 1,000 次落地提示词
用于改进我们的产品

8.19.2. 批量模式

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 不可用
输出价格(包含思考令牌) 不可用 不可用
通过 Google 搜索进行落地 不可用 不可用
用于改进我们的产品

8.20. Gemini 2.5 计算机使用预览版


gemini-2.5-computer-use-preview-10-2025

我们的计算机使用模型,针对构建自动化任务的浏览器控制代理进行了优化。

免费版 付费版,每 100 万令牌价格(美元)
输入价格 不可用 $1.25,提示词 <= 20 万令牌 $2.50,提示词 > 20 万令牌
输出价格 不可用 $10.00,提示词 <= 20 万令牌 $15.00,提示词 > 20 万令牌
用于改进我们的产品

8.21. Gemma 3

试用 Gemma 3

我们轻量级、先进的开源模型,采用与 Gemini 模型相同的技术构建。

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 不可用
输出价格 免费 不可用
上下文缓存价格 免费 不可用
上下文缓存(存储) 免费 不可用
调优价格 不可用 不可用
通过 Google 搜索进行落地 不可用 不可用
用于改进我们的产品

8.22. Gemma 3n

试用 Gemma 3n

我们的开源模型,为在手机、笔记本电脑和平板电脑等日常设备上实现高效性能而构建。

免费版 付费版,每 100 万令牌价格(美元)
输入价格 免费 不可用
输出价格 免费 不可用
上下文缓存价格 免费 不可用
上下文缓存(存储) 免费 不可用
调优价格 不可用 不可用
通过 Google 搜索进行落地 不可用 不可用
用于改进我们的产品

8.23. 工具定价

工具按其自身的费率定价,适用于使用它们的模型。请查看 模型 页面了解每个模型可用的工具。

免费版 付费版,每 100 万令牌价格(美元)
Google 搜索 500 RPD 免费(Flash 和 Flash-Lite 共享限制)。Pro 版不可用。 1,500 RPD 免费(Flash 和 Flash-Lite 共享限制)。之后 $35 / 1,000 次落地提示词
Google 地图 500 RPD Pro 版不可用。 1,500 RPD 免费(Flash 和 Flash-Lite 共享限制) 10,000 RPD 免费(Pro 版)。之后 $25 / 1,000 次落地提示词
代码执行 免费 免费
URL 上下文 免费 按模型定价收取输入令牌费用。
计算机使用 不可用 参见 Gemini 2.5 计算机使用预览版 定价表。
文件搜索 免费 嵌入 按 $0.15 / 100 万令牌收费。检索到的文档令牌按模型定价作为常规令牌收费。

① 在所有 可用区域 内,Google AI Studio 的使用是免费的。有关详细信息,请参阅 计费常见问题解答。

② 此处列出的价格可能与 Vertex AI 上提供的价格不同。有关 Vertex 价格,请参阅 Vertex AI 定价页面。

③ 如果您使用 动态检索 来优化成本,则仅对响应中包含至少一个来自网络的落地支持 URL 的请求收取”通过 Google 搜索进行落地”的费用。Gemini 的成本始终适用。速率限制可能会发生变化。

© 版权声明

相关文章

暂无评论

none
暂无评论...