Gemini 3.0
Gemini 3 是谷歌迄今为止最智能的模型系列,以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务,将任何想法变为现实。
关注Gemini3已经很久了,当它真的来了还是激动万分。
Gemini 3 的Token限制和价格
Gemini 3 Pro 是新系列中的首款模型,模型ID为:gemini-3-pro-preview。
Gemini 3 Pro 的最大输入Token为100万,最大输出Token为6.4万。
Gemini 3 Pro 的知识截止时间为2025年1月。
Gemini 3 Pro 的定价采用分阶段定价模式,具体如下:
当Token数小于20万个时, 输入价格是 2美元/百万Token,输出价格是 12美元/百万Token。
当Token数大于20万个时, 输入价格是 4美元/百万Token,输出价格是 18美元/百万Token。
相比GPT-5的输入1.25美元/百万Token, 输出 10美元/百万Token,Gemini 3 Pro的价格还是高出不少。
Gemini 3 的新特性
Gemini 3 Pro 带来了高/动态思考型和低思考型两种思考等级,以及可控的媒体分辨率等,旨在让开发者更好地控制延迟时间、费用和多模态保真度。
思考等级
thinking_level 参数用于控制模型在生成回答之前进行内部推理过程的最大深度。Gemini 3 将这些级别视为相对的思考许可,而不是严格的令牌保证。如果未指定 thinking_level,Gemini 3 Pro 将默认为 high。
- low:尽可能缩短延迟时间并降低费用。最适合简单的指令遵循、聊天或高吞吐量应用
- medium:(即将推出),发布时不支持
- high(默认):最大限度地提高推理深度。模型可能需要更长时间才能生成第一个 token,但输出结果会经过更仔细的推理。
默认为high
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="Find the race condition in this multi-threaded C++ snippet: [code here]",
)
print(response.text)设置为low
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="How does AI work?",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_level="low")
),
)
print(response.text)媒体分辨率
Gemini 3 通过 media_resolution 参数引入了对多模态视觉处理的精细控制。分辨率越高,模型读取细小文本或识别细微细节的能力就越强,但会增加令牌用量和延迟时间。media_resolution 参数用于确定为每个输入图片或视频帧分配的 token 数量上限。
现在,您可以为每个媒体部分单独设置分辨率,也可以通过 generation_config 全局设置分辨率,分辨率可设置为 media_resolution_low、media_resolution_medium 或 media_resolution_high。如果未指定,模型会根据媒体类型使用最佳默认值。
推荐设置
| 媒体类型 | 推荐设置 | 令牌数量上限 | 使用指南 |
|---|---|---|---|
| 图片 | media_resolution_high | 1,120 | 建议用于大多数图片分析任务,以确保获得最佳质量。 |
| media_resolution_medium | 560 | 非常适合文档理解;质量通常在 medium 时达到饱和。增加到 high 很少能改进标准文档的 OCR 结果。 | |
| 视频视频(常规) | media_resolution_low(或 media_resolution_medium) | 70(每帧) | 注意:对于视频,low 和 medium 设置的处理方式相同(70 个令牌),以优化上下文使用情况。这对于大多数动作识别和描述任务来说已经足够。 |
| 视频(文字较多) | media_resolution_high | 280(每帧) | 仅当用例涉及读取密集文本 (OCR) 或视频帧中的微小细节时才需要。 |
媒体分辨率的设置示例:
from google import genai
from google.genai import types
import base64
# The media_resolution parameter is currently only available in the v1alpha API version.
client = genai.Client(http_options={'api_version': 'v1alpha'})
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents=[
types.Content(
parts=[
types.Part(text="What is in this image?"),
types.Part(
inline_data=types.Blob(
mime_type="image/jpeg",
data=base64.b64decode("..."),
),
media_resolution={"level": "media_resolution_high"}
)
]
)
]
)
print(response.text)Gemini 3 Pro 结构化输出
from google import genai
from google.genai import types
from pydantic import BaseModel, Field
from typing import List
class MatchResult(BaseModel):
winner: str = Field(description="The name of the winner.")
final_match_score: str = Field(description="The final match score.")
scorers: List[str] = Field(description="The name of the scorer.")
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="Search for all details for the latest Euro.",
config={
"tools": [
{"google_search": {}},
{"url_context": {}}
],
"response_mime_type": "application/json",
"response_json_schema": MatchResult.model_json_schema(),
},
)
result = MatchResult.model_validate_json(response.text)
print(result)关于Gemini 3 Pro 的常见问题
- Gemini 3 Pro 的知识截止日期是什么?
Gemini 3 的知识截止日期为 2025 年 1 月。如需了解最新信息,请使用搜索基础工具。
- 上下文窗口有哪些限制?
Gemini 3 Pro 支持 100 万个 token 的输入上下文窗口,输出最多可达 6.4 万个 token。
- Gemini 3 Pro 是否有免费层级?
您可以在 Google AI Studio 中免费试用该模型,但目前 Gemini API 中没有 gemini-3-pro-preview 的免费层级。
- 我的旧 thinking_budget 代码是否仍然有效?
可以,为了实现向后兼容性,我们仍支持 thinking_budget,但建议您迁移到 thinking_level 以获得更可预测的性能。请勿在同一请求中同时使用这两个参数。
- Gemini 3 是否支持 Batch API?
可以,Gemini 3 支持批量 API。
- 是否支持上下文缓存?
可以,Gemini 3 支持上下文缓存。启动缓存所需的最低 token 数为 2,048 个。
- Gemini 3 支持哪些工具?
Gemini 3 支持Google 搜索、文件搜索、代码执行和网址上下文。它还支持标准函数调用,以便您使用自己的自定义工具。请注意,Google 地图和电脑使用目前不受支持。
Gemini 中文文档