快速上手Gemini 3.0 | Gemini AI中文文档

Gemini 3.0

Gemini 3 是谷歌迄今为止最智能的模型系列，以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务，将任何想法变为现实。

关注Gemini3已经很久了，当它真的来了还是激动万分。

Gemini 3 的Token限制和价格

Gemini 3 Pro 是新系列中的首款模型，模型ID为：gemini-3-pro-preview。

Gemini 3 Pro 的最大输入Token为100万，最大输出Token为6.4万。

Gemini 3 Pro 的知识截止时间为2025年1月。

Gemini 3 Pro 的定价采用分阶段定价模式，具体如下：

当Token数小于20万个时，输入价格是 2美元/百万Token，输出价格是 12美元/百万Token。

当Token数大于20万个时，输入价格是 4美元/百万Token，输出价格是 18美元/百万Token。

相比GPT-5的输入1.25美元/百万Token，输出 10美元/百万Token，Gemini 3 Pro的价格还是高出不少。

Gemini 3 的新特性

Gemini 3 Pro 带来了高/动态思考型和低思考型两种思考等级，以及可控的媒体分辨率等，旨在让开发者更好地控制延迟时间、费用和多模态保真度。

思考等级

thinking_level 参数用于控制模型在生成回答之前进行内部推理过程的最大深度。Gemini 3 将这些级别视为相对的思考许可，而不是严格的令牌保证。如果未指定 thinking_level，Gemini 3 Pro 将默认为 high。

low：尽可能缩短延迟时间并降低费用。最适合简单的指令遵循、聊天或高吞吐量应用
medium：（即将推出），发布时不支持
high（默认）：最大限度地提高推理深度。模型可能需要更长时间才能生成第一个 token，但输出结果会经过更仔细的推理。

默认为high

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Find the race condition in this multi-threaded C++ snippet: [code here]",
)

print(response.text)

设置为low

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="How does AI work?",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="low")
    ),
)

print(response.text)

媒体分辨率

Gemini 3 通过 media_resolution 参数引入了对多模态视觉处理的精细控制。分辨率越高，模型读取细小文本或识别细微细节的能力就越强，但会增加令牌用量和延迟时间。media_resolution 参数用于确定为每个输入图片或视频帧分配的 token 数量上限。

现在，您可以为每个媒体部分单独设置分辨率，也可以通过 generation_config 全局设置分辨率，分辨率可设置为 media_resolution_low、media_resolution_medium 或 media_resolution_high。如果未指定，模型会根据媒体类型使用最佳默认值。

推荐设置

媒体类型	推荐设置	令牌数量上限	使用指南
图片	media_resolution_high	1,120	建议用于大多数图片分析任务，以确保获得最佳质量。
PDF	media_resolution_medium	560	非常适合文档理解；质量通常在 medium 时达到饱和。增加到 high 很少能改进标准文档的 OCR 结果。
视频视频（常规）	media_resolution_low（或 media_resolution_medium）	70（每帧）	注意：对于视频，low 和 medium 设置的处理方式相同（70 个令牌），以优化上下文使用情况。这对于大多数动作识别和描述任务来说已经足够。
视频（文字较多）	media_resolution_high	280（每帧）	仅当用例涉及读取密集文本 (OCR) 或视频帧中的微小细节时才需要。

媒体分辨率的设置示例：

Python

from google import genai
from google.genai import types
import base64

# The media_resolution parameter is currently only available in the v1alpha API version.
client = genai.Client(http_options={'api_version': 'v1alpha'})

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents=[
        types.Content(
            parts=[
                types.Part(text="What is in this image?"),
                types.Part(
                    inline_data=types.Blob(
                        mime_type="image/jpeg",
                        data=base64.b64decode("..."),
                    ),
                    media_resolution={"level": "media_resolution_high"}
                )
            ]
        )
    ]
)

print(response.text)

Gemini 3 Pro 结构化输出

Python

from google import genai
from google.genai import types
from pydantic import BaseModel, Field
from typing import List

class MatchResult(BaseModel):
    winner: str = Field(description="The name of the winner.")
    final_match_score: str = Field(description="The final match score.")
    scorers: List[str] = Field(description="The name of the scorer.")

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Search for all details for the latest Euro.",
    config={
        "tools": [
            {"google_search": {}},
            {"url_context": {}}
        ],
        "response_mime_type": "application/json",
        "response_json_schema": MatchResult.model_json_schema(),
    },  
)

result = MatchResult.model_validate_json(response.text)
print(result)

关于Gemini 3 Pro 的常见问题

Gemini 3 Pro 的知识截止日期是什么？

Gemini 3 的知识截止日期为 2025 年 1 月。如需了解最新信息，请使用搜索基础工具。

上下文窗口有哪些限制？

Gemini 3 Pro 支持 100 万个 token 的输入上下文窗口，输出最多可达 6.4 万个 token。

Gemini 3 Pro 是否有免费层级？

您可以在 Google AI Studio 中免费试用该模型，但目前 Gemini API 中没有 gemini-3-pro-preview 的免费层级。

我的旧 thinking_budget 代码是否仍然有效？

可以，为了实现向后兼容性，我们仍支持 thinking_budget，但建议您迁移到 thinking_level 以获得更可预测的性能。请勿在同一请求中同时使用这两个参数。

Gemini 3 是否支持 Batch API？

可以，Gemini 3 支持批量 API。

是否支持上下文缓存？

可以，Gemini 3 支持上下文缓存。启动缓存所需的最低 token 数为 2,048 个。

Gemini 3 支持哪些工具？

Gemini 3 支持Google 搜索、文件搜索、代码执行和网址上下文。它还支持标准函数调用，以便您使用自己的自定义工具。请注意，Google 地图和电脑使用目前不受支持。

设置

自定义

Agent 能力

产物

产物

Agent 能力

设置

自定义

编辑器

设置

迁移

Gemini 3.0

Gemini 3 的Token限制和价格

Gemini 3 的新特性

思考等级

媒体分辨率

Gemini 3 Pro 结构化输出

关于Gemini 3 Pro 的常见问题

Gemini 3.0 ​

Gemini 3 的Token限制和价格 ​

Gemini 3 的新特性 ​

思考等级 ​

媒体分辨率 ​

Gemini 3 Pro 结构化输出 ​

关于Gemini 3 Pro 的常见问题 ​

Gemini 3.0

Gemini 3 的Token限制和价格

Gemini 3 的新特性

思考等级

媒体分辨率

Gemini 3 Pro 结构化输出

关于Gemini 3 Pro 的常见问题