Gemini 3.5 模型介绍

Google Gemini 3.5 是谷歌于 2026年5月19日 推出的新一代大模型系列。该系列将前沿的多模态理解与推理能力与高效行动力深度融合，旨在帮助开发者构建更具能力、更智能的自主 Agent（智能体）与自动化编程工作流。

目前该系列首发模型为 Gemini 3.5 Flash，定位为兼顾前沿性能与极致性价比的推理与 Agent 核心模型。更强大的 Gemini 3.5 Pro 也将在 2026 年 6 月推出。

Gemini 3.5 Flash 核心优势

Gemini 3.5 Flash 针对低延迟、高吞吐和成本效益进行了深度优化，尤其在智能体（Agentic）工作流和复杂编程任务中表现出了超越以往旗舰模型的卓越能力：

极致的速度与效率：在输出 Token 生成速度上是大型前沿模型的数倍（最高可达 4 倍），非常适合实时交互与需要频繁调用工具的复杂 Agent 循环。
出色的编程与推理：无论是在自主执行多步骤编程管道、进行迭代研究，还是在修复复杂的长上下文代码库 Bug 上，3.5 Flash 都有质的飞跃。
原生多模态：支持文本、图像、视频、音频和 PDF 的联合输入，提供更强的高保真度多模态理解。
超长上下文：支持高达 100 万（1M）Token 的上下文窗口，使模型能够轻松消化整本书籍、几小时的音视频或庞大的代码库。

规格与价格参数

参数项	Gemini 3.5 Flash
模型 ID	`gemini-3.5-flash`
输入限制 (Context Window)	1,048,576 tokens
输出限制 (Max Output)	65,536 tokens
支持的数据类型	输入：文本、图片、视频、音频、PDF 输出：文本
输入价格 / 百万 Token	$1.50
输出价格 / 百万 Token	$9.00
缓存输入价格 / 百万 Token	$0.15

提示：Google 官方强烈推荐使用最新的统一标准 SDK google-genai 来调用 gemini-3.5-flash。旧的 google-generativeai 库已被弃用。

Gemini 3.5 新特性

Gemini 3.5 引入了更细粒度的控制参数，允许开发者在延迟、成本和模型性能之间取得完美平衡。

1. 思考等级 (Thinking Level)

与过去粗暴开启/关闭思考或手动指定思考预算不同，Gemini 3.5 引入了 thinking_level 参数，用以限制模型在回答之前进行内部推理的深度。

MINIMAL：最低推理深度。最适合简单检索、分类任务或极致低延迟的聊天场景。
LOW：轻量级逻辑检查。适合普通级别的修改和对比。
MEDIUM（默认）：平衡质量与速度。适合大多数日常复杂任务。
HIGH：最大推理深度。适合复杂的长链路规划、高难度算法编写及严谨的函数调用（Function Calling）。

示例代码 (Python `google-genai` SDK)：

python

from google import genai
from google.genai import types

# 初始化客户端（会自动从环境变量读取 GEMINI_API_KEY）
client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="分析并找出这段多线程C++代码中的死锁或竞态条件: [代码内容]",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(
            thinking_level="HIGH"  # 开启最大深度思考以解决高难度编程问题
        )
    )
)

print(response.text)

2. 媒体分辨率 (Media Resolution)

在使用图像、视频或 PDF 等多模态输入时，不同复杂度的内容需要消耗不同的 Token 数量。Gemini 3.5 提供了 media_resolution 配置：

支持级别：LOW、MEDIUM、HIGH 和 ULTRA_HIGH（其中 ULTRA_HIGH 仅支持图像）。
配置方式：既可以通过 generation_config 全局设置，也可以为每个媒体输入部分单独设置。例如：对包含密集小字表格的 PDF 使用 HIGH，对普通视频背景使用 LOW，大幅节省 Token 成本并提高处理速度。

行业采用与评价

各大主流开发者工具及知名企业均在第一时间接入并高度评价了 Gemini 3.5 (以及 3 系列模型)：

GitHub Copilot & VS Code：在 GitHub 的早期测试中，Gemini 3 系列模型在解决实际软件工程挑战时的准确率相比上代模型提升了 35%。
JetBrains & Junie：JetBrains 团队指出，3.5 Flash 不仅保持了 Flash 级别的极速响应和低成本优势，其代码和逻辑推理质量更是直逼 Pro 级旗舰，在低推理编程任务上的性能也比上一代 Flash 提升了 10–20%。
Cursor：Cursor 团队评价其在前端生成质量上表现抢眼，完美适合处理复杂和更具野心的开发任务。
Shopify & Agentforce：利用 3.5 Flash 的强力多步工具调用和长上下文保持能力，自主执行长达数周的数据预测、商户增长和供应链分析等复杂 Agentic 工作流。

设置

自定义

Agent 能力

产物

产物

Agent 能力

设置

自定义

编辑器

设置

迁移

Gemini 3.5 模型介绍

Gemini 3.5 Flash 核心优势

规格与价格参数

Gemini 3.5 新特性

1. 思考等级 (Thinking Level)

示例代码 (Python `google-genai` SDK)：

2. 媒体分辨率 (Media Resolution)

行业采用与评价

Gemini 3.5 模型介绍 ​

Gemini 3.5 Flash 核心优势 ​

规格与价格参数 ​

Gemini 3.5 新特性 ​

1. 思考等级 (Thinking Level) ​

示例代码 (Python google-genai SDK)： ​

2. 媒体分辨率 (Media Resolution) ​

行业采用与评价 ​

Gemini 3.5 模型介绍

Gemini 3.5 Flash 核心优势

规格与价格参数

Gemini 3.5 新特性

1. 思考等级 (Thinking Level)

示例代码 (Python `google-genai` SDK)：

2. 媒体分辨率 (Media Resolution)

行业采用与评价