Gemini 3.5 模型介绍
Google Gemini 3.5 是谷歌于 2026年5月19日 推出的新一代大模型系列。该系列将前沿的多模态理解与推理能力与高效行动力深度融合,旨在帮助开发者构建更具能力、更智能的自主 Agent(智能体)与自动化编程工作流。
目前该系列首发模型为 Gemini 3.5 Flash,定位为兼顾前沿性能与极致性价比的推理与 Agent 核心模型。更强大的 Gemini 3.5 Pro 也将在 2026 年 6 月推出。
Gemini 3.5 Flash 核心优势
Gemini 3.5 Flash 针对低延迟、高吞吐和成本效益进行了深度优化,尤其在智能体(Agentic)工作流和复杂编程任务中表现出了超越以往旗舰模型的卓越能力:
- 极致的速度与效率:在输出 Token 生成速度上是大型前沿模型的数倍(最高可达 4 倍),非常适合实时交互与需要频繁调用工具的复杂 Agent 循环。
- 出色的编程与推理:无论是在自主执行多步骤编程管道、进行迭代研究,还是在修复复杂的长上下文代码库 Bug 上,3.5 Flash 都有质的飞跃。
- 原生多模态:支持文本、图像、视频、音频和 PDF 的联合输入,提供更强的高保真度多模态理解。
- 超长上下文:支持高达 100 万(1M)Token 的上下文窗口,使模型能够轻松消化整本书籍、几小时的音视频或庞大的代码库。
规格与价格参数
| 参数项 | Gemini 3.5 Flash |
|---|---|
| 模型 ID | gemini-3.5-flash |
| 输入限制 (Context Window) | 1,048,576 tokens |
| 输出限制 (Max Output) | 65,536 tokens |
| 支持的数据类型 | 输入:文本、图片、视频、音频、PDF 输出:文本 |
| 输入价格 / 百万 Token | $1.50 |
| 输出价格 / 百万 Token | $9.00 |
| 缓存输入价格 / 百万 Token | $0.15 |
提示:Google 官方强烈推荐使用最新的统一标准 SDK
google-genai来调用gemini-3.5-flash。旧的google-generativeai库已被弃用。
Gemini 3.5 新特性
Gemini 3.5 引入了更细粒度的控制参数,允许开发者在延迟、成本和模型性能之间取得完美平衡。
1. 思考等级 (Thinking Level)
与过去粗暴开启/关闭思考或手动指定思考预算不同,Gemini 3.5 引入了 thinking_level 参数,用以限制模型在回答之前进行内部推理的深度。
MINIMAL:最低推理深度。最适合简单检索、分类任务或极致低延迟的聊天场景。LOW:轻量级逻辑检查。适合普通级别的修改和对比。MEDIUM(默认):平衡质量与速度。适合大多数日常复杂任务。HIGH:最大推理深度。适合复杂的长链路规划、高难度算法编写及严谨的函数调用(Function Calling)。
示例代码 (Python google-genai SDK):
python
from google import genai
from google.genai import types
# 初始化客户端(会自动从环境变量读取 GEMINI_API_KEY)
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="分析并找出这段多线程C++代码中的死锁或竞态条件: [代码内容]",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(
thinking_level="HIGH" # 开启最大深度思考以解决高难度编程问题
)
)
)
print(response.text)2. 媒体分辨率 (Media Resolution)
在使用图像、视频或 PDF 等多模态输入时,不同复杂度的内容需要消耗不同的 Token 数量。Gemini 3.5 提供了 media_resolution 配置:
- 支持级别:
LOW、MEDIUM、HIGH和ULTRA_HIGH(其中ULTRA_HIGH仅支持图像)。 - 配置方式:既可以通过
generation_config全局设置,也可以为每个媒体输入部分单独设置。例如:对包含密集小字表格的 PDF 使用HIGH,对普通视频背景使用LOW,大幅节省 Token 成本并提高处理速度。
行业采用与评价
各大主流开发者工具及知名企业均在第一时间接入并高度评价了 Gemini 3.5 (以及 3 系列模型):
- GitHub Copilot & VS Code:在 GitHub 的早期测试中,Gemini 3 系列模型在解决实际软件工程挑战时的准确率相比上代模型提升了 35%。
- JetBrains & Junie:JetBrains 团队指出,3.5 Flash 不仅保持了 Flash 级别的极速响应和低成本优势,其代码和逻辑推理质量更是直逼 Pro 级旗舰,在低推理编程任务上的性能也比上一代 Flash 提升了 10–20%。
- Cursor:Cursor 团队评价其在前端生成质量上表现抢眼,完美适合处理复杂和更具野心的开发任务。
- Shopify & Agentforce:利用 3.5 Flash 的强力多步工具调用和长上下文保持能力,自主执行长达数周的数据预测、商户增长和供应链分析等复杂 Agentic 工作流。
Gemini 中文文档