Skip to content

Gemini 3.5 模型介绍

Google Gemini 3.5 是谷歌于 2026年5月19日 推出的新一代大模型系列。该系列将前沿的多模态理解与推理能力高效行动力深度融合,旨在帮助开发者构建更具能力、更智能的自主 Agent(智能体)与自动化编程工作流。

目前该系列首发模型为 Gemini 3.5 Flash,定位为兼顾前沿性能与极致性价比的推理与 Agent 核心模型。更强大的 Gemini 3.5 Pro 也将在 2026 年 6 月推出。


Gemini 3.5 Flash 核心优势

Gemini 3.5 Flash 针对低延迟、高吞吐和成本效益进行了深度优化,尤其在智能体(Agentic)工作流复杂编程任务中表现出了超越以往旗舰模型的卓越能力:

  • 极致的速度与效率:在输出 Token 生成速度上是大型前沿模型的数倍(最高可达 4 倍),非常适合实时交互与需要频繁调用工具的复杂 Agent 循环。
  • 出色的编程与推理:无论是在自主执行多步骤编程管道、进行迭代研究,还是在修复复杂的长上下文代码库 Bug 上,3.5 Flash 都有质的飞跃。
  • 原生多模态:支持文本、图像、视频、音频和 PDF 的联合输入,提供更强的高保真度多模态理解。
  • 超长上下文:支持高达 100 万(1M)Token 的上下文窗口,使模型能够轻松消化整本书籍、几小时的音视频或庞大的代码库。

规格与价格参数

参数项Gemini 3.5 Flash
模型 IDgemini-3.5-flash
输入限制 (Context Window)1,048,576 tokens
输出限制 (Max Output)65,536 tokens
支持的数据类型输入:文本、图片、视频、音频、PDF
输出:文本
输入价格 / 百万 Token$1.50
输出价格 / 百万 Token$9.00
缓存输入价格 / 百万 Token$0.15

提示:Google 官方强烈推荐使用最新的统一标准 SDK google-genai 来调用 gemini-3.5-flash。旧的 google-generativeai 库已被弃用。


Gemini 3.5 新特性

Gemini 3.5 引入了更细粒度的控制参数,允许开发者在延迟、成本和模型性能之间取得完美平衡。

1. 思考等级 (Thinking Level)

与过去粗暴开启/关闭思考或手动指定思考预算不同,Gemini 3.5 引入了 thinking_level 参数,用以限制模型在回答之前进行内部推理的深度。

  • MINIMAL:最低推理深度。最适合简单检索、分类任务或极致低延迟的聊天场景。
  • LOW:轻量级逻辑检查。适合普通级别的修改和对比。
  • MEDIUM(默认):平衡质量与速度。适合大多数日常复杂任务。
  • HIGH:最大推理深度。适合复杂的长链路规划、高难度算法编写及严谨的函数调用(Function Calling)。

示例代码 (Python google-genai SDK):

python
from google import genai
from google.genai import types

# 初始化客户端(会自动从环境变量读取 GEMINI_API_KEY)
client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="分析并找出这段多线程C++代码中的死锁或竞态条件: [代码内容]",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(
            thinking_level="HIGH"  # 开启最大深度思考以解决高难度编程问题
        )
    )
)

print(response.text)

2. 媒体分辨率 (Media Resolution)

在使用图像、视频或 PDF 等多模态输入时,不同复杂度的内容需要消耗不同的 Token 数量。Gemini 3.5 提供了 media_resolution 配置:

  • 支持级别LOWMEDIUMHIGHULTRA_HIGH(其中 ULTRA_HIGH 仅支持图像)。
  • 配置方式:既可以通过 generation_config 全局设置,也可以为每个媒体输入部分单独设置。例如:对包含密集小字表格的 PDF 使用 HIGH,对普通视频背景使用 LOW,大幅节省 Token 成本并提高处理速度。

行业采用与评价

各大主流开发者工具及知名企业均在第一时间接入并高度评价了 Gemini 3.5 (以及 3 系列模型):

  • GitHub Copilot & VS Code:在 GitHub 的早期测试中,Gemini 3 系列模型在解决实际软件工程挑战时的准确率相比上代模型提升了 35%
  • JetBrains & Junie:JetBrains 团队指出,3.5 Flash 不仅保持了 Flash 级别的极速响应和低成本优势,其代码和逻辑推理质量更是直逼 Pro 级旗舰,在低推理编程任务上的性能也比上一代 Flash 提升了 10–20%
  • Cursor:Cursor 团队评价其在前端生成质量上表现抢眼,完美适合处理复杂和更具野心的开发任务。
  • Shopify & Agentforce:利用 3.5 Flash 的强力多步工具调用和长上下文保持能力,自主执行长达数周的数据预测、商户增长和供应链分析等复杂 Agentic 工作流。

Gemini中文文档