Gemini 3.5 更新全览：从速度狂飙到“私人管家”，谷歌在 I/O 2026 上放了哪些大招？

Gemini 3.5 是谷歌在2026年Google I/O大会上发布的新一代大模型体系，同步亮相的还有全新的个人智能体与视频生成模型。这一代最核心的变化是：不再是简单的“问答工具”，而是朝着“能听懂、会思考、能动手干活”的AI系统大幅迈进。谷歌将这一重大转折点定义为正式进入“代理式AI时代”，全面转向智能体开发。普通用户很快能在手机、搜索和邮箱里用上这些新能力，开发者则能通过API直接调用其强大的执行功能。

本文大纲

🧬 模型体系：Flash 先行，Pro 稍后，还有“万能”生成器 Omni
📊 关键基准测试：用数据看清 3.5 的真实水平
🚀 应用革新：Spark 智能体、搜索与广告生态全面升级
💰 定价与可用性：钱包准备好了吗？

Gemini 3.5 更新全览：从速度狂飙到“私人管家”，谷歌在 I/O 2026 上放了哪些大招？_图1

图源：AI生成示意图

一、模型体系：Flash 先行，Pro 稍后，还有“万能”生成器 Omni

本次 Gemini 3.5 系列的首发、也是即日起向全球用户开放的模型是 Gemini 3.5 Flash。

Gemini 3.5 Flash：定位为“迄今最强大的智能体与编程模型”。它打破了以往“轻量模型性能弱”的刻板印象，具备前沿级推理能力，在多步骤任务执行、代码与应用自动生成等复杂智能体工作流中表现优异。谷歌宣称，它的生成速度比其他前沿模型快4倍，能够处理文本、图像、音频、视频和PDF等多种输入，并拥有高达100万 Token 的上下文窗口。

Gemini 3.5 Pro：更强大的版本，目前已在谷歌内部投入使用，并计划在下个月正式对外发布。

Gemini Omni：一个全新的多模态生成模型系列，它整合了谷歌的推理与创作能力，能“从任何输入创造任何内容”，实现对话式视频编辑。其首发版本 Omni Flash 已向部分订阅用户开放。

二、关键基准测试：用数据看清 3.5 的真实水平

通过一系列行业标准测试，我们可以直观地看到 Gemini 3.5 Flash 的性能到底处于什么梯队。

在衡量 Agent/工具调用能力的 MCP Atlas 基准测试中，它取得了 83.6% 的高分，超越了 Claude Opus 4.7 和 GPT-5.5 等竞品。在反映编程与多步骤任务执行的 Terminal-bench 2.1 测试中，它获得了 76.2% 的分数。而在评估真实经济价值编程任务的 GDPval-AA 基准中，其 1656 的 Elo 评分也超越了 Gemini 3.1 Pro 和多数公开模型。

不过，在 SWE-Bench Pro 这类深度编程工程测试中，它仍落后于 Claude Opus 4.7。但综合来看，作为一款轻量级模型，它已经具备与各厂商旗舰模型正面竞争的实力，并且在速度与成本上优势明显。

三、应用革新：Spark 智能体、搜索与广告生态全面升级

这些强大的模型能力，正通过四个层面的应用全面落地：

全新“神经表达”设计：Gemini App进行了自上而下的大改版，采用名为“Neural Expressive”的新设计语言，带来更流畅的动画、更直观的信息展示和触感反馈，极大提升交互体验。

Gemini Spark 个人智能体：这是一个24/7常驻后台的个人智能体。它可以自动完成如整理邮件、扫描账单、创建购物清单等任务，并能通过MCP协议在夏季晚些时候接入第三方工具。同时，新的“Daily Brief”功能也能结合用户日历和邮件，生成每日智能简报。

搜索框史诗级改版：谷歌搜索框被重构为一个智能“搜索助手”，支持自然语言、图片、文件、视频等多模态输入，并能主动进行连续对话和上下文理解。其后台由 Gemini 3.5 Flash 驱动，能为用户实时整合并主动推送所需信息。

广告与电商生态重塑：基于 Gemini 的全新“Ask Advisor”智能体，能打通广告、分析和电商后台，为营销人员提供一站式的数据洞察 and 任务执行服务。此外，谷歌还在AI模式下的搜索结果中测试了新一代由Gemini驱动的对话式广告格式。

四、定价与可用性：钱包准备好了吗？

目前，Gemini 3.5 Flash 已免费向全球用户开放，并已成为 Gemini App 和 Google 搜索 AI 模式的默认模型。

对于开发者，API调用价格为：

输入：每百万Token 1.50美元
输出：每百万Token 9.00美元
缓存输入：每百万Token 仅0.15美元

此外，谷歌也在调整订阅服务，全新推出的 Google AI Ultra 订阅计划定价为每月100美元。

总结

谷歌在2026 I/O大会上放出的Gemini 3.5系列更新，为AI从“被动问答”向“主动智能体”的转变提供了一个清晰的范本。对于需要整合多源信息、完成多步骤任务的企业来说，这种“能干活”的AI是降本增效的关键。

不过，要在复杂、严格的企业环境中平稳落地，需要可靠的执行力底座。实在Agent 通过“TARS大模型+ISSUT智能屏幕语义理解+RPA引擎”三位一体架构，正好弥补了模型“思考”与“执行”之间的断层，让AI能安全、合规、可追溯地在企业内部系统中完成复杂操作。目前，实在Agent已服务超5000家企业，覆盖金融、电商、跨境、制造业等领域，是智能化转型值得信赖的合作伙伴。

金融服务商

通信运营商

零售电商

跨境电商

政府及公共服务

能源及制造业

医药行业

更多行业客户

Gemini 3.5 更新全览：从速度狂飙到“私人管家”，谷歌在 I/O 2026 上放了哪些大招？

本文大纲

一、模型体系：Flash 先行，Pro 稍后，还有“万能”生成器 Omni

二、关键基准测试：用数据看清 3.5 的真实水平

三、应用革新：Spark 智能体、搜索与广告生态全面升级

四、定价与可用性：钱包准备好了吗？

总结

热门文章推荐

相关新闻

百渠物流轨迹查询，Agent如何告别手动逐一核查

智能文档如何做到可视化展示

物流数据能自动同步到客户端的追踪平台吗？企业级智能体如何重塑供应链可见性

立即领取行业头部企业 AI 应用案例