Gemini 3.5 更新全览:从速度狂飙到“私人管家”,谷歌在 I/O 2026 上放了哪些大招?
Gemini 3.5 是谷歌在2026年Google I/O大会上发布的新一代大模型体系,同步亮相的还有全新的个人智能体与视频生成模型。这一代最核心的变化是:不再是简单的“问答工具”,而是朝着“能听懂、会思考、能动手干活”的AI系统大幅迈进。谷歌将这一重大转折点定义为正式进入“代理式AI时代”,全面转向智能体开发。普通用户很快能在手机、搜索和邮箱里用上这些新能力,开发者则能通过API直接调用其强大的执行功能。
本文大纲
- 🧬 模型体系:Flash 先行,Pro 稍后,还有“万能”生成器 Omni
- 📊 关键基准测试:用数据看清 3.5 的真实水平
- 🚀 应用革新:Spark 智能体、搜索与广告生态全面升级
- 💰 定价与可用性:钱包准备好了吗?
一、模型体系:Flash 先行,Pro 稍后,还有“万能”生成器 Omni
本次 Gemini 3.5 系列的首发、也是即日起向全球用户开放的模型是 Gemini 3.5 Flash。
Gemini 3.5 Flash:定位为“迄今最强大的智能体与编程模型”。它打破了以往“轻量模型性能弱”的刻板印象,具备前沿级推理能力,在多步骤任务执行、代码与应用自动生成等复杂智能体工作流中表现优异。谷歌宣称,它的生成速度比其他前沿模型快4倍,能够处理文本、图像、音频、视频和PDF等多种输入,并拥有高达100万 Token 的上下文窗口。
Gemini 3.5 Pro:更强大的版本,目前已在谷歌内部投入使用,并计划在下个月正式对外发布。
Gemini Omni:一个全新的多模态生成模型系列,它整合了谷歌的推理与创作能力,能“从任何输入创造任何内容”,实现对话式视频编辑。其首发版本 Omni Flash 已向部分订阅用户开放。
二、关键基准测试:用数据看清 3.5 的真实水平
通过一系列行业标准测试,我们可以直观地看到 Gemini 3.5 Flash 的性能到底处于什么梯队。
在衡量 Agent/工具调用能力的 MCP Atlas 基准测试中,它取得了 83.6% 的高分,超越了 Claude Opus 4.7 和 GPT-5.5 等竞品。在反映编程与多步骤任务执行的 Terminal-bench 2.1 测试中,它获得了 76.2% 的分数。而在评估真实经济价值编程任务的 GDPval-AA 基准中,其 1656 的 Elo 评分也超越了 Gemini 3.1 Pro 和多数公开模型。
不过,在 SWE-Bench Pro 这类深度编程工程测试中,它仍落后于 Claude Opus 4.7。但综合来看,作为一款轻量级模型,它已经具备与各厂商旗舰模型正面竞争的实力,并且在速度与成本上优势明显。
三、应用革新:Spark 智能体、搜索与广告生态全面升级
这些强大的模型能力,正通过四个层面的应用全面落地:
全新“神经表达”设计:Gemini App进行了自上而下的大改版,采用名为“Neural Expressive”的新设计语言,带来更流畅的动画、更直观的信息展示和触感反馈,极大提升交互体验。
Gemini Spark 个人智能体:这是一个24/7常驻后台的个人智能体。它可以自动完成如整理邮件、扫描账单、创建购物清单等任务,并能通过MCP协议在夏季晚些时候接入第三方工具。同时,新的“Daily Brief”功能也能结合用户日历和邮件,生成每日智能简报。
搜索框史诗级改版:谷歌搜索框被重构为一个智能“搜索助手”,支持自然语言、图片、文件、视频等多模态输入,并能主动进行连续对话和上下文理解。其后台由 Gemini 3.5 Flash 驱动,能为用户实时整合并主动推送所需信息。
广告与电商生态重塑:基于 Gemini 的全新“Ask Advisor”智能体,能打通广告、分析和电商后台,为营销人员提供一站式的数据洞察 and 任务执行服务。此外,谷歌还在AI模式下的搜索结果中测试了新一代由Gemini驱动的对话式广告格式。
四、定价与可用性:钱包准备好了吗?
目前,Gemini 3.5 Flash 已免费向全球用户开放,并已成为 Gemini App 和 Google 搜索 AI 模式的默认模型。
对于开发者,API调用价格为:
- 输入:每百万Token 1.50美元
- 输出:每百万Token 9.00美元
- 缓存输入:每百万Token 仅0.15美元
此外,谷歌也在调整订阅服务,全新推出的 Google AI Ultra 订阅计划定价为每月100美元。
总结
谷歌在2026 I/O大会上放出的Gemini 3.5系列更新,为AI从“被动问答”向“主动智能体”的转变提供了一个清晰的范本。对于需要整合多源信息、完成多步骤任务的企业来说,这种“能干活”的AI是降本增效的关键。
不过,要在复杂、严格的企业环境中平稳落地,需要可靠的执行力底座。实在Agent 通过“TARS大模型+ISSUT智能屏幕语义理解+RPA引擎”三位一体架构,正好弥补了模型“思考”与“执行”之间的断层,让AI能安全、合规、可追溯地在企业内部系统中完成复杂操作。目前,实在Agent已服务超5000家企业,覆盖金融、电商、跨境、制造业等领域,是智能化转型值得信赖的合作伙伴。
本文内容通过AI工具匹配关键字智能整合而成,仅供参考,实在智能不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系contact@i-i.ai进行反馈,实在智能收到您的反馈后将及时答复和处理。




