北京时间5月20日凌晨1点,谷歌I/O 2026开发者大会在美国加州山景城开幕。与往年聚焦单一模型或功能不同,本次大会呈现出一次系统级转向:从搜索框到Chrome浏览器,从Android手机到智能眼镜,谷歌正将AI智能体全面嵌入所有核心入口。谷歌CEO桑达尔·皮查伊在开场演讲中表示,过去12个月谷歌发展迅猛,月处理Token达3.2千万亿个,同比增长7倍,Gemini应用月活跃用户达9亿。

一、Gemini 3.5 Flash:速度与智能的双重突破
大会的重头戏是Gemini 3.5 Flash的发布。谷歌表示,该模型融合了前沿模型的智能水平与Flash系列标志性的速度优势,是谷歌迄今为止最强大的智能体与编程模型。在多项权威测试中,Gemini 3.5 Flash全面超越了上一代旗舰Gemini 3.1 Pro:Terminal-Bench 2.1测试达76.2%(3.1 Pro为70.3%),MCP Atlas为83.6%,多模态理解CharXiv Reasoning达84.2%。更重要的是,Gemini 3.5 Flash的生成输出速度约为其他前沿模型的4倍,特别适合AI Agent和编码工具场景。谷歌计划于下个月推出更强的3.5 Pro版本。
二、Gemini Omni:任意输入皆可生成视频
DeepMind首席执行官德米斯·哈萨比斯登台发布了全新的视频生成模型Gemini Omni。这是一款基于谷歌在世界模型方面积累的新型模型,可以基于图片、音频、视频与文字等多种输入生成视频,并支持对话式编辑。用户可以通过自然语言修改角色、背景和场景,也可以上传自拍并将其转换成其他风格或内容。哈萨比斯称,未来Omni将能够根据任何输入生成任何输出,首款模型Gemini Omni Flash将于今年夏季推出。
三、Gemini Spark:全天候AI个人助理登场
皮查伊还发布了Gemini Spark,这是一款全天候运行的个人AI助手,基于Gemini 3.5构建,运行在Google Cloud虚拟机上。即便用户合上笔记本电脑,Spark也可以继续工作,同时也能在智能手机上运行。在演示中,Spark展示了策划街区派对的能力:汇总回复、追踪参与者物品、自动发送后续邮件、创建实时追踪器,甚至生成宣传册。Spark本周将面向受信任测试人员推出,下周面向美国Google AI Ultra订阅用户开放,起始价为100美元/月。
此外,谷歌还推出了Ask YouTube功能(对话式视频搜索)、Docs Live(语音协作文档)、Antigravity 2.0智能体编程平台、Android Halo手机AI智能体入口、AI Mode搜索智能体、Universal Cart智能购物车,以及与Gentle Monster、Warby Parker合作的Android XR智能眼镜。谷歌正通过这一系列产品,将AI智能体从概念变为触手可及的现实。


