2025年5月20日至21日,谷歌I/O开发者大会在美国加州山景城的海岸线圆形剧场隆重举行。作为谷歌年度最重要的技术盛会,本次大会围绕人工智能、跨设备整合、开发者工具等前沿领域展开,展示了谷歌在AI、多模态模型、跨平台应用等方面的最新成果。
一、Gemini 2.5 Pro:谷歌最强通用AI模型
谷歌在本次大会上推出了Gemini 2.5 Pro,这是迄今为止谷歌最强大的通用AI模型。该模型在大语言模型测评LLM Arena的所有类别排行榜上名列前茅,并且在热门AI代码编辑器Cursor上成为增长最快的模型。Gemini 2.5 Pro还新增了Deep Think模式,允许模型在回答问题前考虑多个答案,从而提升其推理能力。
二、智能体模式:AI助手的全新升级
谷歌宣布将在Chrome浏览器、搜索以及Gemini App中推出智能体模式(Agent Mode)。智能体可以与浏览器和其他软件进行交互和操作,能够同时管理多达10个任务,并将经验用于未来的案例。例如,用户可以要求Gemini App帮其找公寓,它会自动搜索房产网、调整筛选条件并预约看房。
三、Android XR:智能眼镜与头显的突破
谷歌在扩展现实(XR)领域取得了重要进展。本次大会展示了智能眼镜和头显Moohan。智能眼镜内建摄像头、骨传导音响与内嵌显示,能够识别物体、翻译语言、记住用户习惯,并通过语音控制AI导航、订位、拍照。头显Moohan则支持沉浸式地图、视频播放和交互式Gemini AI功能。
四、AI Studio:开发者工具的重大更新
谷歌推出了AI Studio的重大更新,新增原生语音模型,支持24种语言与主动音频识别。此外,谷歌还发布了多模态工具Stitches和实时部署能力,以加速AI模型的落地应用。这些工具的推出,将进一步降低开发门槛,加速创造过程。
五、Wear OS 6与Google Play:更多优化与功能
Wear OS 6为磁贴引入了统一字体,使应用外观更简洁,Pixel手表将支持动态主题,使应用颜色与表盘同步。谷歌还为Android开发者加强了Play商店功能,提供处理订阅的新工具、主题页面、音频样本以及更流畅的附加销售结账体验。
六、Beam 3D:沉浸式视频会议平台
谷歌推出了Beam 3D视频会议平台,使用多摄像头阵列和定制光场显示器,将2D视频流渲染成3D视觉效果,提供“更自然和深度沉浸式的对话体验”。Beam还支持实时语音翻译功能,能够保留原始说话者的语音、语调和表情。
七、Gmail与AI Workspace:智能化办公体验
Gmail新增了个性化智能回复和新的收件箱清理功能。此外,谷歌还宣布了大量即将推出的AI Workspace功能,覆盖Gmail、Google Docs和Google Vids,为用户提供更高效的内容创建和编辑方式。
谷歌I/O 2025开发者大会不仅展示了谷歌在AI和跨设备整合方面的强大实力,更通过一系列创新工具和功能,为开发者和用户开启了“模型即平台”的AI生态新时代。