今天凌晨,谷歌一年一度的I/O开发者大会开幕了。这次发布会让我最意外的不是某个新模型,而是谷歌整个战略方向的转变——他们不再把AI定位成"聊天机器人",而是明确提出要让它成为真正能替你干活的智能体。
三个改变格局的发布
第一个是Gemini 3.5 Flash。这个模型主打的是速度和成本——输出速度是其他前沿模型的4倍,价格却只有一半。从今天起,它已经成了Gemini应用和搜索的默认引擎。这意味着什么?AI不再是高高在上的技术,而是真正开始接地气、大规模商用了。
第二个是Gemini Omni。这个被谷歌称为"世界模型"的东西挺有意思,它能从文本、图像、视频、音频各种输入里生成任何形式的输出。更关键的是,它内置了物理引擎,能理解真实世界的运行规律。
第三个是Gemini Spark个人AI助手。这个我觉得是本次大会最有"超级应用"潜力的产品——它运行在谷歌云端,能7×24小时帮你处理邮件、日程、表格这些长链路任务。跟传统的"你问我答"完全不同,它是真正在后台帮你执行工作。
搜索25年来最大改版
新版搜索框支持图片、文件、视频上传,AI模式用户突破10亿。更重要的是,搜索里直接内置了Agent功能——你可以让它帮你追踪关注话题、预订服务、管理健康信息。
开发者这边,Antigravity升级到2.0,变成了独立桌面应用。现场演示里,它用Gemini 3.5 Flash配合93个子Agent,只花12小时、不到1000美元就搭建出了一套可运行的操作系统内核。
为什么这次不一样
回顾过去几年的AI发布会,各家都在比模型参数、跑分成绩。但今年I/O的核心词变成了"Agent"——从搜索框到办公套件,从开发工具到智能眼镜,谷歌在做一件系统性的事:让AI从"能回答问题"进化到"能完成任务"。
这背后的逻辑很简单:光会聊天不够,得真正能干活才算数。谷歌CEO皮查伊在发布会上引用了DeepMind哈萨比斯的话:"当我们回望这个时刻时,我想我们会意识到,我们正站在奇点的山脚下。"
不管这话是不是有点夸张,一个确定的事实是:AI Agent时代,比想象中来得更快。
