开云(中国)一站式服务官方网站 一文看懂谷歌I/O2026:Gemini 3.5领衔 谷歌打响智能体和全模态大战


出品|《立场》
作家|袁宁 丁广胜
山景城海岸线戏院,再次成为全球科技圈的焦点。
北京时分5月20日凌晨1点,2026 Google I/O精良登场。这个不错容纳两万多东说念主的露天戏院,每年皆一票难求。主会场坐满后,以至有不少东说念主坐到山坡草坪上,远远眺向舞台,恭候Google这位顶尖玩家亮牌。
现场的憎恶并不像一场传统开荒者大会,更像一场雄壮的科技派对。走过问口,使命主说念主员会情绪地和与会者击掌;进口隔邻有室外乐队扮演;戏院外则是大片Demo展区,Google各条业务线和合作伙伴皆在展示我方的最新家具与行使,比如来自中国的Xreal。开荒者、媒体、创业者、投资东说念主和合作伙伴穿梭其中,所有东说念主皆在恭候归拢个问题的谜底:
在大模子竞争过问智能体阶段后,Google准备奈何出牌?
畴昔一年,AI行业的叙事发生了显豁变化。OpenAI 依然是焦点,但 Anthropic 正在变得越来越 “抢镜”。据咱们了解,某种进程上,Google 的“假思敌”仍是不再仅仅 OpenAI,也启动越来越多地指向 Anthropic。
今天凌晨,Google CEO Sundar Pichai 给出了此次大会的中枢叙事:“Gemini 3.5和 Antigravity 正在开启一个智能体和智能体智力的新全国。咱们仍是把智能体带给开荒者和企业一段时分了。目下,咱们特地专注于把智能体的力量,以安全、可靠的方式带给销耗者,让它适用于每一个东说念主。”
在此次 I/O 上,Google 简直把所有中枢业务线皆重新用“智能体”串了一遍:从 Gemini 3.5 Flash,到 Gemini Omni Flash;从 Search 里的信息智能体、预订智能体,到 Gemini App 里的24/7个东说念主智能体 Gemini Spark;从开荒者平台 Antigravity,到购物场景里的 Universal Cart;再到 Workspace、YouTube、Flow、Android、Cloud 以及骨子溯源器用。
咱们看到,Google试图把 AI 从“复兴问题的模子”,股东到“抓续赞成、研讨、履行任务的系统”。不错说,2026 Google I/O,是 Google 全面押注 Agentic AI 的一次连结展示。
01 Gemini 3.5 Flash 登场:速率快4倍,“会举止的模子”将成默许进口
本届 I/O 最受关注,亦然最中枢的技能发布,依旧是Gemini。
但并非人人期待的Gemini 4,Google 发布了 Gemini 3.5模子家眷的首个成员 Gemini 3.5 Flash。Google 将其界说为“结合前沿智能与举止智力”的新一代模子,主打两个关键词:智能体智力和速率。
按照 Google 的说法,Gemini 3.5 Flash 是其目下最强的智能体和代码模子,在复杂长周期任务、代码生成、多模态赞成等方面均有权贵培植。Google 给出的 benchmark 包括:Terminal-Bench 2.1达到76.2%,GDPval-AA 达到1656 Elo,MCP Atlas 达到83.6%,CharXiv Reasoning 达到84.2%。
更要紧的是,Google 强调3.5 Flash 在输出速率上比其他前沿模子快4倍。这意味着它并不是单纯追求“更强硬模子”的道路,而是试图在智力、延迟和资本之间找到一个更恰当大限度家具化的均衡点。

这也解说了为什么 Google 首发的是 Flash,而不是 Pro。
畴昔大模子竞争强调“谁更强”,但过问2026年,家具化竞争更垂青“谁能以更低延迟、更低资本、更踏实地管事海量用户”。Flash 的定位正值契合这极少:智力弥散强,同期不错大限度铺进搜索、App、开荒者器用和企业平台。
凭据 Google 的安排,Gemini 3.5 Flash 将过问多个中枢场景:
● 面向平常用户,成为 Gemini App 和 Google Search AI Mode 的默许模子;
● 面向开荒者,过问 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio;
● 面向企业,过问 Gemini Enterprise Agent Platform 和 Gemini Enterprise。
据现场显现,Gemini 3.5 Pro 已在里面使用,筹划于下个月推出。这意味着 Google 会先用 Flash 连结限度化需求,再用 Pro 管事更复杂的高阶任务。
02 Gemini Omni Flash:从“赞成多模态”走向“生成轻易模态”
要是 Gemini 3.5 Flash 代表 Google 对“举止模子”的押注,那么 Gemini Omni Flash 则代表 Google 在多模态生成上的新贪心。
Google 对 Omni 的界说特地径直:不错从任何输入生成任何输出的模子,领先从视频启动。这句话背后,是多模态 AI 的范式变化。
畴昔的多模态更多是“输入多模态”:模子不错看图、听音频、赞成视频,再用笔墨复兴。但 Gemini Omni 要作念的是“输入和输出皆多模态”。用户不错用文本、图片、音频、视频动作输入,再生成高质料视频。将来,它还会支抓图像和音频等更多输出风物。

它的中枢智力包括三类。
● 第一,是通过当然说话剪辑视频。用户不错一语气对视频提议修改要求,比如变嫌环境、角度、动作、格调,以至加入脚色和物体。Google 强调,Omni 不错在多轮对话中保抓脚色一致性、物理逻辑和场景一语气性。
● 第二,是基于 Gemini 的全国常识生成视频。Google 示意,Omni 不仅仅生成“看起来确凿”的画面,而是能结合物理、历史、科学和文化语境,生成更有逻辑的视觉叙事。举例更准确地施展重力、动能、流体等物理遵循,或者把复杂主张更动为解说型视频。
● 第三,是从轻易素材启动创作。用户不错把文本、图片、视频,以至语音动作参考输入,生成统一格调的视频骨子。初期音频输入主要支抓语音参考,更多音频类型会在之后推出。
值得翔实的是,Google 还提到了数字化身功能。用户不错使用我方的声息创建个东说念主 avatar,让生成视频看起来和听起来像我方。但在视频剪辑中修改音频和语音的智力,Google 示意仍在测试,以更严慎地处理潜在风险。
在骨子安全方面,Omni 生成的视频将包含弗成感知的 SynthID 数字水印。用户不错通过 Gemini App、Chrome 中的 Gemini 以及 Google Search 考证视频是否由 Gemini Omni 生成。

(Sundar Pichai簸弄他不吃汉堡,这是假图)
从发布节拍看,Gemini Omni Flash 会向 Google AI Plus、Pro 和 Ultra 订阅用户全球推出,也会从本周起在 YouTube Shorts 和 YouTube Create App 中向用户免费怒放。将来数周内,Google 还将把它通过 API 提供给开荒者和企业客户。
这意味着,Google 不仅仅思作念一个视频生成器用,而是思把视频生成智力镶嵌通盘创作家生态:Gemini 负责个东说念主创作进口,Flow 负责专科使命流,YouTube Shorts 负责分发场景。
这套闭环,恰是 Google 比较许多纯 AI 创业公司的上风方位。
03 Gemini App 造成24/7个东说念主助理:Gemini Spark 是关键
Gemini App 也在此次 I/O 上迎来大更新。
Sundar Pichai 显现,畴昔一年 Gemini App 增长飞速:前年 Google I/O 时,Gemini 有4亿用户;本年月活仍是跳跃9亿,隐敝230个国度和地区、70多种说话。
新的 Gemini App 有几个要点变化。
● 领先是瞎想说话升级。Google 推出了新的 Neural Expressive 瞎想说话,包括更畅通的动画、更显然的花样、新字体和触觉响应。Gemini Live 也被径直整合进 Gemini,用户不错在笔墨发问和语音对话之间无缝切换。
● 其次是复兴形态的变化。Gemini 不再仅仅输出长文本,而是不错凭据问题及时瞎想谜底风物,加入图片、交互式时分线、旁白视频和动态图形。
● 第三,亦然最要紧的,是两个智能体功能:Daily Brief 和 Gemini Spark。
Daily Brief 是一个个性化晨间简报智能体,不错匡助用户整理每天启动前需要知说念的信息。
Gemini Spark 则是 Google 面向销耗者推出的个东说念主 AI agent。它会24/7运行,在用户授权和指示下匡助治理任务、处理数字生计。

此外,macOS 版 Gemini App 也会集成 Gemini Spark,使其不错在土产货机器上履行操作,并加入更强的语音功能。
Google 筹划先向 trusted testers 推出 Gemini Spark,并不才周面向好意思国 Google AI Ultra 用户推出 Beta。macOS 版 Gemini App 将来也会集成 Gemini Spark,使其不错在土产货机器上履行操作。
这对 Google 很要紧。因为它领有 Gmail、Calendar、Photos、Drive、Chrome、Android、Search、Maps 等高频家具。要是 Gemini Spark 能在用户授权下调遣这些管事,它就不仅仅聊天机器东说念主,而可能成为确凿的个东说念主任务调度层。
同期,Google 晓示推出 每月100好意思元的 AI Ultra 筹划,同期为 AI Plus、Pro 和 Ultra 订阅用户加多新功能和权柄。
04 Search 迎来25年最大改版:搜索框造成智能体进口
Google I/O 的另一个重磅更新,是 Search。
据先容,新的搜索框会动态推广,开云体育允许用户输入更复杂、更当然的问题;它不错给出 AI 驱动的问题建议,不再仅仅传统 autocomplete;它还支抓多模态输入,包括文本、图片、文献、视频和 Chrome 标签页。
更中枢的是,Google 正在把 Search 从“找谜底”造成“派任务”。
领先,AI Mode 将使用 Gemini 3.5 Flash 动作全球默许模子。用户不错从 AI Overview 径直不绝追问,过问 AI Mode 的对话式体验,并保留高下文。
其次,Google 推出了 Search agents。这类智能体不错在后台24/7运行,抓续追踪用户珍重的信息,并在合应时分给出轮廓更新。

比如,你正在找房,不错告诉 Search 预算、位置、户型、通勤和其他条款,信息智能体会抓续扫描网页、新闻、博客、酬酢信息,以及金融、购物、体育等及时数据,一朝发现匹配结果就见知用户。又比如,你关注某位换取员和品牌联名的球鞋,智能体也不错在新家具发布时领导。
这类信息智能体将率先在本年夏天面向 Google AI Pro 和 Ultra 订阅用户推出。
Google 还在推广 Search 中的 agentic booking 智力。用户不错让 Search 襄理寻找并预订土产货管事,比如周五晚上可容纳六东说念主、供应夜宵的私东说念主 KTV 包间。Search 会整合最新价钱和可用性,并给出径直预订团结。
在家政维修、好意思容、宠物照拂等部分品类中,用户还不错让 Google 代为给商家打电话。这些智力将于本年夏天在好意思国面向所有效户推出。
更有思象空间的是,Search 还将获取“生成式 UI”和“迷你行使”智力。
借助 Gemini 3.5 Flash 的代码智力,以及 Antigravity 的智能体开荒智力,Search 不错凭据用户问题即时生成交互界面。比如,当用户思赞成天体物理问题,或者思看懂机械表运行旨趣,Search 不错自动生成包含图表、表格、模拟器、交互组件的定制谜底。
更进一步,关于永久任务,比如婚典筹备、搬家治理、健康筹划,Search 不错生成一个可抓续使用的 dashboard 或 tracker。Google 把这类体验称为用户专属的 mini apps。
这其实是对搜索家具形态的一次根底改写。
畴昔,搜索结果页的中枢是团结、选录和告白。将来,它可能造成一个动态生成的任务操作台:既能赞成问题,也能生成器用,还能抓续追踪情景。
对 Google 来说,这既是留神,亦然迫切。留神在于,AI 聊天家具正在侵蚀传统搜索进口;迫切在于,Google 试图用智能体把搜索重新界说为更强的任务进口。
05 AI 购物:Universal Cart 是 Google 的“智能体买卖化”老师田
AI 时期,Google 最大的问题之一是:要是搜索结果不再以团结为中枢,告白和买卖化奈何办?
本届 I/O 给出的谜底之一,是 agentic commerce,也即是智能体购物。
Google 晓示推出 Universal Cart,一个智能购物车,亦然用户在 Google 上进行 AI 购物的中心。
购物自然恰当智能体。
因为用户确凿的购物需求不时很复杂,不是一个关键词能科罚的。比如买一台恰当出差的浮薄本,用户珍重的不仅仅价钱,还包括分量、续航、性能、接口、品牌、售后、优惠、库存、配送时分和用户评价。传统搜索需要用户反复筛选,智能体则不错抓续比较、监控价钱、组合商品,以至协助完成购买。
Universal Cart 的价值就在这里:它可能把 Search、Shopping、告白、商门户据和支付链路团结起来,让 AI 不仅仅推选商品,而是参与购物有筹划和来回进程。
这对 Google 具有计谋意旨。

畴昔,搜索告白的中枢是用户点击团结,然后跳转到商家页面。AI 搜索要是减少了用户点击,Google 就需要新的买卖闭环。智能体购物可能成为一种新旅途:Google 从信息分发者,造成来回有筹划和履行过程中的参与者。
但它也会带来新问题:AI 推选商品时怎么排序?是否会偏向告白主?用户怎么知说念推选依据?商家怎么适配这种新渠说念?这些皆将影响 AI 购物能否树立信任。
06从 Android Halo 到 Antigravity:Gemini 正成为系统级基础门径
当智能体启动替用户履行任务,Google 必须重新界说 AI 在系统里的位置。
一个很径直的问题是:要是 AI 不仅仅复兴问题,而是启动帮你搜索、预订、整理、生成、比较价钱、治理日程,用户奈何知说念它正在作念什么?又该在那里暂停、巡逻或摄取?
Google 给出的谜底之一,是 Android Halo。
这是一个将在本年晚些时候上线的 Android 新智力,用来在手机屏幕顶部娇傲智能体正在处理的任务。你不错把 Android Halo 赞成为智能体时期的情景栏。
畴昔,情景栏娇傲的是时分、电量、信号、见知;到了 AI 时期,系统还需要娇傲“你的智能体正在作念什么”。比如它正在搜索航班、整理文档、比较商品、生成视频、关联商家,或者后台抓续追踪某个任务。
这也讲明,Google 对智能体的赞成并不是单点行使,而是系统级智力。模子、行使、搜索、浏览器、操作系统之间的领域会越来越依稀,确凿的竞争会发生在“谁能成为用户所有任务的调度层”。
要是 Android Halo 科罚的是“用户怎么看见和适度智能体”,那么 Antigravity 科罚的即是“开荒者怎么构建智能体”。
Google 显然不但愿智能体智力只留在自家家具里。除了 Search、Gemini App 和 AI 购物,Google 还但愿通过 Antigravity,把 Gemini 的智力交给开荒者。
Antigravity 不错赞成为 Google 面向 agentic AI 时期的开荒平台。它的要点不是浅易调用一个大模子接口,而是让路发者八成构建、调度和部署多个合作式智能体。

畴昔的 AI 开荒,许多时候是“行使调用模子”:用户输入问题,模子返复兴案。但智能体时期的开荒逻辑更复杂。开荒者需要让 AI 赞成策画、拆解环节、调用器用、走访数据、履举止作、查验结果,并在必要时不绝迭代。
这就要求平台不仅仅提供模子,还要提供使命流、权限、器用调用、操心、评估和部署智力。
Antigravity 的价值就在这里:它思把 Gemini 从一个可调用的模子,造成一个可开荒、可组合、可部署的智能体平台。
这对 Google 很关键。因为智能体时期弗成能只靠 Google 我方开荒行使。确凿的爆发,需要开荒者基于 Gemini 作念出巨额新器用、新插件、新使命流和新行使。独一开荒者生态起来,Gemini 才能从 Google 我方的家具矩阵,蔓延到更庸碌的软件全国。
与此同期,Google 我方的“全家桶”也在不绝 AI 化。
● 在 Workspace 里,Gemini 会不绝过问 Gmail、Docs、Sheets、Slides、Meet 等办公场景,匡助用户写邮件、追忆文档、整快乐议、生成表格、制作演示和治理任务。对企业用户来说,这不是单点功能,而是把 AI 嵌进日常办公流。
● 在 YouTube 里,Gemini Omni Flash 和视频生成智力会进一步参与骨子创作,尤其是 Shorts。创作家不错用 AI 生成素材、修改镜头、转圜格调,以至把一个创意快速造成短视频骨子。
● 在 Flow 里,Google 更明确地把 AI 视频生成作念成创作使命流。比较一次性生成视频,Flow 的价值在于一语气剪辑、分镜治理和多轮转圜,让 AI 视频从“玩物”造成更接近专科出产的器用。
● 在 Pics / Photos 关联场景里,AI 会不绝承担图片生成、图片剪辑、视觉赞成和骨子整理的脚色。用户不再仅仅保存相片,而是不错让 AI 襄理修图、生成回忆、索求信息,以至围绕图片不绝创作骨子。
这些家具看似散布,但背后逻辑是一致的:Google 正在把 Gemini 放进每一个高频场景。
07 Google 果真凿意图:把 AI 作念成下一代操作层
把本届 I/O 的发布串起来,Google 的道路仍是特地了了。它不是单独发布几个 AI 功能,而是在搭建一套智能体时期的齐全系统:
● 模子层:Gemini 3.5 Flash 负责举止和代码,Gemini Omni Flash 负责多模态生成;
● 器用层:Antigravity、Gemini API、AI Studio、Android Studio 管事开荒者;
● 进口层:Search、Gemini App、Android、Chrome、Workspace、YouTube、Shopping 连结用户场景;
● 买卖层:AI Ultra、AI Plus、Pro、Universal Cart 和企业管事负责变现;
● 基础门径层:Google Cloud、TPU 和 Enterprise Agent Platform 守旧大限度部署;
● 治理层:SynthID、水印考证、骨子透明、安全框架和用户授权适度风险。
2026世界杯赛事竞猜中国官网而将来,Search 不再仅仅搜索结果页,而是任务进口;Gemini 不再仅仅聊天佑手,而是个东说念主 agent;Android 不再仅仅行使平台,而是智能体运行环境;Shopping 不再仅仅商品索引,而是来回智能体;Cloud 不再仅仅算力租借,而是企业智能体平台。
诚然,Google 的挑战也很践诺。
智能体要确凿替用户举止,必须科罚可靠性、阴私、安全、权限、误操作、可解说性和买卖利益突破等问题。尤其在搜索、购物、预订和个东说念主数据场景中,一次伪善推选、一次误拨电话、一次不对适的自动操作,皆可能损伤用户信任。
从2026年 Google I/O 看,Google 思界说的新阶段仍是很明确:智能体不再仅仅家具功能,而会成为新的基础门径;AI 不再仅仅信息器用,而会造成下一代操作层。

(Google I/O26主题演讲天团)