2025谷歌开发者大会有哪些值得关注的内容?
Alphabet(GOOGL.O)谷歌年度最盛大的开发者大会Google I/O 2025于本周二和周三在加州山景城的海岸线圆形剧场举行。这是展示其全产品线发布动态的舞台,涵盖安卓、Chrome、谷歌搜索、YouTube,以及当然不可或缺的AI聊天机器人Gemini等众多领域。
谷歌还专门为安卓更新举办了一场独立活动。公司宣布了多项新功能,包括寻找遗失安卓手机和其他物品的新方式、Advanced Protection高级保护计划新增的设备级安全功能、防诈骗防盗的安全工具,以及全新设计语言Material 3 Expressive。
以下是Google I/O 2025公布的重磅内容:
Gemini Ultra
Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务“最高级别的访问权限”,月费为249.99美元。套餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的Deep Think模式。
订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用Gemini聊天机器人、基于Project Mariner技术的多项“智能代理”工具、YouTube Premium和Google Drive、Photos、Gmail的30TB存储空间。
Gemini 2.5 Pro的Deep Think模式
Deep Think是Gemini 2.5 Pro模型的一种“增强型推理模式”,可在回答前综合多个答案,提高模型在某些基准测试中的表现。
谷歌尚未详细介绍其具体原理,但其可能类似于OpenAI的o1-pro或即将推出的o3-pro,具备搜索和整合最佳解决方案的能力。
Deep Think目前通过Gemini API向“受信测试者”开放。谷歌表示将在更广泛推出前进行额外的安全评估。
Veo 3视频生成AI
谷歌称,Veo 3可生成音效、背景噪音,甚至是配音对白。画质方面也优于前代Veo 2。
Veo 3将从周二起上线Gemini聊天机器人应用,仅向Gemini Ultra订阅用户开放,可通过文字或图像提示生成视频内容。
Imagen 4图像生成AI
Imagen 4的速度比Imagen 3更快,未来还将发布比Imagen 3快十倍的版本。它能够生成布料、水珠、动物毛发等“精细细节”,支持写实与抽象风格,图像可达2K分辨率,多种尺寸比例。
Veo 3和Imagen 4都将为视频创作工具Flow提供核心支持。
Gemini应用更新
谷歌宣布Gemini系列应用月活跃用户数突破4亿。
Gemini Live将在本周向所有iOS和安卓用户开放摄像头与屏幕共享功能,借助Project Astra技术,用户可以与AI实现近实时语音互动,并实时共享手机画面。
未来数周,Gemini Live还将与谷歌生态其他应用深入整合,例如调用Google地图导航、创建日历事件、管理任务清单等。
此外,Deep Research功能升级,用户现在可上传私有PDF和图片生成研究报告。
Stitch
Stitch是一款AI工具,可用于设计网页和移动应用前端,用户只需几句话或一张图片,即可生成UI元素及HTML和CSS代码。
尽管Stitch的功能较部分“可视化编程”工具略有限制,但它提供了较高的自定义空间。
同时,谷歌扩大了开发者AI助手Jules的使用范围,Jules能帮助理解复杂代码、在GitHub上创建Pull Request、处理代码积压任务等。
Project Mariner
Project Mariner是谷歌的实验性AI代理,可代用户访问和操作网页。其现已更新,支持同时处理近十项任务,开始面向部分用户开放。
例如,用户无需打开第三方网站,只需与AI聊天即可完成购票或在线购物等任务。
Project Astra
Project Astra是由Google DeepMind推出的低延迟多模态AI项目,将为搜索、Gemini应用及第三方产品提供支持。谷歌也正与三星、Warby Parker等公司合作开发Project Astra眼镜,但尚未公布发布日期。
AI Mode
谷歌正在美国推出AI Mode —— 一种实验性的搜索功能,支持用户通过AI接口提出复杂的多段式问题。
AI Mode能处理涉及体育与金融的复杂数据查询,还提供服饰“试穿”功能。今夏晚些时候上线的Search Live将结合手机摄像头的实时画面支持基于视觉的搜索提问。
Gmail是首款支持个性化语境处理的应用。
Beam 3D视频会议
Beam(原名Starline)结合六摄像头阵列与定制光场显示器,让远程会议仿若面对面。其AI模型将不同角度的视频流合成为3D渲染图像。
Beam实现毫米级头部追踪与60帧/秒的视频流传输,结合Google Meet使用时,还可提供AI实时语音翻译,并保留原说话人的音色、语调与表情。
Google Meet本身也将支持实时语音翻译功能。
更多AI更新
Gemini将整合进Chrome浏览器,作为全新AI浏览助手,帮助用户快速理解页面内容并完成任务。
Gemma 3n是为手机、笔记本、平板优化的AI模型,周二起开启预览,支持音频、文本、图像与视频处理。
谷歌还为Gmail、Docs和Vids带来大量AI办公更新。Gmail将新增个性化智能回复与收件箱清理功能,Vids增强了内容创建与编辑功能。
NotebookLM将新增视频概览功能,同时谷歌上线了SynthID Detector —— 一个基于SynthID水印技术的AI内容识别平台。音乐生成模型Lyria RealTime也将通过API开放使用。
Wear OS 6
Wear OS 6引入统一字体,提升界面一致性;Pixel Watch将支持主题色同步,增强动态美感。
新设计平台将帮助开发者构建更丰富的个性化应用,并实现无缝的界面过渡。谷歌将提供开发者设计指南及Figma模板文件。
Google Play
谷歌为安卓开发者在Play商店新增多项工具,包括订阅管理、内容预览(如音频片段)、更流畅的支付流程等。
美国用户可访问“主题浏览”页面,快速发现与影视作品相关的应用。开发者还将获得专属的测试与发布页面及应用发布监控工具。遇到严重问题时,开发者可暂停应用发布。
订阅工具也获升级,支持多产品结账。开发者可在主订阅下销售附加服务,实现统一结账。
安卓Studio
安卓Studio将集成多项新AI功能,包括配合Gemini 2.5 Pro的“Journeys”(AI开发代理流程)与“Agent Mode”自动化开发功能。
此外,App Quality Insights面板的“崩溃洞察”功能也将由Gemini提供支持,帮助分析源码、定位崩溃原因并提供修复建议。
(责任编辑:现货银)
-
大家一退休,就是这种出海状态。...[详细]
-
截至2014年12月25日,永安自行车投后估值9亿元。...[详细]
-
举个例子 原标题:7页PPT教你秒懂互联网文案 10万+:月薪3千与月薪3万的文案,差别究竟在哪里? 不得不说,改的的确有吸引力。...[详细]
-
他们在2016年冬天启动了这个项目。...[详细]
-
摘要:在一张大家手都很松的桌子上是不要妄想用便宜的价格看翻牌的,就像是过去一段时间大量的资本涌入早期投资行业,让好多早期项目估值贵到离谱。...[详细]
-
在这里我得出的经验就是当发现问题和执行目标的时候,多问一问“是什么?”和“为什么?”因为主管说高效的工作70%在思考,30%在执行。...[详细]
-
document.writeln('关注创业、电商、站长,扫描A5创业网微信二维码,定期抽大奖。...[详细]
-
而这里的内容是笼统地称呼,包括入口的点击文案、图片,详情页的文案描述、图片质量,这些都是对应的运营需要把控的。...[详细]
-
这样在网站TDK中,就要区分关键词的难易度,把握地区市场,在进行其他地区的阶段性实施。...[详细]
-
第二,页面流量成为有效订单的转化比 优化的关键就是为网站提升有价值的流量,这就是笔者今天谈到的第二点要素,有了流量之后,尤其针对企业网站我们最终关注的还是转化,这边我们就要通过两方面去分析和思索...[详细]