谷歌在近期举行的I/O开发者大会上宣布了一系列面向开发者的AI创作工具升级,旨在通过最新的Gemini模型家族 ,降低多媒体内容的生成门槛并提升效率。

此次更新的核心之一是推出了Gemini 3.5 Flash模型 。该模型已作为默认模型集成到Gemini应用和Google搜索的AI模式中。它专注于编码、智能体任务和真实工作流,相较于前代模型,其输出速度提升显著 ,据称是其他前沿模型的4倍。开发者可以利用它快速生成网页界面、互动组件,甚至将复杂论文转化为可视化学习卡片,为规模化AI应用的开发提供了更平衡的模型选择 。

在视频和多模态创作领域 ,谷歌发布了全新的Gemini Omni模型。该模型能够理解并处理文本 、图像、音频和视频输入,并生成连贯的视频内容。其最突出的特点是支持对话式编辑,用户只需用自然语言描述修改需求 ,如更换角色、调整光线或改变场景,模型便能自动完成编辑 。为应对安全与溯源挑战,所有由Omni生成的视频都将嵌入不可见的SynthID数字水印 ,以便识别AI生成内容。目前,Gemini Omni Flash版本已面向订阅用户开放,并将在未来通过API提供给开发者。

此外,谷歌也在将AI能力进一步融入开发与设计流程 。例如 ,Google Labs推出的免费设计工具Stitch,允许开发者通过自然语言对话生成用户界面原型,并可一键导出至Figma或HTML/CSS代码 ,将设计构思转化为可用资产的流程大幅缩短。