谷歌近日宣布,其 AI 工具包新增了一项强大功能:Vertex AI Media Studio。这是一个生成式工具套件,用户仅需输入文字提示,就能制作出精美的视频。该平台基于 Google Cloud 的 Vertex AI 构建,集成了谷歌多种先进模型,涵盖视频制作的各个方面,包括画面、配音和背景音乐,用户无需任何视频编辑或编程经验。

使用者可先借助谷歌的图像生成模型 Imagen 3 创建图片,然后再通过视频生成模型 Veo 2 将图片转换为视频。Veo 2 还提供了一些自定义工具。谷歌表示,Veo 允许用户选择摄像机运动方式(如无人机视角或平移镜头)、调整帧率、设置视频时长等。如果模型添加了用户不喜欢的元素,还可通过类似 Pixel 手机中“魔术橡皮擦”的功能将其移除。
完成画面制作后,Media Studio 会调用谷歌的语音合成模型 Chirp 添加配音。最后,由谷歌 DeepMind 与 YouTube 联合开发的音乐生成模型 Lyria 为视频生成背景音乐。
理论上,这一整套流程可以在 Vertex AI Studio 的统一工作界面内完成,最终生成一个看起来专业、听起来悦耳的成品视频,用户可以立即分享。这也是开发者测试谷歌最新 Gemini 模型的控制台。
Vertex AI 是承载这些工具的广义平台,它提供对Gemini模型的访问。谷歌称,Gemini 可以处理文本、图像、代码等多种数据类型,从而生成多样化的输出内容。无论是开发者还是普通用户,都可以在 Vertex AI Studio 这一原型环境中测试提示词,并微调AI模型来完成特定任务。
尽管这些新工具在简化内容创作方面前景广阔,但也引发了关于真实性、人类创意以及 AI 责任使用的老问题。不过,谷歌显然押注于这样的趋势:越来越多缺乏剪辑技能的用户将会欢迎这种只需几次点击就能生成高质量品牌视频的便捷方式。