您的位置:首页 >综合经验 >正文

谷歌让您比以往任何时候都更容易将照片转换成短视频

摘要 谷歌刚刚发布了一种新的人工智能模型,可以拍摄两张图像并填补空白,以创建看起来类似于实时照片的无缝动画。VDIM(带有扩散模型的视频插值)...

谷歌刚刚发布了一种新的人工智能模型,可以拍摄两张图像并填补空白,以创建看起来类似于实时照片的无缝动画。

VDIM(带有扩散模型的视频插值)由 Google 的研究部门 DeepMind 创建,使用一个图像作为第一帧,另一个图像作为最终帧。然后,它使用人工智能填充中间的所有镜头来制作视频。

这对于让您在孩子们玩耍的公园或在您忘记拍摄动作的活动中拍摄的一系列照片变得生动起来非常有用。

目前它还只是一项研究预览,但其基础技术有一天可能会成为使用智能手机拍照的日常部分。

VDIM 通过使用扩散模型创建丢失的帧,将静态图像转换为视频,类似于Midjourney、DALL-E 或 Google 自己的 Imagen 2 中的模型。

本质上,它使用这两个图像作为参考材料,就像Runway或 Pika Labs 可以从图像创建视频一样,但在这种情况下,它使用它们作为第一帧和最后一帧。

首先创建完整的最终视频的低分辨率版本。它通过按顺序运行级联扩散模型来不断优化视频来实现这一点。第一步允许 VDIM 捕获最终输出的运动和动态。

版权声明:本文由用户上传,如有侵权请联系删除!