谷歌让您比以往任何时候都更容易将照片转换成短视频

发布时间：2024-04-29 15:24:56来源：

谷歌刚刚发布了一种新的人工智能模型，可以拍摄两张图像并填补空白，以创建看起来类似于实时照片的无缝动画。

VDIM(带有扩散模型的视频插值)由 Google 的研究部门 DeepMind 创建，使用一个图像作为第一帧，另一个图像作为最终帧。然后，它使用人工智能填充中间的所有镜头来制作视频。

这对于让您在孩子们玩耍的公园或在您忘记拍摄动作的活动中拍摄的一系列照片变得生动起来非常有用。

目前它还只是一项研究预览，但其基础技术有一天可能会成为使用智能手机拍照的日常部分。

VDIM 通过使用扩散模型创建丢失的帧，将静态图像转换为视频，类似于Midjourney、DALL-E 或 Google 自己的 Imagen 2 中的模型。

本质上，它使用这两个图像作为参考材料，就像Runway或 Pika Labs 可以从图像创建视频一样，但在这种情况下，它使用它们作为第一帧和最后一帧。

首先创建完整的最终视频的低分辨率版本。它通过按顺序运行级联扩散模型来不断优化视频来实现这一点。第一步允许 VDIM 捕获最终输出的运动和动态。

免责声明：本答案或内容为用户上传，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如遇侵权请及时联系本站删除。

汽车装潢学校哪家好微信号让人盗了怎么办梦见自己砍蛇头是什么意思 lion是什么意思翻译 s9男刀最强连招加拿大说什么语言为主

汽车装具包括什么项目微信号如何第二次修改韩国lg是什么公司底特律变人怎么跳过片尾年夜饭是什么时候吃 lion中文意思是什么

微信号如何第二次修改微信号韩国lid防晒好用吗梦见自己看到女鬼预示着什么意思年夜饭是在哪一天吃的 LIPBALM是什么牌子 Miss姐上郭德纲孟非的非常了得了