华盛顿大学和脸谱网的研究人员使用深度学习将静止图像转换成逼真的动画循环视频。
他们的方法 将在即将召开的计算机视觉和模式识别会议( CVPR )上发布的这项技术模拟了连续的流体运动,如流动的水、烟和云,将静止图像转换成无缝循环的短视频。
“我们的方法的特别之处在于它不需要任何用户输入或额外的信息,” Aleksander Hołyński ,华盛顿大学计算机科学与工程博士生,项目负责人说。你只需要一张照片。它可以输出一个高分辨率的无缝循环视频,通常看起来像一个真实的视频。”
团队创建了一种称为“对称飞溅”的方法从静止图像预测过去和未来的运动,结合这些数据创建无缝动画。
“当我们看到瀑布时,我们知道水应该如何运动。火或烟也是如此。这些类型的运动遵循同一套物理规律,图像中通常有线索告诉我们物体应该如何运动ł y ń斯奇说我们很乐意将我们的工作扩展到更广泛的对象上,比如为一个人在风中吹拂的头发设置动画。我希望最终我们与朋友和家人分享的照片不会是静态的。相反,它们都是动态动画,就像我们的方法生成的动画一样。”
为了教他们的神经网络估计运动,研究小组在 1000 多个流体运动的视频(如瀑布、河流和海洋)上训练了这个模型。如果只给出视频的第一帧,系统将预测未来帧中应该发生的事情,并将其预测结果与原始视频进行比较。这种比较有助于模型改进对图像中每个像素是否应该移动以及如何移动的预测。
研究人员使用了 NVIDIA Pix2PixHD 用于运动估计网络训练的 GAN 模型,以及 FlowNet2 和 PWC-Net 。模型进行训练和推理都采用 NVIDIA GPU。培训数据包括 1196 个独特的视频, 1096 个用于培训, 50 个用于验证, 50 个用于测试。
关于作者
Clarissa Garza 是 NVIDIA 在 2021 夏天的企业传播实习生,她在波士顿大学新闻专业的第四年。在 NVIDIA ,她在 NVIDIA 的公司和开发者博客以及 AI 播客上工作。
审核编辑:郭婷
-
NVIDIA
+关注
关注
14文章
5496浏览量
109097 -
gpu
+关注
关注
28文章
5099浏览量
134464
发布评论请先 登录
基于米尔RK3576的环视实时性方案解析
【艾为视角】保证大方向正确!利用人工智能解决一线实际问题
360环视硬件平台为什么推荐使用米尔RK3576开发板?
人工智能行业如何使用for循环语句进行循环
利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能
挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器
挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!
米尔RK3576核心板,让360环视技术开发更简单
超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.
360环视技术推荐的硬件平台:支持多摄像头与三屏异显的理想选择
最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)
OpenAI攻克Sora视频创建错误率高难题
【「具身智能机器人系统」阅读体验】+初品的体验
研究人员利用激光束开创量子计算新局面
Lightricks与Shutterstock携手,推动开源LTXV视频人工智能生成式视频模型发展

人工智能研究人员利用静止图像创建循环视频
评论