0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能研究人员利用静止图像创建循环视频

星星科技指导员 来源:NVIDIA 作者:Clarissa Garza 2022-04-26 15:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

华盛顿大学和脸谱网的研究人员使用深度学习将静止图像转换成逼真的动画循环视频。

他们的方法 将在即将召开的计算机视觉和模式识别会议( CVPR )上发布的这项技术模拟了连续的流体运动,如流动的水、烟和云,将静止图像转换成无缝循环的短视频。

“我们的方法的特别之处在于它不需要任何用户输入或额外的信息,” Aleksander Hołyński ,华盛顿大学计算机科学与工程博士生,项目负责人说。你只需要一张照片。它可以输出一个高分辨率的无缝循环视频,通常看起来像一个真实的视频。”

团队创建了一种称为“对称飞溅”的方法从静止图像预测过去和未来的运动,结合这些数据创建无缝动画。

“当我们看到瀑布时,我们知道水应该如何运动。火或烟也是如此。这些类型的运动遵循同一套物理规律,图像中通常有线索告诉我们物体应该如何运动ł y ń斯奇说我们很乐意将我们的工作扩展到更广泛的对象上,比如为一个人在风中吹拂的头发设置动画。我希望最终我们与朋友和家人分享的照片不会是静态的。相反,它们都是动态动画,就像我们的方法生成的动画一样。”

为了教他们的神经网络估计运动,研究小组在 1000 多个流体运动的视频(如瀑布、河流和海洋)上训练了这个模型。如果只给出视频的第一帧,系统将预测未来帧中应该发生的事情,并将其预测结果与原始视频进行比较。这种比较有助于模型改进对图像中每个像素是否应该移动以及如何移动的预测。

研究人员使用了 NVIDIA Pix2PixHD 用于运动估计网络训练的 GAN 模型,以及 FlowNet2 和 PWC-Net 。模型进行训练和推理都采用 NVIDIA GPU。培训数据包括 1196 个独特的视频, 1096 个用于培训, 50 个用于验证, 50 个用于测试。

关于作者

Clarissa Garza 是 NVIDIA 在 2021 夏天的企业传播实习生,她在波士顿大学新闻专业的第四年。在 NVIDIA ,她在 NVIDIA 的公司和开发者博客以及 AI 播客上工作。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109097
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134464
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于米尔RK3576的环视实时性方案解析

    与功能实现程序流程图一套标准的360环视处理流水线已在开发板上成功实现,验证了其功能可行性:1.传感器配置: 4路720P分辨率鱼眼摄像头,精确固定于模拟车辆的四周。2.核心处理流水线:畸变矫正: 利用
    发表于 11-28 16:57

    【艾为视角】保证大方向正确!利用人工智能解决一线实际问题

    改变作业模式人工智能的核心在于应用,研究海量重复性活动的智能化自动化,提升人的效率和辅助人的工作。在人工智能和自动化推动过程中,要关注交付服务流程以及
    的头像 发表于 09-26 19:03 500次阅读
    【艾为视角】保证大方向正确!<b class='flag-5'>利用人工智能</b>解决一线实际问题

    360环视硬件平台为什么推荐使用米尔RK3576开发板?

    画面,天然契合 360 环视的多视角覆盖诉求。低延迟 RTSP 推流:在米尔优化方案中,RK3576 将多路视频进行 RGA 图像预处理与 VPU 硬件编码(H.264),经网络 RTSP 推流 到
    发表于 09-19 17:38

    人工智能行业如何使用for循环语句进行循环

    人工智能行业可以使用以下是关于for循环在不同编程语言中的基本用法说明: Python中的for循环: 主要用于遍历序列(列表、元组、字符串等) 典型结构:for item in sequence
    的头像 发表于 09-10 12:55 394次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    应用。 为什么选择 Neuton 作为开发人员,在产品中使用边缘人工智能的两个最大障碍是: ML 模型对于您所选微控制器的内存来说太大。 创建自定义 ML 模型本质上是一个手动过程,需要高度的数据科学知识
    发表于 08-31 20:54

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    米尔RK3576核心板,让360环视技术开发更简单

    360环视开发为何难?问题出在硬件选型上近年来,360环视技术已经从高端汽车逐渐普及到智能机器人、无人配送车辆和工业视觉设备中。通过拼接多个摄像头图像,360
    发表于 08-06 18:13

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    360环视技术推荐的硬件平台:支持多摄像头与三屏异显的理想选择

    智能硬件不断升级的今天,360环视技术早已不只是豪华车型的专属。通过布置多路摄像头,并将其图像进行融合处理,360环视可以为系统提供车辆或设备周围的完整视野。 它不仅能够消除盲区,还
    发表于 07-30 17:32

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究智能工具,大模
    发表于 07-04 11:10

    OpenAI攻克Sora视频创建错误率高难题

    人工智能与多媒体技术的交叉领域,OpenAI近期宣布了一项重要进展:成功解决了Sora视频创建过程中错误率高的问题。这一突破不仅标志着OpenAI在视频处理技术上取得了显著进步,也为
    的头像 发表于 12-31 10:37 842次阅读

    【「具身智能机器人系统」阅读体验】+初品的体验

    《具身智能机器人系统》 一书由甘一鸣、俞波、万梓燊、刘少山老师共同编写,其封面如图1所示。 本书共由5部分组成,其结构和内容如图2所示。 该书可作为高校和科研机构的教材,为学生和研究人员提供系统
    发表于 12-20 19:17

    研究人员利用激光束开创量子计算新局面

    突破,通过利用光的独特特性,为先进的量子计算提供了一种更简单、更具成本效益的方法。这一发展有可能加速物流、金融和人工智能等领域的复杂计算。这项研究以编辑推荐的形式发表在《APL Photonics》杂志上。 Wits光学领域 O
    的头像 发表于 12-18 06:24 580次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>利用</b>激光束开创量子计算新局面

    Lightricks与Shutterstock携手,推动开源LTXV视频人工智能生成式视频模型发展

    Shutterstock与Lightricks的合作是全新数据授权模式的首次实践,旨在为人工智能模型的训练开辟全新路径 耶路撒冷和纽约2024年12月15日 /美通社/ -- 全球领先的人工智能驱动
    的头像 发表于 12-15 09:31 734次阅读
    Lightricks与Shutterstock携手,推动开源LTXV<b class='flag-5'>视频</b><b class='flag-5'>人工智能</b>生成式<b class='flag-5'>视频</b>模型发展