0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DVD-GAN机器人用AI生成高度逼真视频的一次重要的尝试

BFv1_robovideo 来源:陈年丽 2019-07-29 10:40 次阅读

近日,DeepMind的研究人员研发了一个名叫Dual Video Discriminator GAN(DVD-GAN)的人工智能模型,该模型通过能够通过学习一系列的YouTube视频数据集,生成高度逼真且连贯的256 x 256像素视频,最长可达48帧。

目前,DVD-GAN的研究成果已于美国时间2019年7月15日发表在arxiv上,名为《在复杂数据集上的高效视频生成(Efficient Video Generation on Complex Datasets)》。

AI造假视频比造假图片更难

最近,俄罗斯AI研究人员开发的FaceApp着实大火了一把,这款应用通过人工智能技术能够改变用户自拍照的年龄、外貌、发色和性别,甚至可以生成虚构的人物照片。这直接让人们近距离地感受了人工智能技术给我们的生活带来的乐趣。

但是否有人想过,有朝一日这些技术也能应用在视频领域呢?

如果说BigGAN是DeepMind在图像领域开发的能够生成高度逼真图像的图像生成器,那么DeepMind研究人员们开发的DVD-GAN,就是人工智能在视频剪辑生成领域的最新突破。

研究人员在论文中表示,生成自然视频对生成式建模来说是一个较大的挑战,同时还会受到数据复杂性和计算需求增加的困扰。

因此,之前业界的研究人员们在研究视频生成领域时,几乎都围绕着相对简单的数据集,或者采用有限的时间信息来降低任务的复杂程度。

而这次,DeepMind的研究人员们主要针对视频合成和视频预测的任务,将生成图像模型的强大功能和逼真效果扩展到视频领域。

DVD-GAN:基于BigGAN模型结构

研究人员们基于BigGAN的模型结构,构建了DVD-GAN的系统,并引入了一系列用于视频生成的调整,使DVD-GAN能够在Kinetics-600上进行训练。

Kinetics-600是一组由50万段10秒高分辨率的YouTube视频剪辑汇编而成的训练数据集,它最初是为识别人类动作而制作的,比目前其他常用的语料库还大一个数量级。

同时,研究人员们表示,Kinetics-600具有多样化特征,能消除他们对过拟合(Overfitting)的担忧。过拟合主要是指机器学习时选择的模型所包含的参数过多,以至出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。

另一方面,DeepMind的研究人员们利用生成对抗以提供一个能生成动作的学习信号

此外,DVD-GAN还有一个单独的Transformer模块,它可以让学习信息在整合AI模型中传播。

训练12至96小时即可生成视频

研究论文表明,在经过Google第三代TPU训练了12至96个小时后,DVD-GAN可以成功地生成视频,这些视频内容包含了物体的组成和运动,以及各种复杂的纹理。

不足的是,DVD-GAN生成的视频内容有时较为“诡异”,例如生成的物体和人形奇形怪状,甚至人体忽长忽短地变化。

但研究人员指出,当把DVD-GAN放在UCF-101(一个包含13320个人类动作视频的较小数据集)上进行评估后,DVD-GAN生成的样本初始值最高为32.97。

DeepMind的研究人员们希望能进一步强调在大型复杂视频数据集上训练生成模型的好处,例如Kinetics-600。

“我们设想通过DVD-GAN在这个数据集上建立强大的基线,该基线将被用作未来建模生成领域的参考点。”研究人员表示,“尽管在不受约束的环境下持续生成逼真的视频还需要进行很多工作,但我们相信DVD-GAN是我们朝这个方向迈出的重要一步。”

网络(GANs)来区分生成样本和真实世界样本,该网络主要由生成器和判别器两部分组成。

GANs曾被应用在把文字转换成一幕幕的场景故事,或生成人造星系图像等任务中。而研究人员们这次使用的是名为BigGANs的生成对抗网络,该网络以大批量和数百万个参数而得名。

值得一提的是,DVD-GAN包含两个判别器。一个是空间判别器(Spatial Discriminator:D_S),该判别器通过随机采样全分辨率帧并单独处理,以评估单个帧的内容和结构;另一个是时间判别器(Temporal Discriminator:D_T),它可以提供一个能生成动作的学习信号。

此外,DVD-GAN还有一个单独的Transformer模块,它可以让学习信息在整合AI模型中传播。

结语:用AI生成高度逼真视频的一次尝试

不管是BigGAN还是FaceApp,以往的研究人员们在人工智能生成图像领域进行了许多具有突破性的研究,但在视频领域,除了AI换脸曾火了一把之外,并没有更多的突破性进展。

而DeepMind的研究人员们基于BigGAN架构和Kinetics-600训练数据集开发的DVD-GAN,利用计算高效的判别器分解,扩展到时间更长、分辨率更高的视频。就目前来说,虽然这一成果还有些许不足,但这无疑是研究人员们利用AI生成高度逼真视频的一次重要尝试。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DVD
    DVD
    +关注

    关注

    3

    文章

    130

    浏览量

    61550
  • 人工智能
    +关注

    关注

    1776

    文章

    43808

    浏览量

    230572

原文标题:[机器人频道|大事记]你担心的就要成真,AI换脸不算啥,现在新AI可生成逼真视频

文章出处:【微信号:robovideo,微信公众号:机器人频道】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DIY推荐!自制个基于ESP32的沙画机器人

    作者在高二的时候就做过个非常基础的沙画机器人,现在准备去普渡大学上学了,正好也打算带上它,于是想着这俩年新学到的技能重新设计下之前的沙画机器
    发表于 04-15 15:09

    Arduino教学机器人的使用教程

    本文档的主要内容详细介绍的是Arduino教学机器人的使用教程
    发表于 09-27 06:53

    AI语音机器人,企业营销新选择

    机器人AI
    jf_86111705
    发布于 :2023年09月25日 17:11:01

    ai人工智能机器人

    的进行监控管理。 智能电话机器人的另个优势是不知疲倦,不需要休息和喝水,不需要休息。人在工作时就会有各种各样的脾气,但智能电话机器人不会,永远都以最严谨、最周到的态度和客户进行沟通。 在科技高速发展
    发表于 09-21 11:09

    电销ai机器人席卷电销市场

    机器人AI
    jf_86111705
    发布于 :2023年09月07日 18:28:07

    ai机器人打电话助力各行业

    机器人AI
    jf_86111705
    发布于 :2023年09月07日 18:20:45

    ai机器人

    人工智能AI机器人
    jf_86111705
    发布于 :2023年08月22日 16:06:28

    ai智能机器人

    机器人AI
    jf_86111705
    发布于 :2023年08月21日 15:59:56

    ai语音机器人

    机器人AI
    jf_86111705
    发布于 :2023年08月18日 15:05:25

    ai机器人的价值体现在哪里

    机器人AI机器人
    jf_86111705
    发布于 :2023年08月14日 17:32:24

    虹软图像深度恢复技术与生成AI的创新 生成AI助力

    当前,生成式人工智能(AI)技术的快速发展令人瞩目。它能够理解人类的描述,并在短时间内生成逼真的图像和视频。在
    发表于 06-21 09:06 307次阅读

    自编程机器人,售后难做吗?

    自编程是如何完成的。 自编程其实也不是很高深的问题。 当用户给出参数时,有时也包括逻辑。 例如用户说,如果设备打开完毕,执行个命令。 这个例子就包括了个如果。你的智能机器人只需要生成
    发表于 06-08 16:20

    如何快速地让机器人投入生产

    不能完成的技巧性的工作。 所以机器人种模拟人手的技巧性设备。它的主要内容就是。 绕 转 穿 钳 拿 放 给 总之,它的主要内容就是研究人手的基本动作。 而研究人手的动作的主要内容就是研究一次动作的每
    发表于 06-06 16:18

    什么是生成AI生成AI的四大优势

    生成AI是一种特定类型的AI,专注于生成新内容,如文本、图像和音乐。这些系统在大型数据集上进行训练,并使用机器学习算法
    发表于 05-29 14:12 2710次阅读

    浅谈儿童陪护机器人

    儿童陪护机器人越来越受到人们的关注,其中转动控制是其重要组成部分之。步进电机芯片作为种常用的控制芯片,被广泛应用于儿童陪护机器人中的转动
    发表于 05-11 15:12