0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达开发新AI算法,视频通话的流量最高压缩90%以上

工程师邓生 来源:量子位 作者:凹非寺 2020-12-02 14:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁。他们开发的新AI算法,可以将视频通话的流量最高压缩90%以上。

和其他视频相比,通话的场景比较单一,基本上只有人的头部在运动。因此只要能把头像数据大规模压缩,就能大大节约流量。

英伟达的新算法face vid2vid正是从这一点出发。只要一张图片,就能实现重建各种头部姿势图片。

H.264视频所需的带宽是这种新算法的2~12倍,从前面的演示也能看出,如果让二者使用相同比特率,那么H.264视频几乎不可用。

转动面部不扭曲

英伟达提供了一个试用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滚角)三个方向上任意旋转。

输入一张人脸,最多可以在每个方向上最多旋转30度。以下是三个方向上旋转到最大角度生成的图片。

与相比之前的方法,英伟达的这种技术即使在面部转动幅度较大时,人脸也不会扭曲变形。

然而,图片终究是不动的,要把生成的人脸放在运动的视频中还要多一个步骤。

合成面部视频

我们把上传的清晰照片作为源图像,从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。

而表情和姿势这两个数据可以通过关键点进行编码,这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可,从而节约了流量。

从源图像s中,我们得到了两组数据:关键点坐标x和雅可比矩阵J。这两组参数与面部的具体特征无关,只包含人的几何特征。

其中,雅可比矩阵表示如何通过仿射变换将关键点周围的局部补丁转换为另一幅图像中的补丁。如果是恒等雅可比矩阵,则补丁将直接复制并粘贴到新位置。

下图展示了计算前5个关键点的流程。给定源图像以及模型预测的规范关键点。

从运动视频估计的旋转和平移应用于关键点,带动头部姿势的变化。然后可以感知表情的变形将关键点调整为目标表情。

接下来开始合成视频。使用源和运动的关键点与其雅可比矩阵来估计流wk,从生成流组合成掩码m,将这两组进行线性组合即可产生合成流场w。

接着输入人脸面部特征f,即可生成输出图像y。

这种方法不仅能用于视频通话,也有其他“新玩法”。

比如觉得人物头像有点歪,可以手动输入纠正后的数据,从而将面部转正。

又或者是,把一个人的面部特征点和雅可比矩阵用于另一个人,实现面部视频动作的迁移。

团队简介

这篇文章的第一作者是来自英伟达的高级研究员Ting-Chun Wang。

文章的通讯作者是英伟达的著名研究员刘洺堉。

如果你长期关注CV领域,一定对这两位作者非常熟悉。他们在图像风格迁移、GAN等方面做出了大量的工作。

△ GauGAN

两人之前已经有过多次合作。比如。无监督图像迁移网络(NIPS 2017),还有从涂鸦生成照片的GauGAN(CVPR 2019),都是出自这二位之手。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4764

    浏览量

    97291
  • 开发
    +关注

    关注

    0

    文章

    376

    浏览量

    42045
  • AI
    AI
    +关注

    关注

    90

    文章

    38361

    浏览量

    297495
  • 视频通话
    +关注

    关注

    0

    文章

    49

    浏览量

    12309
  • 英伟达
    +关注

    关注

    23

    文章

    4047

    浏览量

    97835
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    黄仁勋:英伟AI芯片订单排到2026年 英伟上季营收加速增长62%再超预期

    AI芯片总龙头英伟的财报终于带来了惊喜;英伟公司发布财报数据显示,上季营收加速增长62%;再超华尔街预期。业界都比较振奋,
    的头像 发表于 11-20 11:36 914次阅读

    应用于暂态波形存储的数据压缩算法需要考虑哪些因素?

    、还原精度与关键特征保留:确保数据 “可用” 暂态波形的核心价值是支撑故障分析(如电压暂降原因定位、谐波源追溯),压缩算法需优先保障 关键信息不丢失 ,而非单纯追求高压缩比。 还原误差的可控性 需明确误差允许范围: 故障溯源
    的头像 发表于 11-05 15:02 161次阅读

    适用于中高压(最高90V)系统设计:FP135/136/137 高端电流检测芯片

    适用于中高压最高90V)输入的高端电流检测芯片。FP137适用于30V至48V的中压范围;FP135与FP136则适用于48V以上高压
    的头像 发表于 10-27 16:48 163次阅读
    适用于中<b class='flag-5'>高压</b>(<b class='flag-5'>最高</b><b class='flag-5'>90</b>V)系统设计:FP135/136/137 高端电流检测芯片

    今日看点:苹果认证中国快充品牌遭美调查;英伟拟向OpenAI投资最高1000亿美元

    英伟拟向OpenAI投资最高1000亿美元 近日,英伟和OpenAI宣布达成合作,包括建设庞大数据中心计划,以及
    发表于 09-23 10:09 321次阅读

    外媒:英伟开发新款中国特供芯片B30A 或为旗舰AI芯品B300的阉割版

    我们看到英伟的旗舰新品 B300备受关注;但是受限于美国实施出口限制措施,英伟不会出货,就像此前英伟
    的头像 发表于 08-20 15:19 3215次阅读
    外媒:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>正<b class='flag-5'>开发</b>新款中国特供芯片B30A 或为旗舰<b class='flag-5'>AI</b>芯品B300的阉割版

    继HBM之后,英伟带火又一AI内存模组!颠覆AI服务器与PC

    Attached Memory Module,即小型化压缩附加内存模组,是英伟主导开发的一种新型内存模块,是适用于数据中心 AI 服务器
    的头像 发表于 07-27 07:50 4350次阅读

    英伟AI人才,去了华为

    电子发烧友网综合报道 近日,英伟首席科学家比尔·戴利(Bill Dally)表示,美国对中国实施的人工智能出口管制禁令,让中国获得很大的发展空间,过去替英伟撰写程序的中国人工智能研
    的头像 发表于 06-06 00:05 7078次阅读

    IBM携手英伟AI数据平台推动企业级AI创新

    近日,IBM(纽约证券交易所:IBM)宣布与英伟(纳斯达克股票代码:NVDA)开展全新合作,双方将基于英伟 AI 数据平台参考架构(re
    发表于 03-24 19:20 428次阅读

    英伟GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代
    的头像 发表于 03-20 15:35 1250次阅读

    新思科技亮相英伟GTC 2025大会

    为了实现这一速度提升,新思科技在GTC全球AI大会上宣布,正在使用英伟 CUDA-X库优化其下一代半导体开发解决方案。公司还在扩大对英伟
    的头像 发表于 03-19 17:53 1145次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应
    发表于 03-05 19:52

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    财年第四财季和全财年业绩数据上看,2025财年第四财季及全年的营收和利润都实现了大幅增长,大家特别关注的数据中心业务也是业绩增长的核心动力,展现出英伟AI领域的强大实力。而且英伟
    的头像 发表于 03-04 10:19 1009次阅读

    美银分析师:英伟加大“物理AI”投入为明智之举

    近日,美国银行的分析师对英伟在“物理AI”领域的最新动向发表了评论。分析师指出,英伟决定加大对“物理
    的头像 发表于 01-08 10:51 758次阅读

    英伟收购AI初创公司Run:ai

    :ai作为一家专注于AI云计算软件平台开发的初创公司,其产品以高效利用高性能GPU资源为核心,致力于为用户提供更快速、更便捷的机器学习加速方案。通过此次收购,英伟
    的头像 发表于 12-31 10:46 891次阅读

    微软大手笔采购英伟AI芯片

    据全球知名市场调研机构Omdia的最新估计,微软在2024年的英伟Hopper架构芯片采购计划上展现出了惊人的手笔。这一举动旨在帮助微软在构建下一代人工智能(AI)系统的激烈竞争中抢占先机。 据悉
    的头像 发表于 12-20 15:50 975次阅读