0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达开发新AI算法,视频通话的流量最高压缩90%以上

工程师邓生 来源:量子位 作者:凹非寺 2020-12-02 14:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁。他们开发的新AI算法,可以将视频通话的流量最高压缩90%以上。

和其他视频相比,通话的场景比较单一,基本上只有人的头部在运动。因此只要能把头像数据大规模压缩,就能大大节约流量。

英伟达的新算法face vid2vid正是从这一点出发。只要一张图片,就能实现重建各种头部姿势图片。

H.264视频所需的带宽是这种新算法的2~12倍,从前面的演示也能看出,如果让二者使用相同比特率,那么H.264视频几乎不可用。

转动面部不扭曲

英伟达提供了一个试用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滚角)三个方向上任意旋转。

输入一张人脸,最多可以在每个方向上最多旋转30度。以下是三个方向上旋转到最大角度生成的图片。

与相比之前的方法,英伟达的这种技术即使在面部转动幅度较大时,人脸也不会扭曲变形。

然而,图片终究是不动的,要把生成的人脸放在运动的视频中还要多一个步骤。

合成面部视频

我们把上传的清晰照片作为源图像,从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。

而表情和姿势这两个数据可以通过关键点进行编码,这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可,从而节约了流量。

从源图像s中,我们得到了两组数据:关键点坐标x和雅可比矩阵J。这两组参数与面部的具体特征无关,只包含人的几何特征。

其中,雅可比矩阵表示如何通过仿射变换将关键点周围的局部补丁转换为另一幅图像中的补丁。如果是恒等雅可比矩阵,则补丁将直接复制并粘贴到新位置。

下图展示了计算前5个关键点的流程。给定源图像以及模型预测的规范关键点。

从运动视频估计的旋转和平移应用于关键点,带动头部姿势的变化。然后可以感知表情的变形将关键点调整为目标表情。

接下来开始合成视频。使用源和运动的关键点与其雅可比矩阵来估计流wk,从生成流组合成掩码m,将这两组进行线性组合即可产生合成流场w。

接着输入人脸面部特征f,即可生成输出图像y。

这种方法不仅能用于视频通话,也有其他“新玩法”。

比如觉得人物头像有点歪,可以手动输入纠正后的数据,从而将面部转正。

又或者是,把一个人的面部特征点和雅可比矩阵用于另一个人,实现面部视频动作的迁移。

团队简介

这篇文章的第一作者是来自英伟达的高级研究员Ting-Chun Wang。

文章的通讯作者是英伟达的著名研究员刘洺堉。

如果你长期关注CV领域,一定对这两位作者非常熟悉。他们在图像风格迁移、GAN等方面做出了大量的工作。

△ GauGAN

两人之前已经有过多次合作。比如。无监督图像迁移网络(NIPS 2017),还有从涂鸦生成照片的GauGAN(CVPR 2019),都是出自这二位之手。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4810

    浏览量

    98598
  • 开发
    +关注

    关注

    0

    文章

    380

    浏览量

    42242
  • AI
    AI
    +关注

    关注

    91

    文章

    41293

    浏览量

    302662
  • 视频通话
    +关注

    关注

    0

    文章

    49

    浏览量

    12452
  • 英伟达
    +关注

    关注

    23

    文章

    4116

    浏览量

    99644
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    硅光成AI胜负手?英伟20亿美元战略投资Marvell

    电子发烧友网报道(文 / 吴子鹏)当地时间 3 月 31 日(周二),全球市值最高的半导体企业英伟正式宣布,向美国半导体厂商迈威尔科技(Marvell,MRVL.US)战略投资 20 亿美元,将其
    的头像 发表于 04-06 07:02 1.2w次阅读

    企业级AI Agent王炸! 英伟GTC将开源 NemoClaw

    消息人士透露,英伟计划在下周在美国圣荷西举行的年度开发者大会前后正式公布 NemoClaw。据知情人士向 WIRED 透露,该平台允许企业部署 AI 代理为内部团队执行任务,且不限于
    的头像 发表于 03-10 11:35 9377次阅读
    企业级<b class='flag-5'>AI</b> Agent王炸! <b class='flag-5'>英伟</b><b class='flag-5'>达</b>GTC将开源 NemoClaw

    英伟电话会看Agentic AI推理与FPGA价值

    2026年2月,英伟发布2026财年Q4财报:营收681亿美元,同比增长73%,数据中心业务增长75%——预期中的超预期。更值得关注的,是电话会中反复出现的几个关键词:Agentic AI、推理
    的头像 发表于 03-04 17:07 1294次阅读
    从<b class='flag-5'>英伟</b><b class='flag-5'>达</b>电话会看Agentic <b class='flag-5'>AI</b>推理与FPGA价值

    英伟微通道液冷板技术全解析:原理、工艺、优势与产业适配

    随着AI算力的爆发式增长,英伟Rubin架构GPU等高端芯片的单芯片功耗已逼近2.2kW(2026年最新实测数据),局部热点热流密度最高可达650W/cm²,传统风冷彻底退场,单相液
    的头像 发表于 02-14 08:19 1941次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>微通道液冷板技术全解析:原理、工艺、优势与产业适配

    英伟重磅出手!AI 推理存储全面觉醒

    电子发烧友网报道(文/黄晶晶)近日,有消息称,英伟将以大约200亿美元收购人工智能芯片初创公司Groq,这将是英伟迄今为止规模最大的一笔收购。但
    的头像 发表于 12-26 08:44 1.2w次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>重磅出手!<b class='flag-5'>AI</b> 推理存储全面觉醒

    黄仁勋:英伟AI芯片订单排到2026年 英伟上季营收加速增长62%再超预期

    AI芯片总龙头英伟的财报终于带来了惊喜;英伟公司发布财报数据显示,上季营收加速增长62%;再超华尔街预期。业界都比较振奋,
    的头像 发表于 11-20 11:36 1474次阅读

    应用于暂态波形存储的数据压缩算法需要考虑哪些因素?

    、还原精度与关键特征保留:确保数据 “可用” 暂态波形的核心价值是支撑故障分析(如电压暂降原因定位、谐波源追溯),压缩算法需优先保障 关键信息不丢失 ,而非单纯追求高压缩比。 还原误差的可控性 需明确误差允许范围: 故障溯源
    的头像 发表于 11-05 15:02 445次阅读

    适用于中高压(最高90V)系统设计:FP135/136/137 高端电流检测芯片

    适用于中高压最高90V)输入的高端电流检测芯片。FP137适用于30V至48V的中压范围;FP135与FP136则适用于48V以上高压
    的头像 发表于 10-27 16:48 721次阅读
    适用于中<b class='flag-5'>高压</b>(<b class='flag-5'>最高</b><b class='flag-5'>90</b>V)系统设计:FP135/136/137 高端电流检测芯片

    今日看点:苹果认证中国快充品牌遭美调查;英伟拟向OpenAI投资最高1000亿美元

    英伟拟向OpenAI投资最高1000亿美元 近日,英伟和OpenAI宣布达成合作,包括建设庞大数据中心计划,以及
    发表于 09-23 10:09 507次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    的我我们讲解了这几种芯片的应用场景,设计流程、结构等。 CPU: 还为我们讲解了一种算法:哈希表算法 GPU: 介绍了英伟H100GPU芯片。使用了一下关键技术: ①张量
    发表于 09-12 16:07

    外媒:英伟开发新款中国特供芯片B30A 或为旗舰AI芯品B300的阉割版

    我们看到英伟的旗舰新品 B300备受关注;但是受限于美国实施出口限制措施,英伟不会出货,就像此前英伟
    的头像 发表于 08-20 15:19 4073次阅读
    外媒:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>正<b class='flag-5'>开发</b>新款中国特供芯片B30A 或为旗舰<b class='flag-5'>AI</b>芯品B300的阉割版

    继HBM之后,英伟带火又一AI内存模组!颠覆AI服务器与PC

    Attached Memory Module,即小型化压缩附加内存模组,是英伟主导开发的一种新型内存模块,是适用于数据中心 AI 服务器
    的头像 发表于 07-27 07:50 5046次阅读

    英伟AI人才,去了华为

    电子发烧友网综合报道 近日,英伟首席科学家比尔·戴利(Bill Dally)表示,美国对中国实施的人工智能出口管制禁令,让中国获得很大的发展空间,过去替英伟撰写程序的中国人工智能研
    的头像 发表于 06-06 00:05 7559次阅读

    德州仪器宣布与英伟合作,推动 AI 基础设施实现高效配电

    上海2025年5月28日 /美通社/ -- TI 技术将助力 NVIDIA 未来面向下一代 AI 数据中心的 800V 高压直流配电系统 前沿动态 德州仪器 (TI) 今日宣布,正与英伟
    的头像 发表于 05-28 16:07 705次阅读