0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind发布VQ-VAE-2算法,将AI换脸的技术提升到了真假难辩的高度

WpOh_rgznai100 来源:YXQ 2019-06-19 09:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日DeepMind发布VQ-VAE-2算法,也就是之前VQ-VAE算法2代,这个算法从感观效果上来看比生成对抗神经网络(GAN)的来得更加真实,堪称AI换脸界的大杀器,如果我不说,相信读者也很难想象到上面几幅人脸图像都是AI自动生成出来的。

不过如此重要的论文,笔者还没看到专业性很强的解读,那么笔者就将VQ-VAE-2算法分为VQ,VAE,VQVAE2三部分来介绍原理,权当抛砖引玉。

什么是VQ

VQ是vector quantisationk(一般译作矢量量化)的缩写,他的主要思想是通过k-means算法进行聚类,将相近的点全部近似点簇的重心,从而在不损失太多信息的情况下对输入进行压缩。

k-means聚类算法:我在之前博客《终于把软微BING搜索-SPTAG算法的原理搞清了(https://blog.csdn.net/BEYONDMA/article/details/90578111)

也曾经介绍过k-means算法。算法先随机指定选取K个点做为初始聚集的簇心,分别计算每个样本点到 K个簇核心的余弦距离,找到距离最近的核心点,将它归属到对应的簇,所有点都归属到簇之后, M个点就分为了 K个簇。之后重新计算每个簇的重心,将其定为新的“核心”,重复上述步骤直到新核心不再改变为止或者改变距离达到一定值后中止。那么最终的K个簇就是最终的聚类结果。

k-means算法试图最小化失真,其定义为每个观测向量与其主质心之间距离的平方之和。通过迭代地将观测结果重新分类为星系团,并重新计算中心体,直到得到一个中心体稳定的构型,从而达到最小值。

那么VQ实际就是先把输入的图像进行-means聚类,完成后只保留最终留下的K个簇质心,簇上的其它点全部近似化为质心来进行存储,用这样的方式来进行压缩。

什么是VAE

VAE是variational auto encoding(一般译作变分自动编码),不过笔者感觉译为隐变更自动编码可能更贴切。VAE的主要思想是他认为图像、声音等信息是由多个隐变量(latent arrtibute),比如对于人的面部图像来说就由笑容,肤色、发色、发型等变量决定,那么VAE网络就先把图像中的笑容,肤色、发色、发型等变量识别出来,然后将这些变量传递给解码器生成图像。具体工作原理图如下:

VQ-VAE1代算法整体的工作方式

简单来讲VQ-VAE1代算法,在Encoder层计算latent arrtibute(隐向量)的向量族z,然后传递给隐层,在隐层按照刚刚所述的VQ算法进行压缩,然后输出给Decoder进行生成,其具体原理见下图。

如果要进行换脸,那么只要将人脸A的Encoder进行编码计算latent arrtibute(隐向量),然后输出给FaceB的Decoder进行生成即可完成。

VQ-VAE2代算法的更新

VQ-VAE2代其实总体和1代差别不大,主要将latent arrtibute(隐向量)分为top和bottom两层,其中top层记录整体细节主要是明亮度、色调等信息,而bottom层主要记录细节信息,从实际效果上看甚至包括了发丝、瞳孔等超级细微的层面。具体原理图如下:

VQ-VAE-2将AI换脸的技术提升到了真假难辩的高度

我在之前的博客《终于把AI换脸的原理搞清了》(https://blog.csdn.net/BEYONDMA/article/details/88365203)曾经介绍过deepfakes等项目的原理,不过之前那些换脸算法对于细节的把握程度远远达不到VQ-VAE-2的程度,从DeepMind的论文中可以看到,其生成效果之好、分辨率之高已经到达了刷新了笔者的认知极限。所以笔者最后也再次呼吁,不要将AI换脸技术用在歪路上。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296606
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    12132

原文标题:AI换脸技术再创新高度,DeepMind发布的VQ-VAE二代算法有多厉害?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    军规级可靠性:BT-CCD01-AI电芯正负极检测机在极端环境下的稳定性验证

    电芯正负极检测的精度与稳定性直接关系到产品安全与生产效率。然而,极端环境(如高温、高湿、粉尘污染等)往往成为检测设备的“试金石”。深圳比斯特自动化设备有限公司推出的BT-CCD01-AI电芯正负极检测机,凭借高可靠性设计,成功突破环境限制,质量管控
    的头像 发表于 11-29 15:05 73次阅读

    信息流全面转向AI推荐!马斯克称X本周内发布AI算法更新

    X 平台将于本周内发布更新后的“新”算法,据其表示,新算法更新后,X 实现完全的 AI 推荐。
    的头像 发表于 10-21 10:19 233次阅读
    信息流全面转向<b class='flag-5'>AI</b>推荐!马斯克称X本周内<b class='flag-5'>将</b><b class='flag-5'>发布</b><b class='flag-5'>AI</b><b class='flag-5'>算法</b>更新

    华为发布全球最强算力超节点和集群

    在华为全联接大会2025(HUAWEI CONNECT 2025)上,华为发布最强算力超节点和集群,并表示发展生态作为公司核心战略,提升到前所未有的战略高度。在计算领域,鲲鹏昇腾坚持
    的头像 发表于 10-10 17:29 1861次阅读

    利用主动短路技术电动自行车安全提升到高度

    自行车需求不断增长,设计人员和制造商面临着确保安全与可靠的重大设计挑战。 电动出行系统的核心架构是 低压牵引逆变电机 ,可在正常骑行时辅助蹬踏,并在上坡时减轻骑行者负担。通常位于车轮处的电机能将电能转化为机械能,或机械能
    的头像 发表于 10-10 10:19 9857次阅读
    利用主动短路<b class='flag-5'>技术</b><b class='flag-5'>将</b>电动自行车安全<b class='flag-5'>提升到</b>新<b class='flag-5'>高度</b>

    于无声处听惊雷:振动传感器在核电鼓泡测试中的精密守护—森瑟科技

    振动传感器与鼓泡测试的结合,是传统工艺与现代传感技术完美融合的典范。它让核电工程师拥有了能够“听见”纳米级泄漏的“超级耳朵”,泄漏检测的精度和可靠性提升到了前所未有的高度
    的头像 发表于 09-22 16:20 886次阅读
    于无声处听惊雷:振动传感器在核电鼓泡测试中的精密守护—森瑟科技

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    实例,从而保持高计算效率。 2、Q算法 Q项目大模型功能与A*和Q-learning等复杂算法结合,进一步推动了AI领域的蓬勃发展,标志着
    发表于 09-18 15:31

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新性的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,极大提升在职称评审中的竞争力。例如,在芯片设计中引入新的计算范式,如存算一体技术
    发表于 08-19 08:58

    通信不发愁,PROFINET转DEVICENET网关诊断解决方案状态监测提升到新水平

    PROFINET 诊断解决方案状态监测提升到新水平 生产基地,用于生产镁合金部件。该基地新增了四台超现代化压铸机,压铸压力分别为2500吨和1800吨。自新压铸机投入使用以来,客户一直使用开放式
    的头像 发表于 08-05 17:25 320次阅读
    通信不发愁,PROFINET转DEVICENET网关诊断解决方案<b class='flag-5'>将</b>状态监测<b class='flag-5'>提升到</b>新水平

    DevEco Studio AI辅助开发工具两大升级功能 鸿蒙应用开发效率再提升

    : 1、 实时检索验证:在生成阶段,系统首先从官方语料库中检索与用户输入最相关的片段,形成上下文约束。 主要实现技术: (1) 向量搜索:查询和文档嵌入到高维向量空间,通过计算相似度进行检索。 (2
    发表于 04-18 14:43

    《DNESP32S3使用指南-IDF版_V1.6》第六十章 猫检测实验

    验证 60.1 硬件设计1. 例程功能本章实验功能简介:使用乐鑫官方的ESP32-WHO AI库对OV2640和OV5640摄像头输出的数据进行猫检测。2. 硬件资源1)LED灯 LED-IO12
    发表于 04-01 09:28

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    和 Renesas一直致力于推动开源生态的发展,并积极合作打造高效、开放的计算平台。BPI-AI2N & BPI-AI2N Carrier 的发布,不仅为开发者提供了强大的硬件支持,也
    发表于 03-19 17:54

    在英特尔酷睿Ultra AI PC上用NPU部署YOLOv11与YOLOv12

    最新的英特尔 酷睿 Ultra 处理器(第二代)让我们能够在台式机、移动设备和边缘中实现大多数 AI 体验, AI 加速提升到新水平,在 AI
    的头像 发表于 03-03 15:32 2575次阅读
    在英特尔酷睿Ultra <b class='flag-5'>AI</b> PC上用NPU部署YOLOv11与YOLOv12

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ),设计定制化的FPGA架构,以优化性能和功耗。 2.提升跨领域技能• AI知识储备:掌握深度学习算法、模型量化和优化技术,以便更好地
    发表于 03-03 11:21

    AI赋能边缘网关:开启智能时代的新蓝海

    的引入彻底改变了这一局面。通过在边缘网关集成AI芯片和算法模型,使其具备了实时数据分析、智能决策和自主控制能力。在工业质检场景中,搭载AI算法的边缘网关能够实时识别产品缺陷,
    发表于 02-15 11:41

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌已将AI Studio团队整体转移至DeepMi
    的头像 发表于 01-13 14:40 1137次阅读