0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

香港大学最新提出!实现超现实的人类图像生成:HyperHuman

3D视觉工坊 来源:3DCV 2023-11-27 16:03 次阅读

1、导读

尽管大规模文本到图像模型取得了重大进展,但实现超现实的人类图像生成仍然是一项理想但尚未解决的任务。现有模型(例如稳定扩散和DALL·E2)往往会生成部分不连贯或姿势不自然的人体图像。为了应对这些挑战,我们的主要见解是,人类图像本质上具有多个粒度的结构,从粗粒度的身体骨骼到细粒度的空间几何。因此,在一个模型中捕获显式外观和潜在结构之间的这种相关性对于生成连贯且自然的人类图像至关重要。为此,我们提出了一个统一的框架HyperHuman,它可以生成高度真实和多样化布局的野外人类图像。具体来说:

我们首先构建一个以人类为中心的大规模数据集,名为HumanVerse,它由3.4亿张图像组成,具有人体姿势、深度和表面法线等全面注释。

接下来,我们提出了一种潜在结构扩散模型,该模型可以同时对深度和表面法线以及合成的 RGB 图像进行去噪。我们的模型在统一网络中强制执行图像外观、空间关系和几何形状的联合学习,其中模型中的每个分支在结构意识和纹理丰富性方面相互补充。

最后,为了进一步提高视觉质量,我们提出了一种结构引导细化器来组合预测条件,以更详细地生成更高分辨率。大量的实验表明,我们的框架具有最先进的性能,可以在不同的场景下生成超逼真的人类图像。

2、介绍

8792ce62-8cce-11ee-939d-92fbcf53809c.png

所提出的HyperHuman同时生成以文本和骨架为条件的粗略 RGB、深度、法线和高分辨率图像。可以创建逼真的图像和风格化的渲染。

87a5bbda-8cce-11ee-939d-92fbcf53809c.png

我们与最近的T2I模型进行比较,显示出更好的真实性、质量、多样性和可控性。请注意,在每个2x2网格(左)中,左上角是输入骨架,而其他部分是联合去噪的法线、深度和512x512的粗略 RGB。对于完整模型,我们合成的图像高达 1024x1024(右)

3、方法

87b31f6e-8cce-11ee-939d-92fbcf53809c.png

在潜在结构扩散模型(紫色)中,图像x、深度d和表面法线n对标题c和姿势骨架p进行联合去噪调节。在结构引导精炼器(蓝色)中,我们构建了更高分辨率生成的预测条件。请注意,灰色图像是指随机丢弃条件,以实现更稳健的训练。

4、实验

MS-COCO 2014 验证人类的零样本评估

87c22f7c-8cce-11ee-939d-92fbcf53809c.png

我们将我们的模型与最近的 SOTA 通用 T2I 模型(Stable Diffusion v1.5、v2.0、v2.1;SDXL;DeepFloyd-IF)和可控方法(ControlNet;T2I-Adapter;HumanSD)进行比较。请注意,SDXL 生成 512x512 的艺术风格,而 IF 仅创建固定大小的图像,我们首先生成 1024x1024 结果,然后针对这两种方法将大小调整回 512x512。

MS-COCO 2014 验证人类子集的评估曲线

87c6311c-8cce-11ee-939d-92fbcf53809c.png

我们展示了所有方法的FID-CLIP(左)和FID CLIP -CLIP(右曲线,CFG比例范围为4.0至20.0。

用户偏好比较

87e9f944-8cce-11ee-939d-92fbcf53809c.png

我们报告了用户更喜欢我们的模型而不是基线的比率

5、结论

我们提出了一种新颖的框架HyperHuman来生成高质量的野外人体图像。为了在统一网络中加强图像外观、空间关系和几何形状的联合学习,我们提出了潜在结构扩散模型,该模型可同时对深度和法线以及RGB进行去噪。然后我们设计了结构引导优化器来构建详细生成的预测条件。大量的实验证明我们的框架具有卓越的性能,可以在不同的场景下生成逼真的人类。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 框架
    +关注

    关注

    0

    文章

    297

    浏览量

    17045
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24356
  • 图像生成
    +关注

    关注

    0

    文章

    21

    浏览量

    6865

原文标题:香港大学最新提出!实现超现实的人类图像生成:HyperHuman

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是基于Zynq的人类生理模拟系统?

    模拟了营养物质的流动,这个模拟系统的意图在于研究人类不同器官对于各种各样体外药物治疗的反应情况,并且这个项目受到了美国国防部高级研究计划局(DARPA)的大力资助,告诉大家,什么是基于Zynq的人类生理模拟系统?图1:MIT和Continuum设计推出的“片上
    发表于 08-01 07:24

    香港大学首创光热电统一理论可解决LED灯泡发光不均与寿命问题

    目前LED照明市场急速扩增,预估在2018年可达到312亿美元,随着这股商机,更多的LED技术应运而生,香港大学首创“光热电统一”理论并研发新型LED驱动器与变压器,声称可以解决LED灯泡因长久使用而发光不均的问题,且LED灯泡的寿命也可延长到10年。
    的头像 发表于 12-27 10:40 5443次阅读

    香港大学借助基因工程造出世界首个人造心脏

    近日,一则世界首个人造心脏引发关注消息给人类带来福音,据报道称,世界首个人造心脏是由香港大学李登伟教授花费20年时间研发出来的。 香港大学研究人员使用干细胞,借助基因工程等技术,只需要几升血液,就能
    发表于 02-28 04:20 591次阅读

    一种用AR技术感受马格里特超现实的新玩法!

    美国旧金山现代艺术博物馆(SFMOMA)正在举办一场以超现实主义画家雷尼·马格里特(Rene Magritte)为主题的展览,参观者能够利用AR技术“置身于”画作中,欣赏马格里特震撼的作品。
    的头像 发表于 07-26 17:47 3666次阅读

    “世界大学学术排名(ARWU)”披露2018年度500强榜单

    值得注意的是,在中国内地成为世界百强的三大名校之后,中国港澳台地区排名最高的香港大学排在第101-150名区间段,而台湾大学香港中文大学都排在第151-200名之间。
    的头像 发表于 09-26 11:40 2.3w次阅读

    清华大学将与香港大学合作进行AI研究

    为了实现这一目标,赵汝恒教授说,香港大学和清华大学一直计划推出他们的第一个计算机科学双学士学位(dual undergraduate degree),最早将在2020年实施,该专业的学生将在
    的头像 发表于 12-03 09:55 3731次阅读

    香港大学发布新冠肺炎AI成果,准确率高达88%

    近日,香港大学统计与精算学系系主任尹国圣教授联合其他多位学者发表一篇最新论文,介绍了一个最新的新冠肺炎在线诊断系统。
    的头像 发表于 05-22 22:05 3492次阅读

    人体图像合成制作可信和逼真的人类图像

    技术和算法的开发和精进让AI换脸、AI克隆都成了可实现的事情。近日,上海科技大学团队的一项新研究,再一扩展了这一领域,其开发建立了人体图像合成——人体图像合成的目的是制作可信和逼真
    的头像 发表于 12-14 11:17 3228次阅读

    香港大学实现机器人触觉传感器的自解耦和超分辨率

    生物医学工程系申亚京教授课题组、香港大学计算机系潘佳教授课题组及其合作者,共同提出了一种基于磁性薄膜、类人类皮肤功能的触觉传感器,结合深度学习算法,实现了机器人触觉传感器的自解耦和超分
    的头像 发表于 03-03 17:49 2364次阅读

    基于生成式对抗网络的端到端图像去雾模型

    针对现有图像去雾算法严重依赖中间量准确估计的问题,提出了一种基于 Wasserstein生成对抗网络(wGAN)的端到端图像去雾模型。首先,使用全卷积密集块网络(FC- Dense N
    发表于 04-12 15:03 20次下载
    基于<b class='flag-5'>生成</b>式对抗网络的端到端<b class='flag-5'>图像</b>去雾模型

    香港大学机器鱼创下吉尼斯世界纪录

    Saad Shahid Anwel,下称萨德)告诉 DeepTech。 SNAPP 由香港大学机械工程系研发,目前还保持着一项于 2020 年创下的吉尼斯世界纪录:游完 50m 的水下路线只需耗时
    的头像 发表于 05-07 10:10 1523次阅读
    <b class='flag-5'>香港大学</b>机器鱼创下吉尼斯世界纪录

    基于残差生成对抗网络的人图像复原方法

    使用人脸轮廓直接生成人脸图像。然而,使用这些技术复原后的人图像在定性和定量分析时效果不够理想,并且复原时存在诸多的条件限制。因此,文中提出
    发表于 06-16 16:04 9次下载

    中科院&香港大学:使用新方法进行多任务学习的可穿戴传感器内储层计算

    。此外,训练传统的深度学习模型在边缘设备上既不可扩展也不可负担。 在这里,中科院和香港大学的研究团队提出了一种材料算法协同设计来模拟人类视网膜的学习范例,并且低开销。基于具有有效激子解离和贯穿空间电荷传输特性的瓶
    的头像 发表于 02-09 01:21 494次阅读

    激光雷达技术提供商Aeva宣布获得全球顶级车企定点,浅谈加速度传感器原理及其应用

    的优势。他们以人类眼睛工作原理为灵感,打造出一款神经形态量子传感器,并实现了被调制温度的测量。 图 | 从左至右:香港大学教授、黃毅()教授、教授(来源:资料图) 在现实生活之中,很多
    的头像 发表于 01-05 08:38 359次阅读
    激光雷达技术提供商Aeva宣布获得全球顶级车企定点,浅谈加速度传感器原理及其应用

    上海人工智能实验室发布自动驾驶视频生成模型GenAD

    上海人工智能实验室近日取得重大技术突破,联合香港科技大学、德国图宾根大学香港大学共同研发并发布了大规模自动驾驶视频生成模型——GenAD。
    的头像 发表于 03-26 10:40 183次阅读