0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI使用音频剪辑对与语音匹配的真实感面部建模

倩倩 来源:新经网 2020-04-11 10:40 次阅读

您是否曾经仅仅根据他们的声音来构造一个从未见过的人的心理形象?人工智能AI)现在可以做到这一点,仅使用简短的音频剪辑作为参考即可生成人脸的数字图像。

这个名为“ Speech2Face” 的神经网络(一种以类似于人脑的方式“思考”的计算机)经过科学家培训,接受了来自互联网的数百万个教育视频,显示了100,000多个不同的人在说话。

研究人员在一项新研究中写道,Speech2Face通过该数据集学习了语音提示与人脸某些物理特征之间的关联。然后,AI使用音频剪辑对与语音匹配的真实感面部建模。

值得庆幸的是,人工智能还不能仅仅根据他们的声音确切地知道特定的人是什么样。研究作者报告说,神经网络识别语音中的某些标记,这些标记指向性别,年龄和种族,是许多人共有的特征。

科学家写道:“因此,该模型只会产生看上去普通的面孔。” “它不会产生特定个人的图像。”

尽管坦率地说,对猫的解释有点让人恐惧,但AI已经证明它可以产生出异常准确的人脸。

由Speech2Face生成的脸部-均面向正面并具有中性表情-与声音背后的人并不完全匹配。但是,根据这项研究,这些图像通常确实可以捕捉到正确的年龄范围,种族和性别。

但是,该算法的解释远非完美。当面对语言变化时,Speech2Face表现出“混合表现”。例如,当AI收听亚洲人讲中文的音频片段时,该程序会产生亚洲人脸的图像。然而,据科学家报道,当同一个人用不同的音频片段讲英语时,人工智能产生了白人的面孔。

该算法还显示出性别偏见,将低音调的声音与男性面孔相关联,将高音调的声音与女性面孔相关联。研究人员写道,由于训练数据集仅代表YouTube上的教育视频,因此“并不代表整个世界人口。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数字图像
    +关注

    关注

    2

    文章

    117

    浏览量

    18628
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230600
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24351
收藏 人收藏

    评论

    相关推荐

    中兴努比亚发布全球首款5G+AI裸眼3D平板

    此平板采用Neovison 3D Anytime科技将2D画面即时转换为3D效果,增强观影及音乐娱乐体验的真实感。较前代产品而言,新设备在分辨率、亮度和色相等3D性能参数上都有大幅提升。
    的头像 发表于 02-27 14:51 301次阅读

    让机器拥有说话能力,智能语音音频处理SoC

    AI,还需要智能语音音频处理SoC。   智能语音音频处理SoC   所谓智能语音
    的头像 发表于 02-02 00:15 1943次阅读

    Adobe在Premiere Pro中引入AI音频编辑功能

    Adobe近日宣布,其视频剪辑软件Premiere Pro正式引入全新的AI驱动音频编辑功能。这一创新旨在解放剪辑师的双手,减少繁琐的操作,进一步提升工作效率。
    的头像 发表于 01-19 15:31 285次阅读

    英伟达推出NVIDIA ACE服务,提供AI模型和微服务制作虚拟数字

    总而言之,NVIDIA Ace是一个使机器人形象具备真实感乃至情感的创新性技术平台,无论是在云还是个人PC上都能流畅运行。已与之签约合作的公司有Convai、Charisma.AI、Inworld、米哈游、网易游戏、掌趣科技、腾讯游戏、育碧及UneeQ等。
    的头像 发表于 01-09 11:29 269次阅读

    在 NVIDIA ACE 中使用 AI 动画和语音功能打造逼真的虚拟形象

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE) 的一系列技术,增强了 AI 虚拟形象和数字人的真实感和可访问性,这些新的动画和语音功能实现了更自然的对话
    的头像 发表于 12-15 15:50 285次阅读
    在 NVIDIA ACE 中使用 <b class='flag-5'>AI</b> 动画和<b class='flag-5'>语音</b>功能打造逼真的虚拟形象

    如何在NVIDIA ACE中使用AI动画和语音功能打造逼真的虚拟形象呢?

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技术,增强了 AI 虚拟形象和数字人的真实感和可访问性,这些新的动画和语音功能实现了更自然的对话和情感表达。
    的头像 发表于 12-15 15:48 311次阅读
    如何在NVIDIA ACE中使用<b class='flag-5'>AI</b>动画和<b class='flag-5'>语音</b>功能打造逼真的虚拟形象呢?

    芯知识 | 什么是音频蓝牙播放语音芯片?

    随着科技的不断进步,音频蓝牙播放语音芯片成为嵌入式音频系统中备受关注的创新解决方案。本文将深入解析什么是音频蓝牙播放语音芯片,以及其在实现无
    的头像 发表于 12-15 08:36 322次阅读
    芯知识 | 什么是<b class='flag-5'>音频</b>蓝牙播放<b class='flag-5'>语音</b>芯片?

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵魂。本文将深入探讨语音数据集的重要性、构建方
    的头像 发表于 12-14 14:33 350次阅读

    真实感受:是智能家居在选择合适的技术!

    智能家居的智能体现在如何更方便地使用控制家居。例如,2.4G射频技术让遥控器更为有用,不受距离和干扰的限制,实现穿越障碍物继续传播,让2.4G芯片支持无线升级和低功耗易开发,同时提供便捷性和多样性。
    的头像 发表于 10-22 17:24 202次阅读

    三星Exynos 2400芯片亮相:CPU快70%,AI性能提高至14.7倍

    三星表示,exynos 2400具有最新amd rdna3架构的xclipse 940 gpu。该芯片展示了大幅提高的light traking功能,期待通过全域照明、反射、阴影渲染等多样的光学效果,提高游戏的真实感和投入感。
    的头像 发表于 10-08 11:34 523次阅读

    OpenAI发布第三版DALL-E

    谁可以使用该平台,因为有人批评DALL-E可以生成真实感的露骨图像,并在生成照片时显示出偏见。该公司于去年9月取消了候补名单,并向公众开放了DALL-E 2。
    的头像 发表于 09-25 16:39 443次阅读

    无缝切换矩阵:视频剪辑的利器

    随着视频内容的日益丰富,视频剪辑成为了一项重要的后期制作任务。而在视频剪辑过程中,讯维无缝切换矩阵无疑是一个非常实用的工具。本文将深入探讨讯维无缝切换矩阵的功能、使用方法、适用场景以及技术原理,帮助
    的头像 发表于 08-31 16:04 374次阅读
    无缝切换矩阵:视频<b class='flag-5'>剪辑</b>的利器

    灭火器操作虚拟仿真实训的独特优势

    虚拟现实(VR)技术在消防教育中的应用越来越广泛,其中之一就是灭火器操作虚拟仿真实训。与传统的灭火器模拟器相比,灭火器操作虚拟仿真实训具有以下独特之处: 真实感强:VR技术可以模拟真实
    的头像 发表于 07-24 15:53 346次阅读
    灭火器操作虚拟仿<b class='flag-5'>真实</b>训的独特优势

    Sonicverse:用于训练同时能够看和听的家居智能体的多感官仿真平台

    ,针对语义音频-视觉导航任务,作者提出了一种新的多任务学习模型,并展示了SONICVERSE通过模拟到真实环境的迁移所达到的真实感。 1 前言 本文介绍了SONICVERSE,一个新的具备多感官功能的模拟平台,用于训练
    的头像 发表于 07-05 10:20 287次阅读
    Sonicverse:用于训练同时能够看和听的家居智能体的多感官仿真平台

    如何在OpticStudio中建模和设计真实波片

    本文介绍了如何在 OpticStudio 中建模和设计真实的单色和消色差波片。它将演示如何使用双折射材料,通过构建评价函数来计算相位延迟,并使用 Universal Plot 将相位延迟与波片厚度的关系可视化。
    的头像 发表于 06-05 14:01 1071次阅读
    如何在OpticStudio中<b class='flag-5'>建模</b>和设计<b class='flag-5'>真实</b>波片