百度最新AI算法就能克隆任何人的声音！只需 3.7 秒!-电子发烧友网

仅需3.7秒的音频，中国科技巨头百度开发的一种新的AI 算法就可以克隆出一种非常可信的虚假声音。就像机器学习软件的迅速发展一样，这种软件可以使虚拟视频的制作民主化，这项研究表明为什么越来越难相信互联网上的任何媒体。

这家科技巨头的研究人员在Deep Voice发布了他们的最新进展，Deep Voice是一个为声音克隆开发的系统。一年前，该技术需要大约30分钟的音频来创建新的假音频片段。现在，只需几秒钟的培训材料，它可以创造出更好的结果。

百度近日宣布，百度开发的新 AI 算法Deep Voice可以通过3.7秒钟的录音样本数据就能完美的克隆出一个人的声音。

Deep Voice是百度AI研究院一个由深度神经网络构建的高质量语音转（TTS ）系统。该系统不仅提高的模拟的时间，百度还优化了它出错的概率。甚至还在一个单GPU服务器上，把推断规模提高到到每天1000万次以上。

自适应说话人编码方法在训练、克隆和音频生成中的应用

Deep Voice最早是在2017年的年初发布了第一版，初版的系统就能模拟初简短的句子，而且说起话来几乎无法区分和真人的区别。但是该系统一次只能模拟一个人的声音，而且需要好几个小时的学习才能克隆成功。但是最新发布的成功已经缩短到3.7秒，并且能将女性声音转变成男性，英式声音变成美式。

模拟器编码器结构

百度研究院的研究人员在预印本网站 arxiv 上的发表了其 Deep Voice 系统的最新进展《Neural Voice Cloning with a Few Samples》。除了利用少量样本克隆声音外，系统还能将女性声音转变成男性，英式声音变成美式。百度研究人员表示，这项研究可应用于人机交互的个性化方面。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98720
机器学习

机器学习

+关注

关注
66

文章
8116

浏览量
130550

原文标题：只需 3.7 秒，百度最新AI算法就能克隆任何人的声音！

文章出处：【微信号：worldofai，微信公众号：worldofai】欢迎添加关注！文章转载请注明出处。

★★★【<百度网盘1T永久容量领取教程>】

只需要登陆百度云电脑客户端--可获100G容量、百度云移动端(Andriod版、iPhone版、iPad版)--可获360G容量、再支付1元钱就能换购564G容量，总共就是1T哦!

发表于 08-22 09:19

百度总裁：百度在人工智能领域已有重大突破

　　随着阿法狗大战李世石，人工智能引发越来越多的关注。百度总裁张亚勤28日表示，百度长期坚持技术创新，2015年研发投入超过100亿元，目前在人工智能领域已有重大突破。　　张亚勤在天津夏季达沃斯论坛

发表于 07-01 15:22

Firefly 百度人脸识别开发套件

`Firefly推出了百度人脸识别套件，基于Firefly高性能主板，融合百度AI精准的离线人脸识别技术，集算法与软硬件为一体的开发平台。仅需一个套件，可一站式轻松解决人工智能

发表于 07-25 10:19

Xilinx的任何人都知道它被删除的原因吗？

我有一个参考链接到http://www.xilinx.com/support/answers/23529.htmand它现在已经消失了。Xilinx的任何人都知道它被删除的原因吗？它与MGT参考有关。

发表于 06-02 13:37

用百度大脑EasyDL平台轻松玩转AI

什么是EasyDL？： EasyDL是百度大脑推出的定制化AI训练及服务平台，支持面向各行各业有定制AI需求的企业用户及开发者使用。支持从数据管理与数据标注、模型训练、模型部署一站式AI

发表于 07-09 11:30

只要6秒 AI人工智能只要听声音就能描绘你的长相

　　你相信吗?AI人工智慧最近已经进化到，只要花6秒的时间，听到你的声音除可以分辨出你的性别、年纪与种族外，甚至可以描绘出你的长相。　　这款由麻省理工学院(MIT)所打造出来的AI，研

发表于 07-29 15:49

labview调用百度人脸识别SDK

。只要百度的C#版本算法，labview可以直接调用。SDK及说明文档的地址如下。http://ai.baidu.com/ai-doc/FACE/4k37c1n7e如果长期试用

发表于 11-27 19:40

【HarmonyOS HiSpark AI Camera试用连载】AI Camera之百度识图（一）

，但一直没能成功，希望直接通过调用其源文件，也一直没能成功。所以卡在上述第三步已经很长时间了，先把前两个步骤说一下吧：一、图片格式识别在百度AI中，可以识别的图片主要有bmp、jpg、png，因此我们

发表于 12-19 00:52

【米尔百度大脑EdgeBoard边缘AI计算盒试用连载】I. 开箱报告(ZMJ)

AI计算盒更倾向于简化嵌入式或者算法人员的开发流程，开发人员对于FPGA即便是零基础也能轻松驾驭它。它可以提供丰富的软硬件选型，可适应多变的场景与边缘部署环境。无缝兼容百度大脑工具平台与算法

发表于 03-14 20:37

【米尔百度大脑EdgeBoard边缘AI计算盒试用连载】VII. ARM核性能测试(ZMJ)

【米尔百度大脑EdgeBoard边缘AI计算盒试用连载】VII. ARM核性能测试(ZMJ)1.简介米尔和百度合作开发的百度大脑EdgeBoard边缘

发表于 04-29 21:45

百度API调用（三）——语音识别精选资料推荐

python 调用百度语音识别API 一、开通百度语音技术接口服务基本过程：1、打开百度ai开放平台 https://ai.baidu.co

发表于 08-18 06:44

AI算法5秒钟就能克隆你的声音

今天，给大家介绍一个算法。 AI 算法 5 秒钟，就能克隆你的声音，你信吗？听听这段音频，猜猜

发表于 11-17 10:05 •6458次阅读

虹科分享 | 网络安全评级 | 勒索软件即服务(RAAS)如何让任何人成为黑客

虹科分享|网络安全评级|勒索软件即服务(RAAS)如何让任何人成为黑客近年来，勒索软件即服务(RAAS)已成为一种日益增长的趋势，使任何连接到互联网的人都能成为黑客。过去，发动勒索软件攻击需要

发表于 03-29 11:06 •500次阅读

马斯克:明年AI将比任何人都聪明

OpenAI的大模型让大家看到了通用人工智能（AGI）的强大，人工智能技术的发展速度也让很多人侧目。马斯克在X上发表预测道：“明年人工智能可能会比任何人类个体都聪明，到2029年，人工智能可能比所有人类加起来还要聪明。”

发表于 03-14 15:46 •302次阅读

搜索历史

百度最新AI算法就能克隆任何人的声音！只需 3.7 秒!

评论

★★★【<百度网盘1T永久容量领取教程>】

百度总裁：百度在人工智能领域已有重大突破

Firefly 百度人脸识别开发套件

seo优化的百度算法笔记

Xilinx的任何人都知道它被删除的原因吗？

用百度大脑EasyDL平台轻松玩转AI

只要6秒 AI人工智能只要听声音就能描绘你的长相

labview调用百度人脸识别SDK

【HarmonyOS HiSpark AI Camera试用连载】AI Camera之百度识图（一）

【米尔百度大脑EdgeBoard边缘AI计算盒试用连载】I. 开箱报告(ZMJ)

【米尔百度大脑EdgeBoard边缘AI计算盒试用连载】VII. ARM核性能测试(ZMJ)

百度API调用（三）——语音识别精选资料推荐

AI算法5秒钟就能克隆你的声音

虹科分享 | 网络安全评级 | 勒索软件即服务(RAAS)如何让任何人成为黑客

马斯克:明年AI将比任何人都聪明