0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI语音克隆技术,或是播客行业长久发展的终极解决方案

如意 来源:科技行者 作者:科技行者 2020-10-08 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

播客行业正朝着更加轻松自然、非正式性的音频叙事方向发展。这种较少使用严肃用语的传播形式,也成功拉近了主播与听众间的沟通距离。

换句话说,主播们尽可能使用口语表达,降低表述内容的理解与反应难度。也正是凭借着这种通俗易懂优势,音频叙事变得越来越流行,相关调查数据也证明了这一发展趋势。

根据Statista公布的统计结果,2018年全美播客收听者已经达到7500万;预计到2024年,月收听用户将增长至1.64亿。由此估计,2019年至2023年之间播客听众的复合年增长率将高达17%。

2020年,四分之三的美国民众明确知晓播客为何物,其中超过半数(55%)的受访者已经开始收听播客。而作为全球收入最高的播客,乔·罗根(Joe Rogan)的《乔·罗根体验》(The Joe Rogan Experience)节目在2019年获得高达5000万美元销售额,月均下载近2亿次。

目前,播客行业面对的主要问题在于如何在维持内容独立性的同时,获取支持行业快速增长的必要资源。终于进入正题——人工智能等突破性技术带来的语音克隆功能,也许能够带来重要的解决手段,或者至少是部分解决方案。

以尼克松(Nixon)项目为例,其以令人信服的结果证明AI技术完全能够重现出与人类对象没有任何区别的语音效果。麻省理工学院的一组研究人员、新闻工作者及艺术家,同语音克隆厂商Respeecher及VDR公司的Canny AI开展合作,共同创造出模拟得出的首次登月通话记录——只是这一次,宇航员阿姆斯特朗与奥德林未能完成任务,并被困在了月球上。

他们甚至还“伪造”了时任美国总统的尼克松的视频,向全世界宣告此次登月之旅的悲惨失败。

当播客遇上AI

计算机化语音的主要挑战,在于如何复制人类表达以及其中的种种细微差别,同时尽力避免机器音的存在。而在识别并重现细微声音变化元素方面,以人工智能为基础的语音转换技术为我们指明了一条可行的发展道路。

苹果Sir、Amazon Alexa、微软Cortana以及Google Assistant等语音助手仍在使用文本到语音转换技术。虽然这种技术的实用性确实很高,但却很难带来不同的语音类型。以Siri为例,要想实现老年男性的语音效果,除了需要引入庞大的预录制文件之外,Siri还无法处理该音频文件中未能包含的单词。在这方面,AI支持下的语音到语音转换就成了新的突破口。

如何将AI语音克隆应用于播客领域?

人工智能不仅能够实现语音克隆,还能够在任意播客节目中完美复制一切语音效果。其中使用的是一项名为“智能鸡尾酒”的经典数字信号处理算法,外加专用的深度生成建模技术——允许内容制作者使用最适合的声音解决以往难以实现的录制效果(例如播报员有其他工作,或者需要重现某位已经去世的配音演员的音色等)。

下面来看几种语音克隆技术在播客制作领域的可行用例:

1. 让名人加入您的节目

我们很难请到知名演员、作家、运动员等参与您的节目,但如果使用人工智能技术复制他们的声音,就可以既轻松实现同样的效果、又不必劳烦他们亲自到录音棚跑一趟。以此为基础,听众们能够听到自己喜爱的声音,节目制作方与名人们也省去了劳顿之苦。

2. 重现旧日之声

语音克隆能够让已经去世的演员们再次献声。想不想让肯尼迪总统为历史播客配上旁白?没有问题,语音转换技术能够精确重现他的声音——是的,不只是“相似”,而是真正的完美还原。

3. 使用童声朗读,又不用强迫孩子们长时间工作

孩子们讲话总是非常有趣,这种趣味性不一定体现在内容上,而更多在于他们的语音、语气和语调当中。但与孩子们一同工作可是相当费心费力。通过语音合成技术,我们可以让专业演员念出孩子的台词,再将其转换为童声效果,大大简化节目制作流程。

4. 快速推进节目制作进度,保证播客及时播出

AI可以瞬间重现人声,而且短时间内就可以提供高质量的目标语音成果。

总结

2017年,全球播客市场带来的广告收入高达2.2亿美元,且每年都在翻番。而用户参与度的提升,将成为吸引潜在广告客户的核心动力。更重要的是,播客中的广告其实效果极佳,调查显示此类广告拥有近90%的播放完成率。

此外,广告客户甚至愿意为某些播客节目支付 高达30美元的CPM(广告每千次展示成本)。单说这个数字大家可能没有概念,但Facebook上的每千次广告展示成本约为6美元。

网络电视正在缓慢但坚定地取代着有线电视,播客与传统广播之间的关系似乎也是这样。而单纯从传统广播类广告出发,播客行业至少还能够吸引到额外约200亿美元收入。而正如我们在文章开头提到,播客节目能够吸引到大量原本根本不听广播的群体,因此其利润增长期望可谓一片光明。

这些调查数字表明,播客业务将长久存在,同时也迫切需要音频内容制作者们找到效率更高、效果更好的节目产出方法。

也许AI语音克隆技术,正是帮助播客行业在内容独立性与节目制作资源需求间找到完美平衡的终极解决方案。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3134

    浏览量

    84927
  • 语音
    +关注

    关注

    3

    文章

    403

    浏览量

    39490
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296606
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安富利揭秘AI语音克隆技术背后的安全隐患

    近期,AI模仿歌手声线翻唱歌曲的视频在社交平台走红,高播放量与网友好评显现出“万物皆可AI”的音乐创作趋势。
    的头像 发表于 12-03 15:52 472次阅读

    进迭 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是AI时代的“终极答案”

    "。节目定位「RISC-V圆桌白话录」是一档聚焦RISC-V芯片世界的入门指南与行业洞察的节目。我们用“人话”解读技术原理,分享真实创业故事,提供前沿
    的头像 发表于 11-07 20:26 410次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是<b class='flag-5'>AI</b>时代的“<b class='flag-5'>终极</b>答案”

    进迭 | Vol.2 对话陈志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭「RISC-V圆桌白话录」「RISC-V圆桌白话录」第二期来啦!本期节目延续上期RISC-V芯片的行业趋势——我们与进迭时空创始
    的头像 发表于 10-27 18:34 408次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> | Vol.2 对话陈志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭 |「RISC-V 圆桌白话录」首期正式上线!

    进迭「RISC-V圆桌白话录」进迭时空全新节目「RISC-V圆桌白话录」首期正式上线!节目定位「RISC-V圆桌白话录」是一档聚焦RISC-V芯片世界的入门指南与
    的头像 发表于 10-16 17:42 1090次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> |「RISC-V 圆桌白话录」首期正式上线!

    软通动力入选828精选AI行业联合解决方案

    近日,第四届828 B2B企业节开幕式上,华为云携手生态伙伴,以精准的行业洞察与联合创新,集中推出多款AI行业联合解决方案,释放AI潜能,共
    的头像 发表于 09-01 11:37 572次阅读

    AI 芯片浪潮下,职场晋升新契机?

    对复杂场景中目标检测与识别的速度和精度。在此过程中,对算法的理解深度、芯片架构与算法的协同能力,都会成为职称评审中的加分项。 除技术能力外,创新能力同样不可或缺。AI 芯片行业发展日新
    发表于 08-19 08:58

    ​​广和通发布5G AI MiFi 解决方案,重新定义AI智联万物

    4月25日,广和通发布5G AI MiFi 解决方案,深度融合5G通信与AI语音技术,是一款便携式移动热点设备。该
    发表于 05-21 17:11 1175次阅读
    ​​广和通发布5G <b class='flag-5'>AI</b> MiFi <b class='flag-5'>解决方案</b>,重新定义<b class='flag-5'>AI</b>智联万物

    广和通发布5G AI MiFi解决方案

    近日,广和通发布5G AI MiFi 解决方案,深度融合5G通信与AI语音技术,是一款便携式移动热点设备。该
    的头像 发表于 04-29 09:05 1094次阅读

    抓住AI时代机遇,从伙伴与华为共筑行业解决方案开始

    立足行业解决方案,才能赢得AI时代
    的头像 发表于 04-07 17:46 1070次阅读
    抓住<b class='flag-5'>AI</b>时代机遇,从伙伴与华为共筑<b class='flag-5'>行业</b><b class='flag-5'>解决方案</b>开始

    曙光超智融合解决方案已落地30多个行业

    近日,“超智融合”技术行业新热点,而曙光超智融合解决方案已在气象、石油、生物医药等30多个行业落地,支持前沿AI应用创新。
    的头像 发表于 03-18 09:13 943次阅读

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    技术、嵌入式系统和物联网等领域展开深度合作,为全球开发者和企业用户提供更强大的解决方案。 Banana Pi 长期以来致力于推动开源硬件的发展,凭借丰富的产品线和强大的社区支持,成为开发者和
    发表于 03-12 09:43

    九联科技AI解决方案接入AI大模型

    在人工智能技术迅猛发展的今天,九联科技凭借其领先的物联网通信模组技术和创新的AI应用方案,再次走在了行业
    的头像 发表于 03-07 17:21 956次阅读

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    硬编码· 超低功耗,路由器连接保活况下功耗低于 150uA· 内置语音唤醒 / 命令词· 方案成熟度高,声音和图像上传手机和服务器已有多个成熟案例,并有配套 APP适用场景与产品特性AI 眼镜具备
    发表于 02-20 18:44

    广和通发布AI玩具大模型解决方案

    玩具行业的新篇章。 这一解决方案的最大亮点在于其高度的集成性和智能化。无需外接MCU,即可轻松实现音视频及图像的实时传输、精准的语音识别、流畅的自然语言处理以及强大的机器学习功能。通过拟人、拟动物或拟IP的生动形式,该
    的头像 发表于 01-21 14:45 1574次阅读

    广和通推出AI玩具大模型解决方案

    广和通推出AI玩具大模型解决方案,该方案深度融合豆包等AI大模型、内置广和通Cat.1模组,助力智能玩具实现AI化升级。该
    的头像 发表于 01-21 10:27 1669次阅读