0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI语音克隆技术,或是播客行业长久发展的终极解决方案

如意 来源:科技行者 作者:科技行者 2020-10-08 14:10 次阅读

播客行业正朝着更加轻松自然、非正式性的音频叙事方向发展。这种较少使用严肃用语的传播形式,也成功拉近了主播与听众间的沟通距离。

换句话说,主播们尽可能使用口语表达,降低表述内容的理解与反应难度。也正是凭借着这种通俗易懂优势,音频叙事变得越来越流行,相关调查数据也证明了这一发展趋势。

根据Statista公布的统计结果,2018年全美播客收听者已经达到7500万;预计到2024年,月收听用户将增长至1.64亿。由此估计,2019年至2023年之间播客听众的复合年增长率将高达17%。

2020年,四分之三的美国民众明确知晓播客为何物,其中超过半数(55%)的受访者已经开始收听播客。而作为全球收入最高的播客,乔·罗根(Joe Rogan)的《乔·罗根体验》(The Joe Rogan Experience)节目在2019年获得高达5000万美元销售额,月均下载近2亿次。

目前,播客行业面对的主要问题在于如何在维持内容独立性的同时,获取支持行业快速增长的必要资源。终于进入正题——人工智能等突破性技术带来的语音克隆功能,也许能够带来重要的解决手段,或者至少是部分解决方案。

以尼克松(Nixon)项目为例,其以令人信服的结果证明AI技术完全能够重现出与人类对象没有任何区别的语音效果。麻省理工学院的一组研究人员、新闻工作者及艺术家,同语音克隆厂商Respeecher及VDR公司Canny AI开展合作,共同创造出模拟得出的首次登月通话记录——只是这一次,宇航员阿姆斯特朗与奥德林未能完成任务,并被困在了月球上。

他们甚至还“伪造”了时任美国总统的尼克松的视频,向全世界宣告此次登月之旅的悲惨失败。

当播客遇上AI

计算机化语音的主要挑战,在于如何复制人类表达以及其中的种种细微差别,同时尽力避免机器音的存在。而在识别并重现细微声音变化元素方面,以人工智能为基础的语音转换技术为我们指明了一条可行的发展道路。

苹果Sir、Amazon Alexa、微软Cortana以及Google Assistant等语音助手仍在使用文本到语音转换技术。虽然这种技术的实用性确实很高,但却很难带来不同的语音类型。以Siri为例,要想实现老年男性的语音效果,除了需要引入庞大的预录制文件之外,Siri还无法处理该音频文件中未能包含的单词。在这方面,AI支持下的语音到语音转换就成了新的突破口。

如何将AI语音克隆应用于播客领域?

人工智能不仅能够实现语音克隆,还能够在任意播客节目中完美复制一切语音效果。其中使用的是一项名为“智能鸡尾酒”的经典数字信号处理算法,外加专用的深度生成建模技术——允许内容制作者使用最适合的声音解决以往难以实现的录制效果(例如播报员有其他工作,或者需要重现某位已经去世的配音演员的音色等)。

下面来看几种语音克隆技术在播客制作领域的可行用例:

1. 让名人加入您的节目

我们很难请到知名演员、作家、运动员等参与您的节目,但如果使用人工智能技术复制他们的声音,就可以既轻松实现同样的效果、又不必劳烦他们亲自到录音棚跑一趟。以此为基础,听众们能够听到自己喜爱的声音,节目制作方与名人们也省去了劳顿之苦。

2. 重现旧日之声

语音克隆能够让已经去世的演员们再次献声。想不想让肯尼迪总统为历史播客配上旁白?没有问题,语音转换技术能够精确重现他的声音——是的,不只是“相似”,而是真正的完美还原。

3. 使用童声朗读,又不用强迫孩子们长时间工作

孩子们讲话总是非常有趣,这种趣味性不一定体现在内容上,而更多在于他们的语音、语气和语调当中。但与孩子们一同工作可是相当费心费力。通过语音合成技术,我们可以让专业演员念出孩子的台词,再将其转换为童声效果,大大简化节目制作流程。

4. 快速推进节目制作进度,保证播客及时播出

AI可以瞬间重现人声,而且短时间内就可以提供高质量的目标语音成果。

总结

2017年,全球播客市场带来的广告收入高达2.2亿美元,且每年都在翻番。而用户参与度的提升,将成为吸引潜在广告客户的核心动力。更重要的是,播客中的广告其实效果极佳,调查显示此类广告拥有近90%的播放完成率。

此外,广告客户甚至愿意为某些播客节目支付 高达30美元的CPM(广告每千次展示成本)。单说这个数字大家可能没有概念,但Facebook上的每千次广告展示成本约为6美元。

网络电视正在缓慢但坚定地取代着有线电视,播客与传统广播之间的关系似乎也是这样。而单纯从传统广播类广告出发,播客行业至少还能够吸引到额外约200亿美元收入。而正如我们在文章开头提到,播客节目能够吸引到大量原本根本不听广播的群体,因此其利润增长期望可谓一片光明。

这些调查数字表明,播客业务将长久存在,同时也迫切需要音频内容制作者们找到效率更高、效果更好的节目产出方法。

也许AI语音克隆技术,正是帮助播客行业在内容独立性与节目制作资源需求间找到完美平衡的终极解决方案。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    27

    文章

    2588

    浏览量

    79864
  • 语音
    +关注

    关注

    3

    文章

    361

    浏览量

    37622
  • AI
    AI
    +关注

    关注

    87

    文章

    26129

    浏览量

    263709
收藏 人收藏

    评论

    相关推荐

    宁畅推出电力行业解决方案

    近日,宁畅“智领能源,赋能未来”新能源行业研讨会在南京隆重举行。面向新型电力系统转型,宁畅带来电力行业解决方案,助推AI技术在能源领域的应用
    的头像 发表于 01-18 11:23 305次阅读

    AI克隆技术可用于创建虚拟人物形象!它的技术原理和发展趋势

    电子发烧友网报道(文/李弯弯)AI克隆技术主要指的是人工智能技术用于复制或克隆人类的行为、声音、形象等方面的技术。这种
    的头像 发表于 01-08 08:28 1333次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>克隆技术</b>可用于创建虚拟人物形象!它的<b class='flag-5'>技术</b>原理和<b class='flag-5'>发展</b>趋势

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵
    的头像 发表于 12-14 14:33 298次阅读

    方言离线语音控制场景解决方案

      随着科技的不断发展,离线语音识别技术已经变得越来越成熟。在日常生活中,老人或小孩可能会遇到一些困难,如操作复杂的电子设备。为了解决这一问题,离线语音识别模块成为了一个很好的
    发表于 11-17 17:57

    语音识别技术:端到端的挑战与解决方案

    将探讨端到端语音识别技术的挑战与解决方案。 二、端到端语音识别技术的挑战 1.噪声干扰和口音差异:端到端
    的头像 发表于 10-18 17:06 351次阅读

    语音识别技术行业应用与发展趋势

    一、引言 随着科技的不断发展语音识别技术已经渗透到各个行业中,并逐渐改变着人们的生活方式。本文将探讨语音识别
    的头像 发表于 10-18 16:10 327次阅读

    AI智能呼叫中心

    随着科技的飞速发展,人工智能(AI)已经成为了各行各业的关键技术,其中,AI智能呼叫中心的出现,给传统的呼叫中心带来了巨大的改变与创新,本文将探讨A
    发表于 09-20 17:53

    红蚁数字人克隆系统:加速推动数字人产业升级新篇章

    随着科技的快速发展,数字人克隆技术已经逐渐进入人们的视野。在直播领域,数字人克隆系统的应用更是引起了广泛关注。在现代社会,直播已经成为一种非常受欢迎的形式,涵盖了娱乐、教育、商业等多个领域。随着
    的头像 发表于 09-12 15:54 437次阅读

    智能语音照明解决方案

    智能语音照明解决方案是指利用离线语音技术来实现对照明设备的控制和管理。
    的头像 发表于 06-15 16:32 535次阅读
    智能<b class='flag-5'>语音</b>照明<b class='flag-5'>解决方案</b>

    如何开发智能家居语音控制方案

    挑战与应用 随着科学技术和人工智能的不断发展,智能生活已经深入生活各个方面,而AI语音控制作为智能化的前驱,其智能化程度及准确性将在很大程度上影响着人工智能的
    发表于 05-31 09:50

    离线语音小夜灯解决方案

    离线语音小夜灯解决方案是一种基于离线语音识别技术的智能小夜灯解决方案,其主要功能是通过语音控制方
    的头像 发表于 05-29 09:18 908次阅读
    离线<b class='flag-5'>语音</b>小夜灯<b class='flag-5'>解决方案</b>

    语音识别技术的概念及应用前景

    力来进行识别和语义处理,一个常见的智能语音处理流程如下图所示。 ​ 启英泰伦是行业内首家将人工智能语音处理技术运用到芯片上的公司。2016年推出行业
    发表于 05-27 09:41

    离线语音照明解决方案:让你的照明更智能

    离线语音照明解决方案,它是将离线语音识别技术和照明控制技术相结合,为人们提供更加智能、便捷、安全的智能
    的头像 发表于 05-19 17:03 870次阅读
    离线<b class='flag-5'>语音</b>照明<b class='flag-5'>解决方案</b>:让你的照明更智能

    下一代语音辅助解决方案

    近年来,语音技术从车辆语音控制到家庭智能扬声器的普及程度稳步上升。语音助手解决方案是使用机器学习、NLP(自然语言处理)和
    的头像 发表于 05-05 09:20 516次阅读

    新思科技发布业界首款全栈式AI驱动型EDA解决方案Synopsys.ai

    能够在芯片开发的每个阶段(从系统架构到设计和制造)都采用AI技术,并从云端访问这些解决方案。值得一提的是,Synopsys.ai已经成功帮助汽车领域的领导者瑞萨电子提高芯片性能和降低成
    发表于 04-03 16:03