0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI语音克隆技术,或是播客行业长久发展的终极解决方案

如意 来源:科技行者 作者:科技行者 2020-10-08 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

播客行业正朝着更加轻松自然、非正式性的音频叙事方向发展。这种较少使用严肃用语的传播形式,也成功拉近了主播与听众间的沟通距离。

换句话说,主播们尽可能使用口语表达,降低表述内容的理解与反应难度。也正是凭借着这种通俗易懂优势,音频叙事变得越来越流行,相关调查数据也证明了这一发展趋势。

根据Statista公布的统计结果,2018年全美播客收听者已经达到7500万;预计到2024年,月收听用户将增长至1.64亿。由此估计,2019年至2023年之间播客听众的复合年增长率将高达17%。

2020年,四分之三的美国民众明确知晓播客为何物,其中超过半数(55%)的受访者已经开始收听播客。而作为全球收入最高的播客,乔·罗根(Joe Rogan)的《乔·罗根体验》(The Joe Rogan Experience)节目在2019年获得高达5000万美元销售额,月均下载近2亿次。

目前,播客行业面对的主要问题在于如何在维持内容独立性的同时,获取支持行业快速增长的必要资源。终于进入正题——人工智能等突破性技术带来的语音克隆功能,也许能够带来重要的解决手段,或者至少是部分解决方案。

以尼克松(Nixon)项目为例,其以令人信服的结果证明AI技术完全能够重现出与人类对象没有任何区别的语音效果。麻省理工学院的一组研究人员、新闻工作者及艺术家,同语音克隆厂商Respeecher及VDR公司的Canny AI开展合作,共同创造出模拟得出的首次登月通话记录——只是这一次,宇航员阿姆斯特朗与奥德林未能完成任务,并被困在了月球上。

他们甚至还“伪造”了时任美国总统的尼克松的视频,向全世界宣告此次登月之旅的悲惨失败。

当播客遇上AI

计算机化语音的主要挑战,在于如何复制人类表达以及其中的种种细微差别,同时尽力避免机器音的存在。而在识别并重现细微声音变化元素方面,以人工智能为基础的语音转换技术为我们指明了一条可行的发展道路。

苹果Sir、Amazon Alexa、微软Cortana以及Google Assistant等语音助手仍在使用文本到语音转换技术。虽然这种技术的实用性确实很高,但却很难带来不同的语音类型。以Siri为例,要想实现老年男性的语音效果,除了需要引入庞大的预录制文件之外,Siri还无法处理该音频文件中未能包含的单词。在这方面,AI支持下的语音到语音转换就成了新的突破口。

如何将AI语音克隆应用于播客领域?

人工智能不仅能够实现语音克隆,还能够在任意播客节目中完美复制一切语音效果。其中使用的是一项名为“智能鸡尾酒”的经典数字信号处理算法,外加专用的深度生成建模技术——允许内容制作者使用最适合的声音解决以往难以实现的录制效果(例如播报员有其他工作,或者需要重现某位已经去世的配音演员的音色等)。

下面来看几种语音克隆技术在播客制作领域的可行用例:

1. 让名人加入您的节目

我们很难请到知名演员、作家、运动员等参与您的节目,但如果使用人工智能技术复制他们的声音,就可以既轻松实现同样的效果、又不必劳烦他们亲自到录音棚跑一趟。以此为基础,听众们能够听到自己喜爱的声音,节目制作方与名人们也省去了劳顿之苦。

2. 重现旧日之声

语音克隆能够让已经去世的演员们再次献声。想不想让肯尼迪总统为历史播客配上旁白?没有问题,语音转换技术能够精确重现他的声音——是的,不只是“相似”,而是真正的完美还原。

3. 使用童声朗读,又不用强迫孩子们长时间工作

孩子们讲话总是非常有趣,这种趣味性不一定体现在内容上,而更多在于他们的语音、语气和语调当中。但与孩子们一同工作可是相当费心费力。通过语音合成技术,我们可以让专业演员念出孩子的台词,再将其转换为童声效果,大大简化节目制作流程。

4. 快速推进节目制作进度,保证播客及时播出

AI可以瞬间重现人声,而且短时间内就可以提供高质量的目标语音成果。

总结

2017年,全球播客市场带来的广告收入高达2.2亿美元,且每年都在翻番。而用户参与度的提升,将成为吸引潜在广告客户的核心动力。更重要的是,播客中的广告其实效果极佳,调查显示此类广告拥有近90%的播放完成率。

此外,广告客户甚至愿意为某些播客节目支付 高达30美元的CPM(广告每千次展示成本)。单说这个数字大家可能没有概念,但Facebook上的每千次广告展示成本约为6美元。

网络电视正在缓慢但坚定地取代着有线电视,播客与传统广播之间的关系似乎也是这样。而单纯从传统广播类广告出发,播客行业至少还能够吸引到额外约200亿美元收入。而正如我们在文章开头提到,播客节目能够吸引到大量原本根本不听广播的群体,因此其利润增长期望可谓一片光明。

这些调查数字表明,播客业务将长久存在,同时也迫切需要音频内容制作者们找到效率更高、效果更好的节目产出方法。

也许AI语音克隆技术,正是帮助播客行业在内容独立性与节目制作资源需求间找到完美平衡的终极解决方案。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3227

    浏览量

    86333
  • 语音
    +关注

    关注

    3

    文章

    407

    浏览量

    40091
  • AI
    AI
    +关注

    关注

    91

    文章

    41141

    浏览量

    302608
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    欢迎使用中国香河英茂科工豆包智能体

    风格:简洁/口语化;擅长:写作/运营/编程/咨询;知识库:我的笔记/方案/历史对话;任务:帮我写文案、回消息、做方案、查资料。 上传头像 → 开启声音克隆(录1分钟语音) 点击创建
    发表于 02-14 07:22

    e络盟宣布推出屡获殊荣的《发现顶尖技术之声》第二季

    安富利旗下全球电子元器件产品与解决方案分销商e络盟近日宣布,屡获殊荣的系列《发现顶尖技术之声》第二季正式回归。
    的头像 发表于 02-10 10:35 635次阅读
    e络盟宣布推出屡获殊荣的《发现顶尖<b class='flag-5'>技术</b>之声》<b class='flag-5'>播</b><b class='flag-5'>客</b>第二季

    CastFox利用Google开放模型Gemma 3n重塑互动体验

    Guru Network Limited 是一家全球化的娱乐与游戏公司,其开发的 CastFox 彻底改变了用户与的交互方式,应用上线仅 3 周下载量就突破 100 万次。
    的头像 发表于 02-09 14:50 620次阅读

    安富利揭秘AI语音克隆技术背后的安全隐患

    近期,AI模仿歌手声线翻唱歌曲的视频在社交平台走红,高播放量与网友好评显现出“万物皆可AI”的音乐创作趋势。
    的头像 发表于 12-03 15:52 1308次阅读

    进迭 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是AI时代的“终极答案”

    "。节目定位「RISC-V圆桌白话录」是一档聚焦RISC-V芯片世界的入门指南与行业洞察的节目。我们用“人话”解读技术原理,分享真实创业故事,提供前沿
    的头像 发表于 11-07 20:26 902次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是<b class='flag-5'>AI</b>时代的“<b class='flag-5'>终极</b>答案”

    华为星河AI广域网解决方案助力教育网络智能化发展

    在第四届中国IPv6创新发展大会教育科研论坛上,华为数据通信产品线教育行业首席架构师韦乃文发表了“星河AI广域网络,构筑智慧教育AI网络新底座”的主题演讲,解读了星河
    的头像 发表于 10-30 10:43 896次阅读

    进迭 | Vol.2 对话陈志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭「RISC-V圆桌白话录」「RISC-V圆桌白话录」第二期来啦!本期节目延续上期RISC-V芯片的行业趋势——我们与进迭时空创始
    的头像 发表于 10-27 18:34 1217次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> | Vol.2 对话陈志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭 |「RISC-V 圆桌白话录」首期正式上线!

    进迭「RISC-V圆桌白话录」进迭时空全新节目「RISC-V圆桌白话录」首期正式上线!节目定位「RISC-V圆桌白话录」是一档聚焦RISC-V芯片世界的入门指南与
    的头像 发表于 10-16 17:42 1514次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> |「RISC-V 圆桌白话录」首期正式上线!

    软通动力入选828精选AI行业联合解决方案

    近日,第四届828 B2B企业节开幕式上,华为云携手生态伙伴,以精准的行业洞察与联合创新,集中推出多款AI行业联合解决方案,释放AI潜能,共
    的头像 发表于 09-01 11:37 1035次阅读

    AI 芯片浪潮下,职场晋升新契机?

    对复杂场景中目标检测与识别的速度和精度。在此过程中,对算法的理解深度、芯片架构与算法的协同能力,都会成为职称评审中的加分项。 除技术能力外,创新能力同样不可或缺。AI 芯片行业发展日新
    发表于 08-19 08:58

    2025年AI智能语音助手市场发展趋势与乐鑫芯片解决方案分析

    2025年AI语音助手市场爆发式增长,全球访问量翻倍,企业普及率达97%。NLP技术突破(语义准确率超95%)与边缘计算支持驱动发展,产品向多模态交互进阶。三大应用场景潜力显著:企业客
    的头像 发表于 07-05 11:26 1982次阅读

    WT3000A,电子锁 AI 智慧语音方案强势来袭!

    模组(WIFI+WT2606A语音芯片)或WT2606A单语音芯片电子锁 - AI 智慧语音解决方案,可满足您多样化产品需求!今天就带大家深
    的头像 发表于 05-28 15:52 901次阅读
    WT3000A,电子锁 <b class='flag-5'>AI</b> 智慧<b class='flag-5'>语音</b><b class='flag-5'>方案</b>强势来袭!

    ​​广和通发布5G AI MiFi 解决方案,重新定义AI智联万物

    4月25日,广和通发布5G AI MiFi 解决方案,深度融合5G通信与AI语音技术,是一款便携式移动热点设备。该
    发表于 05-21 17:11 1334次阅读
    ​​广和通发布5G <b class='flag-5'>AI</b> MiFi <b class='flag-5'>解决方案</b>,重新定义<b class='flag-5'>AI</b>智联万物

    AI神经网络降噪算法在语音通话产品中的应用优势与前景分析

    随着人工智能技术的快速发展AI神经网络降噪算法在语音通话产品中的应用正逐步取代传统降噪技术,成为提升
    的头像 发表于 05-16 17:07 1891次阅读
    <b class='flag-5'>AI</b>神经网络降噪算法在<b class='flag-5'>语音</b>通话产品中的应用优势与前景分析

    广和通发布5G AI MiFi解决方案

    近日,广和通发布5G AI MiFi 解决方案,深度融合5G通信与AI语音技术,是一款便携式移动热点设备。该
    的头像 发表于 04-29 09:05 1688次阅读