0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰TTS技术上线语音编辑功能

思必驰 来源:思必驰 2023-09-10 11:23 次阅读

“苏州街站到了,请带好随身物品准备下车。”

“巴沟站到了,请带好随身物品准备下车。”

——地铁语音播报编辑站名

随着人工智能技术的发展,智能语音已融入我们日常生活的方方面面。在人机共生的智能时代,让人机交互更自然、更流畅一直是人类不断探索的目标。

近期,思必驰TTS技术上线语音编辑功能。语音编辑,即在一段语音中间插入语音内容,或根据之前的语音风格续写,使得插入或续写的语音内容与之前的语音风格完美融合,带给用户更自然、流畅的语音服务体验。该技术可应用于自媒体语音修正,轨交、电商、快递、银行等行业中的智能客服语音播报场景,目前,思必驰语音编辑支持中文语音编辑及英文语音编辑。

语音编辑,像文本一样修改音频

点击下方音频,感受思必驰优化后的语音编辑效果

普通语音编辑,手机号部分能听出明显差异

思必驰语音编辑,手机号部分与原有音频自然融合

日常生活中,如音频中所展示的智能客服已被广泛应用于快递、银行、电商等行业场景中,为行业降本增效带来显著作用。厂商通过语音编辑技术,仅需对固定话术中的人名、数字等变量进行替换,便可获得针对不同用户的差异性播报语音,批量通知用户,大大提高了生产效率。

在语音编辑过程中,最大的挑战就是如何使得编辑后的语音接近原有音频的自然和流畅。情感的细微差别、语调变化、节奏等稍有不连贯,听众便能从中听出明显的语音差异。因此,为了让此类编辑后的语音播报更自然,人类不断优化语音合成技术水平。

点击试听思必驰语音编辑续写后的文本

原有音频风格

后半句为根据原有音频风格进行编辑续写

思必驰对语音编辑技术优化更新,应用深度合成技术,基于大模型实现零样本高质量语音编辑,可对中英文语音进行插入文本、根据之前风格续写等操作。经思必驰语音编辑后的语音更流畅、更自然,带给用户媲美原声的听觉体验。

适用各种场景,音频创作更高效

目前,语音编辑已经应用于快递、电商、银行等场景的智能客服以及自媒体短视频配音修正中,为各行各业带来更自然的语音服务。

智能客服固定话术修改变量

在快递、电商、银行、轨交等场景的智能客服中,常常需要用到固定话术,但与用户通话时,固定话术需要根据不同用户、场景对其中的变量进行修改。如:

应用场景

·张先生您好,请到楼下凭取件码123取件;

·王女士您好,您近日在我店铺购买的商品,如果满意请给5分好评;

·刘先生您好,您的信用卡还款日为8月15日,请记得及时还款;

·苏州街站到了,请带好随身物品准备下车;

·北京,天气晴转多云,气温25-30℃。

在此类语音播报中,应用思必驰语音编辑技术,可对固定话术中的人名、地名、数字、日期等变量进行编辑,从而快速获得接近原声的语音,满足不同用户、场景需求。

短视频修正录音口误

修正前音频

修正内容后音频

视频博主在视频创作过程中,视频素材往往有口误、词不达意或冗余的内容,此时,重新对某一句话进行配音,则很难还原当时的环境音,出现该句配音与其他音频存在些许差异的情况。如果对视频一帧一帧进行修改,则需要花费大量时间。在修改音频时,使用思必驰语音编辑技术,可对个别字词及冗余内容进行替换,替换后的字词可完美融入之前的语音环境,降低语音编辑前后的差异性,获得更自然、流畅的语音。

为了保证语音编辑技术合法使用,思必驰可通过声纹识别对用户上传的公众人物、敏感话题等音频进行屏蔽,拒绝编辑合成,保证技术安全。

除语音编辑外,思必驰声音复刻、本地合成、情感音色合成等多项语音合成技术都迎来更新,敬请期待!

未来,思必驰将基于DFM-2大模型,结合语音合成技术进行技术联动,为智能汽车、智能家居消费电子,以及金融、轨交、政务等数字政企行业场景客户带来更加自然、流畅的语音交互服务。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1133

    浏览量

    54760
  • TTS
    TTS
    +关注

    关注

    0

    文章

    29

    浏览量

    10693
  • 思必驰
    +关注

    关注

    4

    文章

    241

    浏览量

    14151
  • 短视频
    +关注

    关注

    1

    文章

    119

    浏览量

    8302

原文标题:语音编辑,让智能播报更自然,思必驰TTS技术上新第一更!

文章出处:【微信号:思必驰,微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    WT3000T8-TTS语音合成芯片及应用场景介绍

    TTS语音合成芯片是一种能够将文本信息转化为自然语音的专用芯片。它通过内置的语音合成算法和音频处理单元,实现了文本到语音的高效转换,为各种智
    的头像 发表于 04-18 18:03 396次阅读

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,并且还可以语音对话:6,FastAPI服务器搭建与TTS播放

    Longan Pi完成全部处理后,需要将文字转回语音返回给PC,那么这一步就需要用到TTS,文本转语音。我使用的是EDGE-TTS库,这个库使用非同步方法来处理流数据,刚好FastAP
    发表于 04-16 12:54

    玩转语音合成芯片(TTS芯片),看这一篇就够了

    什么是语音合成芯片:语音合成芯片也称为TTS芯片,即文字转语音芯片,是一种能够将输入的文字信息转换为语音输出的芯片。通过
    的头像 发表于 03-19 18:13 251次阅读
    玩转<b class='flag-5'>语音</b>合成芯片(<b class='flag-5'>TTS</b>芯片),看这一篇就够了

    亚马逊发布史上最大文本转语音模型BASE TTS

    亚马逊的人工智能研究团队近日宣布,他们成功开发出了迄今为止规模最大的文本转语音模型——BASE TTS。这款新模型拥有高达9.8亿个参数,不仅在规模上超越了之前的所有版本,还在能力上实现了质的飞跃。
    的头像 发表于 02-20 17:04 389次阅读

    语音合成芯片与电子血压计的应用探索

    在当今科技飞速发展的时代,人工智能技术的应用正在不断推动医疗健康领域的创新。语音合成技术(又称TTS技术)作为人工智能的重要组成部分,正逐渐
    的头像 发表于 11-03 11:27 237次阅读
    <b class='flag-5'>语音</b>合成芯片与电子血压计的应用探索

    云知声基于语音合成技术上线方言合成功能

    方言,不仅是地域风物的承载,更是人与故土联结的情感纽带。随着人们对智能语音需求的越来越多元化,更具乡土气息、更具情感联结的方言语音正成为智能语音合成的热门方向。
    的头像 发表于 10-31 09:45 564次阅读

    TTS技术赋能对讲机,迎来智能语音革新

    随着语音合成技术的快速发展,对讲机的智能语音升级已经到来。作为文本转语音的核心技术TTS(文本
    的头像 发表于 10-20 14:53 279次阅读
    <b class='flag-5'>TTS</b><b class='flag-5'>技术</b>赋能对讲机,迎来智能<b class='flag-5'>语音</b>革新

    OTP语音芯片和TTS语音芯片的差异性

    OTP语音芯片用于播放预先录制的声音片段,适用于固定且简单的声音输出需求,而TTS语音芯片能够根据文本实时合成语音,适用于需要灵活和可定制的语音
    的头像 发表于 10-17 15:56 470次阅读

    语音转换,自由切换你的声音,思必驰语音技术上

    语音转换(Voice Conversion, VC)即在保留语音内容的同时,将原说话人的音色转换成指定说话人的音色。在传统变声工具中,基于语音信号处理技术,可将个人音色转换为大叔音、萝
    的头像 发表于 09-14 16:23 611次阅读

    让文字会说话,启英泰伦离线语音合成(TTS技术全面升级!

    “•A01,请用餐•请001号到03号窗口办理业务•本次列车即将到达火车南站,请提前准备下车”语音合成(TTS技术作为人工智能领域的一项重要技术,已经深入大众生活,无孔不入。通过将文
    的头像 发表于 09-04 16:27 530次阅读
    让文字会说话,启英泰伦离线<b class='flag-5'>语音</b>合成(<b class='flag-5'>TTS</b>)<b class='flag-5'>技术</b>全面升级!

    了解独特的文本转语音应用

    虚拟助手在用户发出命令后就会作出语音回复。而生成语音回复的技术被称为 文本转语音TTS) 。 TTS
    的头像 发表于 06-28 21:10 277次阅读
    了解独特的文本转<b class='flag-5'>语音</b>应用

    OpenHarmony上实现图片编辑功能

    图片编辑是在应用中经常用到的功能,比如相机拍完照片后可以对照片进行编辑;截图后可以对截图进行编辑;可以对图库中的图片进行编辑等。
    的头像 发表于 06-25 15:17 788次阅读
    OpenHarmony上实现图片<b class='flag-5'>编辑</b><b class='flag-5'>功能</b>

    TTS语音合成技术的挑战和未来发展

    TTS语音合成技术在实现过程中面临着一些挑战和问题。 首先,TTS语音合成技术需要处理自然语言理
    的头像 发表于 06-24 03:18 642次阅读

    TTS语音合成技术及其应用

    TTS语音合成技术是一种将文本转换为自然语音技术,它利用计算机技术和人工智能
    的头像 发表于 06-24 02:28 844次阅读

    语音识别技术的概念及应用前景

    智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的
    发表于 05-27 09:41