0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软智能语音实现技术升级,新增了5 个声音角色

工程师邓生 来源:IT之家 作者:玄隐 2020-12-11 18:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

12月11日消息 近期,微软智能语音实现技术升级,一次性新增了 5 个声音角色供用户自由选择,覆盖男女声和不同年龄段,以及不同性格和声线特征,包括阳光活泼的男青年(云希)和独立自信的女青年(晓萱),温柔大方的女中青年(晓涵)和多才多艺的女青年(晓墨),以及成熟睿智的女中老年(晓睿)。另外,中年男声(云野)也同步更新了多种声音风格。他们与此前多个声音角色一起,共同组成了微软丰富的中文智能语音 “家族”。

下面是新增以及更新角色声音 demo:

类似人类主播在播讲一个有声小说时会模拟不同的角色,微软最新的智能语音也支持声线变换,一人模拟多个角色,比如女生扮演男生,年轻人扮演老人的声音,做到 “声随境转”,大秀声音 “演技”。同时,不同的声线变化也包含多种情感变换,让角色更加活灵活现。

正是基于这些丰富多样且功能强大的声音角色,用户得以自由组合出丰富的音频产品。

IT之家获悉,这些新声音在开发过程中采用了最新的迁移学习技术,仅利用少量表现力语料数据,便可以训练出具有高质量、高自然度表现力语音生成能力的源模型。该源模型通过对人类语音表现力特征的深入挖掘,获取了稳定性高,适应性强的语音情感表征,极大地丰富了合成语音的表现力与可控性。微软还进一步构建了基于角色和风格变换的隐式表达空间,可以灵活地将多个不同的角色和风格适应到一个新的表现力丰富的说话人模型。

目前,微软语音合成多角色可应用在有声书、儿童故事、新闻串讲等多种场景,满足不同的产品矩阵。

对于音频内容产业而言,微软此次语音合成多角色技术更新不仅令声音风格更为多样且具有感染力,也将进一步降低音频内容生产成本、提高制作速度和质量。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6766

    浏览量

    108177
  • 声音
    +关注

    关注

    0

    文章

    22

    浏览量

    16553
  • 智能语音
    +关注

    关注

    11

    文章

    831

    浏览量

    50373
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音芯片怎么样写入声音?一文讲透语音播放芯片的声音写入之道

    如果说芯片是电子产品的“大脑”,那么语音芯片就是赋予设备“声音灵魂”的关键元器件。从商场迎宾器、电动车报警器,到智能门锁、医疗设备,凡是需要“开口说话”的设备,内部都藏着一颗或多颗能将数字信号转化
    的头像 发表于 04-24 10:04 198次阅读
    <b class='flag-5'>语音</b>芯片怎么样写入<b class='flag-5'>声音</b>?一文讲透<b class='flag-5'>语音</b>播放芯片的<b class='flag-5'>声音</b>写入之道

    如何查看小智是否成功进入声音设置?

    / 进入你的智能体 → 配置角色 检查: 当前音色/声音是否显示为你选择的名称(如“弯弯小河”“高冷御姐”) 页面提示“ 配置已保存/已生效 ” 可点击试听按钮,听当前设置的声音是否正
    发表于 02-16 06:39

    如何实现声音自由更换?WT588F02系列Flash语音芯片开启个性化时代

    在追求极致个性化和智能交互的今天,产品的“声音”已成为用户体验的关键一环。作为国内领先的语音IC厂家,广州唯创电子有限公司的Flash可更换声音语音
    的头像 发表于 01-15 09:05 391次阅读
    如何<b class='flag-5'>实现</b><b class='flag-5'>声音</b>自由更换?WT588F02系列Flash<b class='flag-5'>语音</b>芯片开启个性化时代

    芯知识|可录音语音芯片如何实现声音的储存与重放?

    语音交互技术高速发展的今天,绝大多数设备的“声音”功能仍停留在单向播报阶段。然而,有一类特殊的语音芯片,不仅能让设备“开口说话”,更能使其“听见并记住”外界
    的头像 发表于 01-08 09:44 397次阅读
    芯知识|可录音<b class='flag-5'>语音</b>芯片如何<b class='flag-5'>实现</b><b class='flag-5'>声音</b>的储存与重放?

    微软Microsoft Copilot Studio智能体平台全面升级

    近期,微软lgnite大会重磅宣布Microsoft Copilot Studio全面升级,集成智能体构建、自动化与治理,支持多模型和跨平台集成,强化安全与可控性。企业可一站式打造高效、合规,且可扩展的
    的头像 发表于 12-09 17:36 1572次阅读

    广州唯创WT2003Hx语音芯片:家庭理疗产品的智能声音伴侣

    一、智能科技赋能家庭理疗新体验随着智能家居技术的快速发展,家庭理疗产品正迎来全面升级的契机。作为国内领先的语音IC厂家,广州唯创电子推出的W
    的头像 发表于 11-24 08:51 539次阅读
    广州唯创WT2003Hx<b class='flag-5'>语音</b>芯片:家庭理疗产品的<b class='flag-5'>智能</b><b class='flag-5'>声音</b>伴侣

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别芯
    的头像 发表于 11-14 17:11 1656次阅读

    什么是语音芯片串口AT指令?实现智能语音交互的核心技术详解

    什么是AT指令AT指令是一套基于串行通信接口的标准化指令集,专门用于声音播放芯片与其他设备之间的数据传输和控制操作。这种通信协议通过简单的文本命令格式,实现语音
    的头像 发表于 11-10 12:53 715次阅读
    什么是<b class='flag-5'>语音</b>芯片串口AT指令?<b class='flag-5'>实现</b><b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互的核心<b class='flag-5'>技术</b>详解

    微软Microsoft Sentinel升级智能体化AI技术安全平台

    微软持续在安全领域推出新平台与工具,Microsoft Sentinel平台升级智能体化Al技术安全平台,集成智能Security Cop
    的头像 发表于 10-13 15:48 927次阅读

    广州唯创电子Flash语音芯片IC:可更换声音技术的创新引领者

    的Flash可更换声音语音芯片,通过创新的存储技术和灵活的烧录方式,彻底解决这一痛点。这种芯片允许工程师根据产品需求随时更新语音内容,无需
    的头像 发表于 09-23 08:55 869次阅读
    广州唯创电子Flash<b class='flag-5'>语音</b>芯片IC:可更换<b class='flag-5'>声音</b><b class='flag-5'>技术</b>的创新引领者

    语音芯片让壁挂炉更智能——唯创电子WTVxxx系列声音IC应用解决方案

    随着智能家居技术的快速发展,智能壁挂炉逐渐成为家庭供暖的重要设备。为了让用户在操作过程中享受到更加便捷、直观的交互体验,广州唯创电子WTVxxx系列语音芯片(又称
    的头像 发表于 09-15 09:10 711次阅读
    <b class='flag-5'>语音</b>芯片让壁挂炉更<b class='flag-5'>智能</b>——唯创电子WTVxxx系列<b class='flag-5'>声音</b>IC应用解决方案

    轻松配置小智AI语音开发板,安信可IOT小程序功能更新

    版使用教程: 安信可AI语音开发板全面升级商用版!(附教程) 为了让开发体验更加流畅,安信可IOT小程序本次进行了多项功能升级,一起来看看吧   PART.01角色音色试听 选
    的头像 发表于 08-19 17:46 1654次阅读
    轻松配置小智AI<b class='flag-5'>语音</b>开发板,安信可IOT小程序功能更新

    WT2606B 驱屏语音芯片新增蓝牙功能:功能集成一体化,产品升级自动化,语音交互无线化,场景应用普适化!

    WT2606B 驱屏语音芯片新增蓝牙功能:功能集成一体化,产品升级自动化,语音交互无线化,场景应用普适化!
    的头像 发表于 08-14 12:05 800次阅读
    WT2606B 驱屏<b class='flag-5'>语音</b>芯片<b class='flag-5'>新增</b>蓝牙功能:功能集成一体化,产品<b class='flag-5'>升级</b>自动化,<b class='flag-5'>语音</b>交互无线化,场景应用普适化!

    AP-0316 语音模组:不止是降噪神器,更是即插即用的 USB 声卡全能王

    ,还是带 USB 口的智能设备,插上 AP-0316 就能被识别为 USB 声卡,WIN / 安卓 / Linux 全兼容,免驱直连。无需懂电路设计,不用调复杂参数,5 秒完成连接 —— 麦克风接入、喇叭
    发表于 07-18 10:06

    语音芯片如何赋能洗地机智能升级:唯创关键技术实现与应用生态解析

    随着智能家居技术的快速发展,洗地机作为现代清洁工具的核心品类,正通过语音交互技术的深度融合实现产品形态的全面
    的头像 发表于 06-07 11:12 1087次阅读
    <b class='flag-5'>语音</b>芯片如何赋能洗地机<b class='flag-5'>智能</b><b class='flag-5'>升级</b>:唯创关键<b class='flag-5'>技术</b><b class='flag-5'>实现</b>与应用生态解析