0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Alexa将在2021年初推出3种新的名人声音

倩倩 来源:新经网 2020-09-23 15:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Alexa Speech副总裁Manoj Sindhwani与我分享了他的团队在使两个单词短语“ Hey Samuel”与单个唤醒单词Alexa,Amazon,Echo和Computer共存时遇到的工程难题。由于“ Alexa”具有数十亿个需要培训的客户呼叫对话,但“ Hey Samuel”相对较少,因此需要创建一个多唤醒单词模型,该模型可以在几乎没有数据的情况下进行预测。

为此,他解释说:“我们能够开发传输学习和数据增强技术,以训练一种新的多唤醒单词模型,该模型对所有受支持的唤醒单词和条件都适用。我们还使用多目标学习来减轻分别为每个唤醒词训练模型的需求,并进行多区域训练,以使新的多唤醒词模型能够接受发音中广泛的细微差别。”

对于未来的应用程序,Sindhwani补充说:“多唤醒单词检测的创新意义重大,因为它是实现多种代理交互并跨设备访问不同角色的第一步。”

人工智能的这一突破使亚马逊朝着实现杰夫·贝索斯(Jeff Bezos)的愿景迈进了一步,该愿景是一个智能角色可以跨平台交互的世界。在去年9月的亚马逊大型硬件活动上,语音互操作性倡议(VII)被引入以创建行业标准。

尽管苹果,谷歌和三星尚未签署协议,但一年后该计划有近80家公司,包括埃森哲,宏cer,AMD,奥迪,百度,BBC,宝马,博世,博斯,杜比,Facebook,Garmin,哈曼,海信,英特尔,Kakao,罗技,微软,Orange,高通,Salesforce,Sonos,索尼,Spotify,腾讯,Verizon,大众和雅马哈。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49779

    浏览量

    261855
  • 应用程序
    +关注

    关注

    38

    文章

    3342

    浏览量

    59972
  • 训练模型
    +关注

    关注

    1

    文章

    37

    浏览量

    4049
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVMe over Fabrics 国产 IP:高性能网络存储解决方案

    近期发现NVMe over Fabrics只有国外知名FPGA厂家推出,2025年初给出补丁,但是听说面临无技术团队支持的窘境。 我们根据以往NVMe和RDMA 开发经验,推出国产化NVMe-oF
    发表于 12-12 14:19

    如何进行声音定位?

    文章主要介绍了如何利用一简单的TDOA算法进行声音点位,并使用数据采集卡进行声音定位的实验。
    的头像 发表于 09-23 15:47 1139次阅读
    如何进行<b class='flag-5'>声音</b>定位?

    亚马逊云科技推出Amazon Nova Act SDK预览版,加速浏览器自动化Agent落地

    Storage Service (Amazon S3),以及全新推出的、支持大规模云端浏览器执行的Amazon Bedrock AgentCore Browser Tool。 Amazon Nova Act SDK最初于2025年初
    的头像 发表于 08-06 08:42 663次阅读

    声源定位模块-AR1105# 声源定位# 声音定位

    声音降噪
    深圳市声讯电子有限公司
    发布于 :2025年08月01日 16:01:09

    千方科技推出多功能交通调查站解决方案

    2025年初,交通运输部印发《普通国省道多功能交通调查站布局和建设方案》,要求各省市加快建设多功能交通调查站,提升国省道交通调查能力,推进公路数字化。千方科技快速响应并推出“智能感知+边端融合”的多功能交通调查站解决方案,支持“新建多功能站点”与“复用旧设备升级”两类客户
    的头像 发表于 07-09 15:52 1028次阅读

    时识科技推出XyloAudio 3神经形态开发套件

    时识科技(SynSense)推出的XyloAudio 3神经形态开发套件,为边缘AI音频处理树立全新能效标杆!基于类脑计算技术,XyloAudio 3专为实时声音检测与分类场景打造,以
    的头像 发表于 05-15 15:07 971次阅读
    时识科技<b class='flag-5'>推出</b>XyloAudio <b class='flag-5'>3</b>神经形态开发套件

    瑞萨电子与Altium推出开创性电子系统开发解决方案

    365”),一款电子行业开创性解决方案,旨在优化电子开发从芯片选型到系统生命周期管理的全流程。这一变革性解决方案将在3月11日至13日于德国纽伦堡国际嵌入式展5-371号展位亮相,并预计将于2026年初上市。
    的头像 发表于 03-10 14:21 876次阅读

    亚马逊升级版Alexa推迟发布

    据悉,亚马逊计划在2月26日举办的一场活动中,首次展示其基于人工智能技术的全新升级版Alexa。然而,令人意外的是,这款备受期待的升级版Alexa预计至少要到3月31日或更晚才会正式与消费者见面
    的头像 发表于 02-17 14:02 975次阅读

    OpenAI的o3-mini和DeepSeek R1高级AI推理的完整比较

    科学任务而设计的,但它们在设计、性能、成本和方法上都有所不同。 本文用简单而专业的语言解释了这些差异,检查每个模型的架构、性能基准、定价和用例,以帮助读者决定哪一个最适合您的需求。 OpenAI o3-mini概述 OpenAI的o3 - mini于2025
    的头像 发表于 02-11 11:30 1560次阅读
    OpenAI的o<b class='flag-5'>3</b>-mini和DeepSeek R1高级AI推理的完整比较

    霍尼韦尔展望:2025年初,AI引领工业全面转型

    2024是AI从实验转变为主流商业推动力的一,而2025将是它开始在工业领域掀起大规模革命的一。虽然AI技术尚未成熟,但它已经足够先进,可以帮助实现工业领域三个重要的目标——提
    的头像 发表于 02-07 11:07 1196次阅读

    华为最新消息:华为小折叠新机暂定3推出 华为2024销售收入超8600亿

    给大家带来一些华为的信息: 华为小折叠新机暂定3推出 大家期待已久的华为小折叠新品华为Pocket 3估计在3月份将于面世,因为余承东在一次直播活动中透露
    的头像 发表于 02-06 14:23 2295次阅读

    英飞凌泰国新厂破土动工,2026年初投产功率模块

    近日,英飞凌科技在泰国曼谷南部的北榄府正式启动了一座新的功率半导体模块制造厂的建设。这一举措标志着英飞凌在制造布局多元化方面迈出了重要的一步。
    的头像 发表于 01-22 18:15 1245次阅读

    AMC1204有两封装,SOIC-8和SOIC-16,功能一样吗?为什么要推出封装?

    呢?AMC1204,AMC1304这样做有什么好处吗? 2、AMC1204有两封装,SOIC-8和SOIC-16,功能一样吗?为什么要推出封装?
    发表于 12-27 07:22

    机构预测:iPhone出货量2025年初或遇挑战

    近日,摩根士丹利(大摩)证券发布的“大中华科技硬体产业”报告引起了广泛关注。报告中指出,2025年初,iPhone与iPad的出货表现可能会低于市场预期,为科技行业带来一定的挑战。 大摩中国台湾
    的头像 发表于 12-23 14:05 2357次阅读

    宁德时代或将于香港二次上市,筹资至少50亿美元

    近日,据消息,宁德时代正考虑在香港进行第二次上市,预计筹集资金至少达到50亿美元(当前约合365亿元人民币)。这一举措若成功实施,宁德时代有望成为2021年初以来香港市场上最大的上市交易之一。 据
    的头像 发表于 12-20 13:52 696次阅读