0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊采用新方式来处理地区语言差异

电子工程师 来源:陈翠 2019-06-15 11:24 次阅读

有些人可能会认为,让支持多种语言(包括西班牙语、德语和日语)的Alexa“听懂”方言是小菜一碟,但事实并非如此。据亚马逊的研究人员称,英式英语和美式英语之间的鸿沟非常之大,以至于经常需要从头开始训练机器学习模型。

Alexa理论上应该能够使用已有的知识引导语言训练。这就是为什么亚马逊的科学家们正在研究一种技术,这种技术可以找出客户的需求主题,比如音乐、天气或运动,并识别出与特定领域无关的语言。

亚马逊的研究人员在计算语言学协会北美分会上发表的论文中,描述了他们的工作。亚马逊Alexa人工智能高级应用科学经理Young Bum Kim写道:“域名分类的多任务训练具有挑战性的一个原因是,对同一域名的请求在不同地区可能看起来大相径庭。例如,对餐馆域名的请求在孟买的餐馆名称将与在伦敦的餐馆名称大不相同,尽管顾客要求相同的服务,像地址信息、菜单信息、预订等。在某些案例中,当跨区域的请求更一致时,几个不同的地区特定模型的输出可以相互加强,提高了准确性。”

该团队的域分类器同时执行多个任务,主要是学习一种语言的统计模型,该模型捕捉跨区域的一致性,并在通用和地区特定模型的输出上学习不同的分类。重要的是,注意机制根据输入给出了不同语言环境特定模型的输出的不同侧重点,这样当输入数据依赖于语言环境时,它将其大部分权重分配给单个语言环境特定模型,并忽略输出其他特定于语言环境的模型。

为了确定在运行时应该接受“特殊处理”的域,研究人员在训练时将特定于区域的模型的输出组合成单个向量,其中权重较大的输出对向量最终值的贡献大于权重较小的输出。然后,将向量与独立于区域设置的模型的输出连接起来,并将其传递给另一个网络层进行域分类。

在美国、英国,印度和加拿大四种英语变体的实验中,与单独训练的模型相比,研究人员的模型准确度提高了18%、43%、116%和57%。

此前,如果要确保Alexa语音助手能够很好的理解语言变体,就需要针对每一种语言变体进行重新的训练,而亚马逊研究人员所创造的这种新的语音识别训练方法,意味着为现有语言的新变体构建模型的工作量将大大减少。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 亚马逊
    +关注

    关注

    8

    文章

    2480

    浏览量

    82369
收藏 人收藏

    评论

    相关推荐

    语言模型(LLMs)如何处理语言输入问题

    研究者们提出了一个框架来描述LLMs在处理语言输入时的内部处理过程,并探讨了模型中是否存在特定于语言的神经元。
    发表于 03-07 14:44 143次阅读
    大<b class='flag-5'>语言</b>模型(LLMs)如何<b class='flag-5'>处理</b>多<b class='flag-5'>语言</b>输入问题

    关于配置XMC4700 MCU的ADC来处理多个信号的疑问求解

    在这种情况下,我需要配置 XMC4700 MCU 的 ADC 来处理多个信号。 具体来说,我必须测量四个独立通道,并同时对其进行数字化处理。 我有点困惑,因为手册中有很多信息。 下面是一些问题
    发表于 03-06 07:38

    为什么有些信号采用差分传输方式,不采用单端传输的方式

    为什么有些信号采用差分传输方式,不采用单端传输的方式? 差分传输方式是一种常用的信号传输方式,其
    的头像 发表于 01-17 11:32 185次阅读

    C语言有哪些预处理操作?

    C语言的预处理是在编译之前对源代码进行处理的阶段,它主要由预处理器完成。预处理器是一个独立的程序,它负责对源代码进行一些文本替换和
    的头像 发表于 12-08 15:40 286次阅读
    C<b class='flag-5'>语言</b>有哪些预<b class='flag-5'>处理</b>操作?

    开启智能时代:亚马逊云科技倾力打造大语言模型前沿应用

    近年来,随着科技的飞速发展,大语言模型成为人工智能领域的一颗璀璨明珠。在这个信息爆炸的时代,大语言模型以其强大的自学习能力和广泛的应用领域引起了广泛关注。作为亚马逊云科技的前沿技术之一,本文将深入探讨大
    的头像 发表于 12-06 13:57 477次阅读

    语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数(B+)的预训练语言
    的头像 发表于 12-04 15:51 403次阅读

    如何利用Python和pandas来处理json数据

    了如何利用Python和pandas(Python的第三方库)来处理json数据,主要内容包含: json数据简介 常用json数据转化网站 json数据和Python数据的转化 pandas处理
    的头像 发表于 11-01 10:59 630次阅读
    如何利用Python和pandas<b class='flag-5'>来处理</b>json数据

    pcb表面处理有哪些方式

    pcb表面处理有哪些方式
    的头像 发表于 09-25 09:53 810次阅读

    如何使用Rust的标准库和structopt库来处理控制台参数

    Rust是一种安全、高效的系统编程语言,其标准库以及外部库提供了很多处理控制台参数的方式。在本篇文章中,我们将分别介绍如何使用Rust的标准库处理控制台参数,以及如何使用structo
    的头像 发表于 09-20 11:13 742次阅读

    卷积神经网络的应用 卷积神经网络通常用来处理什么

    卷积神经网络的应用 卷积神经网络通常用来处理什么 卷积神经网络(Convolutional Neural Network,简称CNN)是一种在神经网络领域内广泛应用的神经网络模型。相较于传统
    的头像 发表于 08-21 16:41 3978次阅读

    亚马逊云科技中国北京与宁夏两个区域实现100%采用可再生能源

    宣布2022年亚马逊云科技全球19个区域已经实现100%采用可再生能源,由西云数据运营的亚马逊云科技中国(宁夏)区域和光环新网运营的亚马逊云科技中国(北京)区域也位列其中。今年是
    的头像 发表于 08-10 09:34 374次阅读

    亚马逊美国站要求提供的FCC认证是什么?

    亚马逊
    jf_68417261
    发布于 :2023年08月04日 15:01:57

    ST60非接触式连接器赋能工业互连新方式

    电子发烧友网站提供《ST60非接触式连接器赋能工业互连新方式.pdf》资料免费下载
    发表于 07-31 16:21 0次下载
    ST60非接触式连接器赋能工业互连<b class='flag-5'>新方式</b>

    嵌入式系统C语言编程中主要的错误处理方式

    本文主要总结嵌入式系统C语言编程中,主要的错误处理方式
    发表于 07-24 16:40 537次阅读
    嵌入式系统C<b class='flag-5'>语言</b>编程中主要的错误<b class='flag-5'>处理方式</b>

    C语言基础知识(1)--简介

    C语言能以简易的方式编译、处理低级存储器。
    的头像 发表于 06-08 16:41 1488次阅读
    C<b class='flag-5'>语言</b>基础知识(1)--简介