0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊将Alexa语音助手的部分计算任务转移到自主设计的芯片上

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-11-19 14:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

芯片自研的趋势正愈演愈烈。

云服务巨头亚马逊最近发表声明称,计划将 Alexa 语音助手的部分计算任务转移到自主设计的定制设计芯片 Inferentia 上,以便加速任务的执行速度,同时降低成本。

这意味着亚马逊将减少对英伟达芯片的依赖。

当用户使用亚马逊 Echo 智能音箱呼叫 Alexa 语音助手时,语音数据将发送到数据中心的服务器上,然后再由 AI 系统分析和处理,以文本的形式生成反馈信息,最后再转换成 Alex 的语音,转达给用户。

在此之前,整套流程都是由英伟达芯片驱动的,但从今往后,亚马逊将逐步起用自家的 Inferentia 计算芯片。该芯片发布于 2018 年,专门为执行机器学习任务而定制设计,可以加速文本转语音、识别图像等任务的执行速度。

亚马逊官方介绍,AWS 云服务是使深度学习普及到普通开发者,并以低成本提供按需付费服务的顶尖基础架构。作为加速机器学习任务的定制芯片,Inferentia 是实现这一愿景的长期战略的一部分。

Inferentia 旨在在云端提供高性能推理,降低推理的总成本,配套的软件开发套件(SDK)可以方便开发人员将机器学习集成到其业务中。它的特点主要是高性能,低延迟和高灵活性。

每个 Inferentia 芯片的运算性能最高可达 128 TOPS,而现有的每个 EC2 Inf1 服务最多支持 16 个 Inferentia 芯片。芯片经过了特殊优化,以最大程度地提高小样本尺寸的吞吐量,这对于语音生成和搜索等对延迟要求很高的任务特别有用。

另一方面,Inferentia 拥有大量的片上内存,可用于缓存大型模型,而不是存储在芯片外。由于它的处理核心(又被称作神经核心)可以高速访问存储片上内存中的模型且不受片外存储器带宽限制,因此可以有效减少延迟对推理的重大影响。

亚马逊表示,将 Alexa 相关任务转移到 Inferentia 芯片,可以将延迟降低 25%,成本降低 30%。

亚马逊还强调,开发人员可以使用 TensorFlow,PyTorch 和 MXNet 等流行框架来训练模型,并使用 AWS Neuron SDK 轻松地将它们部署到云服务器上。Inferentia 支持 FP16,BF16 和 INT8 数据类型,还可以采用 32 位训练模型并使用 BFloat16 以 16 位模型的速度自动运行。

近年来,亚马逊,微软和谷歌等公司正在大力发展云计算服务,因此需要大量的数据中心和服务器西元,由此成为了最大的计算芯片客户。这种趋势推动了英伟达,AMD英特尔等公司加大了对计算芯片的研发力度,而且相关营收也不断增长。

但最近的趋势显示,越来越多的技术公司正在尝试摆脱对传统芯片供应商的依赖,转向自主设计芯片的道路。比如苹果最近推出了搭载自研中央处理器 M1 芯片的 Mac 电脑

目前,亚马逊的云端面部识别服务 Rekognition 也已经已开始使用 Inferentia 芯片,但仍有大部分服务依赖于英伟达芯片。

责任编辑:xj

原文标题:告别英伟达,亚马逊计划将Alexa语音处理任务转移至自研芯片

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53539

    浏览量

    459158
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97673
  • 亚马逊
    +关注

    关注

    8

    文章

    2722

    浏览量

    85439
  • Alexa
    +关注

    关注

    2

    文章

    197

    浏览量

    24293

原文标题:告别英伟达,亚马逊计划将Alexa语音处理任务转移至自研芯片

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别
    的头像 发表于 11-14 17:11 1029次阅读

    e203乘法器的优化分享

    原来的MDV模块需要17个周期通过迭代的方式实现乘法计算,作者采用了,booth 4 部分积阵列得到17个部分积,然后在通过压缩器组成的wallance树,巧妙的转化成只剩下两个操作数,最终
    发表于 10-24 10:41

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    新信息的情况下持续学习和改进的AI计算方式。 终身短发怎么保持已有知识和技能的有效性呢 ①知识蒸馏:已有知识从一个模型转移到另一个模型 ②知识更新:根据新知识更新已有知识 ③知识重组:对已有知识进行重组
    发表于 09-14 14:04

    2025年AI智能语音助手市场发展趋势与乐鑫芯片解决方案分析

    2025年AI语音助手市场爆发式增长,全球访问量翻倍,企业普及率达97%。NLP技术突破(语义准确率超95%)与边缘计算支持驱动发展,产品向多模态交互进阶。三大应用场景潜力显著:企业客服(满意度提升
    的头像 发表于 07-05 11:26 1311次阅读

    语音助手只能聊天?启明云端AI语音交互方案偷偷修炼了音乐才艺!

    语音助手只能聊天?太out了!”语音交互的新乐章已经奏响!启明云端基于乐鑫科技芯片的AI语音方案正式解锁音乐技能树,只需一句指令,智能设备
    的头像 发表于 06-27 18:03 714次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>助手</b>只能聊天?启明云端AI<b class='flag-5'>语音</b>交互方案偷偷修炼了音乐才艺!

    乐鑫科技自研声学前端算法通过亚马逊 Alexa 认证,启明云端乐鑫科技代理商

    乐鑫科技AI实验室自主研发的声学前端(AudioFront-End,AFE)算法已通过亚马逊Alexa内置设备的SoftwareAudioFront-End认证。长久以来,乐鑫不仅致力于为AIoT
    的头像 发表于 05-15 18:08 770次阅读
    乐鑫科技自研声学前端算法通过<b class='flag-5'>亚马逊</b> <b class='flag-5'>Alexa</b> 认证,启明云端乐鑫科技代理商

    芯片刻蚀原理是什么

    芯片刻蚀是半导体制造中的关键步骤,用于将设计图案从掩膜转移到硅片或其他材料,形成电路结构。其原理是通过化学或物理方法去除特定材料(如硅、金属或介质层),以下是芯片刻蚀的基本原理和分类
    的头像 发表于 05-06 10:35 1671次阅读

    使用AD7616时,转换完成发送一次写指令0x00就能将所有通道的数据转移到SPIFIFO吗?

    我在使用AD7616时,转换完成发送一次写指令0x00就能将所有通道的数据转移到SPIFIFO吗?DMA又是怎么配置,我是读取的SPIFIFO吗?转换两次读进fifo的时,第二次是接着第一个还是直接覆盖了第一次的?
    发表于 04-24 06:02

    边缘计算网关产品的应用场景

    边缘计算网关是一种云端计算和本地计算结合起来的技术,它可以数据处理和分析的任务从云端
    的头像 发表于 04-20 16:26 548次阅读
    边缘<b class='flag-5'>计算</b>网关产品的应用场景

    是否可以使用OpenVINO™部署管理器在部署机器运行Python应用程序?

    使用 OpenVINO™部署管理器创建运行时软件包。 运行时包转移到部署机器中。 无法确定是否可以在部署机器运行 Python 应用程序,而无需安装OpenVINO™ Toolkit 和 Python。
    发表于 03-05 08:16

    DMD启动后反射的图像左下角的那个像是怎么形成的?

    第一张图是在DMD未启动时,用激光照射DMD芯片时反射的图像 第二张图是DMD启动后,用激光照射DMD芯片时反射的图像。和第一张图相比,大部分反射图像由左下角转移到右上角,但左下
    发表于 03-03 06:13

    掩膜版、模具与微流控芯片及其制作方法与用途

    的玻璃或石英材料制成。通过控制光的传输和反射,掩膜版可以将设计图案转移到硅片,并形成芯片的各种结构。 光罩:制作掩膜版的工具,它是一个透明的平板,上面有一个半导体
    的头像 发表于 02-18 16:42 920次阅读

    亚马逊升级版Alexa推迟发布

    。 此次延迟发布的原因之一,在于升级后的Alexa在测试阶段暴露出了一些问题。据一位匿名的亚马逊员工透露,尽管升级版Alexa在智能交互和语音识别等方面取得了显著进步,但在实际应用中却
    的头像 发表于 02-17 14:02 952次阅读

    Flash语音芯片相比OTP语音芯片的优势

    Flash语音芯片和OTP语音芯片是两种常见的语音解决方案,在各自的应用领域中发挥着重要作用。本文‌
    的头像 发表于 12-16 16:02 932次阅读
    Flash<b class='flag-5'>语音</b><b class='flag-5'>芯片</b>相比OTP<b class='flag-5'>语音</b><b class='flag-5'>芯片</b>的优势

    Flash语音芯片相比OTP语音芯片的优势

    Flash语音芯片和OTP语音芯片是两种常见的语音解决方案,在各自的应用领域中发挥着重要作用。本文‌
    的头像 发表于 12-16 15:44 804次阅读