0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊将Alexa语音助手的部分计算任务转移到自主设计的芯片上

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-11-19 14:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

芯片自研的趋势正愈演愈烈。

云服务巨头亚马逊最近发表声明称,计划将 Alexa 语音助手的部分计算任务转移到自主设计的定制设计芯片 Inferentia 上,以便加速任务的执行速度,同时降低成本。

这意味着亚马逊将减少对英伟达芯片的依赖。

当用户使用亚马逊 Echo 智能音箱呼叫 Alexa 语音助手时,语音数据将发送到数据中心的服务器上,然后再由 AI 系统分析和处理,以文本的形式生成反馈信息,最后再转换成 Alex 的语音,转达给用户。

在此之前,整套流程都是由英伟达芯片驱动的,但从今往后,亚马逊将逐步起用自家的 Inferentia 计算芯片。该芯片发布于 2018 年,专门为执行机器学习任务而定制设计,可以加速文本转语音、识别图像等任务的执行速度。

亚马逊官方介绍,AWS 云服务是使深度学习普及到普通开发者,并以低成本提供按需付费服务的顶尖基础架构。作为加速机器学习任务的定制芯片,Inferentia 是实现这一愿景的长期战略的一部分。

Inferentia 旨在在云端提供高性能推理,降低推理的总成本,配套的软件开发套件(SDK)可以方便开发人员将机器学习集成到其业务中。它的特点主要是高性能,低延迟和高灵活性。

每个 Inferentia 芯片的运算性能最高可达 128 TOPS,而现有的每个 EC2 Inf1 服务最多支持 16 个 Inferentia 芯片。芯片经过了特殊优化,以最大程度地提高小样本尺寸的吞吐量,这对于语音生成和搜索等对延迟要求很高的任务特别有用。

另一方面,Inferentia 拥有大量的片上内存,可用于缓存大型模型,而不是存储在芯片外。由于它的处理核心(又被称作神经核心)可以高速访问存储片上内存中的模型且不受片外存储器带宽限制,因此可以有效减少延迟对推理的重大影响。

亚马逊表示,将 Alexa 相关任务转移到 Inferentia 芯片,可以将延迟降低 25%,成本降低 30%。

亚马逊还强调,开发人员可以使用 TensorFlow,PyTorch 和 MXNet 等流行框架来训练模型,并使用 AWS Neuron SDK 轻松地将它们部署到云服务器上。Inferentia 支持 FP16,BF16 和 INT8 数据类型,还可以采用 32 位训练模型并使用 BFloat16 以 16 位模型的速度自动运行。

近年来,亚马逊,微软和谷歌等公司正在大力发展云计算服务,因此需要大量的数据中心和服务器西元,由此成为了最大的计算芯片客户。这种趋势推动了英伟达,AMD英特尔等公司加大了对计算芯片的研发力度,而且相关营收也不断增长。

但最近的趋势显示,越来越多的技术公司正在尝试摆脱对传统芯片供应商的依赖,转向自主设计芯片的道路。比如苹果最近推出了搭载自研中央处理器 M1 芯片的 Mac 电脑

目前,亚马逊的云端面部识别服务 Rekognition 也已经已开始使用 Inferentia 芯片,但仍有大部分服务依赖于英伟达芯片。

责任编辑:xj

原文标题:告别英伟达,亚马逊计划将Alexa语音处理任务转移至自研芯片

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54631

    浏览量

    470900
  • 英伟达
    +关注

    关注

    23

    文章

    4126

    浏览量

    99774
  • 亚马逊
    +关注

    关注

    8

    文章

    2744

    浏览量

    85933
  • Alexa
    +关注

    关注

    2

    文章

    199

    浏览量

    24442

原文标题:告别英伟达,亚马逊计划将Alexa语音处理任务转移至自研芯片

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI语音助手:助力锁具授权

    使用智能钥匙连接小程序蓝牙,读取锁具ID,然后在界面上手动拍照并提交开锁申请。AI语音助手解决方案引入AI语音助手后,工作人员在读取锁ID后,只需通过
    的头像 发表于 05-13 11:02 341次阅读
    AI<b class='flag-5'>语音</b><b class='flag-5'>助手</b>:助力锁具授权

    亚马逊云科技发布桌面AI助手Amazon Quick,打通应用与数据壁垒

    亚马逊云科技(AWS)近日正式推出桌面AI助手Amazon Quick,旨在个人AI助手能力引入桌面端,帮助用户在日常工作中获得更加连贯、高效的智能体验。
    的头像 发表于 05-11 09:37 592次阅读

    中科创达与Alexa亚马逊云科技深化全球合作

    在第19届北京国际汽车展览会(2026北京车展)亚马逊云科技与Amazon Smart Vehicles携手中科创达,共同展示双方在智能座舱语音解决方案领域的合作成果——助力汽车OEM构建更智能、更高效的车载
    的头像 发表于 04-30 15:45 238次阅读

    亚马逊 Alexa Connect Kit SDK for Matter 现已支持乐鑫 ESP32-C6

    构建兼容Matter标准的Alexa智能家居产品。随着ESP32-C6的加入,ACKforMatter的芯片平台选择进一步扩展,使制造商能够开发具备更强处理能力、更
    的头像 发表于 04-15 18:04 764次阅读
    <b class='flag-5'>亚马逊</b> <b class='flag-5'>Alexa</b> Connect Kit SDK for Matter 现已支持乐鑫 ESP32-C6

    亚马逊Alexa Connect Kit SDK for Matter现已支持乐鑫信息科技ESP32-C6

    继 ESP32-C3 之后,亚马逊 Alexa Connect Kit (ACK) SDK for Matter 现已支持乐鑫信息科技 (688018.SH) ESP32-C6,为设备制造商新增一款
    的头像 发表于 04-14 09:47 746次阅读

    亚马逊云科技Amazon DevOps Agent智能运维助手正式可用

    北京2026年4月7日 /美通社/ -- 亚马逊云科技宣布Amazon DevOps Agent现已正式可用。Amazon DevOps Agent是用户全天候随时待命的智能运维助手。它可跨亚马逊
    的头像 发表于 04-07 14:59 210次阅读

    语音识别芯片介绍,语音识别芯片工作原理解析

    在智能交互不断深入的今天,语音识别芯片正成为众多设备实现语音控制与AI对话的关键部件。语音芯片广义
    的头像 发表于 04-01 16:26 325次阅读

    半导体刻蚀技术如何推动行业革新

    首先,让我们回顾一下刻蚀技术的基础。刻蚀工艺在半导体制造中扮演着至关重要的角色。它的主要任务预先设计好的图案从光刻胶转移到材料表面,并通过物理或化学手段去除表面的一部分,形成我们在
    的头像 发表于 03-25 14:48 1751次阅读
    半导体刻蚀技术如何推动行业革新

    求助,FU6832S的UART案例程序有人能提供一下吗?

    端口转移到P00,P01。 一直通信不成功,这个芯片只能转移,初始化放这里了,有缘人看到或有案例请回复一下,多谢了
    发表于 03-13 17:12

    沐渥科技:光罩盒氮气柜的特点和注意事项

    光罩是半导体制造中光刻工艺所使用的图形转移工具或母版,它承载着设计图形,通过光刻过程图形转移到光刻胶,再经过刻蚀等步骤转移到衬底
    的头像 发表于 01-05 10:29 383次阅读
    沐渥科技:光罩盒氮气柜的特点和注意事项

    超低功耗智能语音芯片-AT690系列芯片

    智芯科自主研发的首款支持语音和视频的多模态存内计算AI芯片AT690成功点亮,并成功跑通端侧语音和图像模型。
    的头像 发表于 12-30 15:35 566次阅读

    单片机的条件转移指令

    条件转移指令是指在满足一定条件时进行相对转移。 判A内容是否为0转移指令 JZ rel JNZ rel 第一指令的功能是:如果(A)=0,则转移,不然次序执行(执行本指令的下一条指令)
    发表于 12-15 08:01

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别
    的头像 发表于 11-14 17:11 1633次阅读

    e203乘法器的优化分享

    原来的MDV模块需要17个周期通过迭代的方式实现乘法计算,作者采用了,booth 4 部分积阵列得到17个部分积,然后在通过压缩器组成的wallance树,巧妙的转化成只剩下两个操作数,最终
    发表于 10-24 10:41

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    新信息的情况下持续学习和改进的AI计算方式。 终身短发怎么保持已有知识和技能的有效性呢 ①知识蒸馏:已有知识从一个模型转移到另一个模型 ②知识更新:根据新知识更新已有知识 ③知识重组:对已有知识进行重组
    发表于 09-14 14:04