0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊推出基于Inferentia芯片的Inf1实例

汽车玩家 来源:芯智讯 作者:芯智讯 2019-12-05 14:31 次阅读

当地时间12月3日,亚马逊在“AWS re:invent”大会上正式发布了自主研发的第二代基于Arm架构的服务器芯片Graviton2,同时公布了去年发布的云端AI推理芯片Inferentia的最新进展。

亚马逊AWS在此次大会上推出了Inf1实例,该实例由Inferentia芯片提供支持,是一个在云端为AI推理提供支持的实例,AWS CEO Andy Jassy称之为云中可用的成本最低的推理产品

Andy Jassy 指出:使用云服务为AI解决方案提供动力的运营成本绝大多数来自推理,而推理芯片可能会很昂贵,并且要求低延迟和高吞吐量。许多企业都在模型训练的定制芯片上投入了大量精力,尽管常规 CPU 上已经能够较好地执行推理运算,但定制芯片的效率明显更高。“与Nvidia G4实例相比,Inf1具有更低的延迟,吞吐量将提高3倍,并且每个实例的成本降低40%。”

Inferentia芯片还将由Annapurna Labs提供支持,该芯片企业是2015年被以色列AWS收购的。Inferentia芯片拥有4的个NeuronCore,可以提供128TOPS的算力,而每个Inf1实例可以提供2000 TOPS的算力。

与 EC4 上的常规 G4 实例相比,Inferentia 能够让 AWS 带来更低的延时、三倍的吞吐量、且降低 40% 单次的成本。

Inf1实例目前已经上市,并将与PyTorch,MXNet和TensoRFlow集成。不过,目前其仅可在EC2计算服务中使用,但明年,Inf1将可以用于EKS实例和Amazon的SageMaker,来进行机器学习的推理运算。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8651

    浏览量

    361773
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264038
  • 亚马逊
    +关注

    关注

    8

    文章

    2480

    浏览量

    82372
收藏 人收藏

    评论

    相关推荐

    亚马逊推出电商AI工具

    亚马逊近日宣布推出了一项创新的电商AI工具,该工具旨在帮助卖家们更加高效地创建产品详情页面。据了解,这一AI新功能具备强大的自动化能力,能够基于卖家提供的关键词和产品图片等信息,智能地生成产品标题、描述以及其他重要的详细信息。
    的头像 发表于 03-21 11:45 367次阅读

    亚马逊云科技在中国区域推出Amazon Network Firewall

    轻松实现云上工作负载保护 北京2024年3月7日 /美通社/ -- 亚马逊云科技宣布,通过与光环新网和西云数据的紧密合作,在亚马逊云科技(北京)区域和(宁夏)区域推出网络防火墙服务Amazon
    的头像 发表于 03-07 16:02 312次阅读

    一文了解亚马逊云科技云服务器面向macOSAmazon EC2 M1 Mac实例

    日前,亚马逊云科技宣布基于Apple芯片Mac mini计算机构建的Amazon Elastic Compute Cloud(Amazon EC2)M1 Mac实例正式可用。该实例
    的头像 发表于 10-08 10:38 287次阅读

    新官宣!投资高达40亿美元!亚马逊云科技助力Anthropic未来基础模型开发

    云科技的客户使用。双方深化合作的部分内容包括: Anthropic将使用Amazon Trainium和Amazon Inferentia芯片来构建、训练和部署其未来基础模型,并充分利用亚马逊云科技在价格
    的头像 发表于 09-28 11:55 455次阅读

    亚马逊宣布与Anthropic展开战略合作,共同推进生成式AI发展

    Anthropic选择亚马逊云科技作为首选云服务供应商,并将在Amazon Trainium和Amazon Inferentia芯片上进行其未来基础模型的训练和部署,充分利用亚马逊云科
    的头像 发表于 09-27 10:34 431次阅读

    40亿美元!亚马逊投资OpenAI最强竞品

    亚马逊与 Anthropic 的联手,和微软与 OpenAI 的合作相类似,未来 Anthropic 将利用 AWS 的高性能、低成本机器学习加速器,在 AWS Trainium 和 Inferentia 芯片上训练和部署其未来
    的头像 发表于 09-26 15:58 407次阅读

    英伟达与云巨头必有一战

    众所周知,谷歌、亚马逊、微软先后在内部启动自研AI芯片项目——谷歌的TPU系列,亚马逊Inferentia和Trainium系列,以及微软今年被曝光的Athena
    的头像 发表于 08-21 15:00 449次阅读
    英伟达与云巨头必有一战

    亚马逊,大力发展芯片

    亚马逊网络服务首席执行官 Adam Selipsky在 6 月份接受 CNBC 采访时表示:“全世界都希望有更多芯片用于生成人工智能,无论是 GPU 还是我们正在设计的亚马逊自己的芯片
    的头像 发表于 08-14 13:33 376次阅读

    亚马逊美国站要求提供的FCC认证是什么?

    亚马逊
    jf_68417261
    发布于 :2023年08月04日 15:01:57

    FPGA时序分析-建立时间和保持时间裕量都是inf怎么解决呢?

    今天有个小伙伴遇到一个问题,就是在vivado里面综合后看到的建立时间和保持时间裕量都是inf,我们来看看怎么解决这个问题。
    发表于 07-30 10:26 737次阅读
    FPGA时序分析-建立时间和保持时间裕量都是<b class='flag-5'>inf</b>怎么解决呢?

    亚马逊云科技推出七项生成式AI创新

    北京2023年7月27日 /美通社/ -- 亚马逊云科技近日在纽约峰会上宣布,推出七项生成式AI创新,包括Amazon Bedrock新增基础模型供应商Cohere和全新基础模型,以及全新代理
    的头像 发表于 07-27 16:19 536次阅读
    <b class='flag-5'>亚马逊</b>云科技<b class='flag-5'>推出</b>七项生成式AI创新

    卷发棒亚马逊UL859检测报告

    亚马逊
    jf_68417261
    发布于 :2023年07月11日 14:49:19

    亚马逊磁铁政策需要提供的标准要求

    亚马逊
    jf_38631377
    发布于 :2023年07月10日 10:43:06

    磁性黏土商品在亚马逊上架所需的检测标准

    亚马逊
    jf_38631377
    发布于 :2023年06月30日 11:37:03

    全新亚马逊EC2 M7a实例使用第四代AMD EPYC处理器

      —基于第四代AMD EPYC处理器的全新亚马逊 EC2 M7a实例预览— —亚马逊EC2 M7a实例提供了性能上的重大飞跃,其计算性能比M6a
    的头像 发表于 06-20 11:35 512次阅读