0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔新推AI芯片Nervana

SSDFans 来源:cc 2019-01-24 09:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在拉斯维加斯举行的2019年国际消费电子展上,英特尔数据中心集团执行副总裁Navin Shenoy宣布英特尔Nervana神经网络推理处理器将于今年投入生产。早在2016年,英特尔就以4.08亿美元的价格从圣地亚哥收购了拥有48人的AI SAAS初创公司Nervana。 Nervana当时是一家软件公司,提供一个名为Nervana Cloud的全栈软件即服务平台,在一个名为Neon的开源框架基础上支持定制深度学习应用程序的开发。

据报道,Nervana当时正致力于开发用于神经网络处理的定制芯片,他们声称使用这种芯片AI加速器的性能至少会领先GPU10倍。当然,开发自定义处理器对于小型软件团队来说是一项艰巨的任务,但是在它被英特尔收购后,要实现这一想法就变得现实多了。现在,英特尔宣布推出第一款产品,用于推理的英特尔Nervana神经网络处理器,简称NNP-I。该公司还宣布将在今年下半年推出代号为“Spring Crest”的神经网络训练处理器。Nervana Engine最初是采用28nm技术开发的,计划在发布之前升级到14nm。英特尔目前还没有做出回应,但我们推断今年交付的设备将采用英特尔的14nm FinFET技术,未来或许会改用10nm。

英特尔表示Nervana正在与Facebook合作开发,这是一个很有意思的消息,因为Facebook是“超七”数据中心公司,其加速策略一直是不公开的。谷歌开发了自己的处理器,微软,亚马逊和AWS等公司也在基于FPGA的加速方面投入了大量资金。和Facebook成为开发合作伙伴,应该能让Nervana在今年下半年全面上市时获得可靠的端到端认证

神经网络训练和推理是计算密集型的,涉及矩阵的张量乘法和卷积。多年来,图形处理单元(GPU)一直是人工智能训练加速的首选解决方案,而FPGA一直在努力开拓推理游戏中的竞争优势。就像现成的芯片一样,GPU可以充分利用其高度并行的矢量和线性代数功能,非常适合人工智能任务。但是,由于GPU并非专为人工智能而设计,所以当涉及到人工智能和深度学习的架构优化时,GPU仍然有很多问题需要解决。

类似地,FPGA可以通过更低的功耗为推理任务提供极高的并行性和性能,因为不同于训练,推理任务可以通过降低精度的定点计算来完成。大型数据中心和公有云已经开始利用FPGA集群来加速推理任务,在吞吐量、延迟和计算效率方面取得了显着成果。然而,与GPU类似,典型的FPGA上有许多不涉及AI计算的硬件,许多可编程架构使得FPGA作为通用设备非常棒,但作为AI处理器却不够理想。

Nervana是从GPU内核的深度学习开发人员的角度来解决这个问题的,这让他们深刻地认识到GPU对于AI任务的局限性。该公司表示,Nervana引擎是从头开始设计的,抛弃了GPU架构,重新开始。他们分析了许多深层神经网络,并提出了他们认为的最适合关键操作的架构。他们还提出了一种新的数字格式——FlexPoint,它试图最大化16位存储的精度。

由于人工智能计算可能非常耗费内存,因此Nervana需要能够快速移动大量数据。Nervana设备包括32GB的内置高带宽内存(HBM),可提供8Tb/s的内存访问带宽。HBM存储器通过芯片3D堆叠实现高容量。一个HBM芯片栈可以存储8GB的数据,其中包含8个1GB的独立内存模块。Nervana引擎包括4个HBM栈,提供32GB的存储。英特尔的多模封装技术将HBM与处理器核心阵列连接起来。我们推测这是由英特尔的2.5D嵌入式多模互连桥(EMIB)技术而不是新宣布的FOVEROS 3D封装完成的,不过英特尔并没有给出明确答案。

Nervana引擎由一系列“Tensor Processing Cores”组成,这些核心由HBM基板、内存接口和高速IO组成,旨在将许多Nervana设备组合在一起,以提供超大规模的网络部署。英特尔尚未给出新设备的具体性能或功耗数据,只是说功耗将达到数百瓦,和Movidius和Mobileye等边缘目标AI设备相比,Nervana明显将用于数据中心。

该设备包括六条双向高带宽链路,该公司表示该芯片能够在机箱内部或机箱之间无缝连接。该公司表示,这使用户能够通过简单地分配更多的计算,或者在不降低速度的情况扩展模型规模,从而在当前模型上获得线性加速。将多台设备连接在一起可以作为一个大处理器。

Nervana的目标是在数据中心抢食GPU和FPGA的市场。由于英特尔在其PSG部门(前身为Altera)拥有世界上最好的FPGA技术之一,因此它认为Nervana在推理方面超过FPGA,在训练方面比GPU具有更明显的优势。特别是英伟达(NVIDIA),它在AI训练领域占据着主导地位,显然是Nervana瞄准的目标。

随着更多不同领域的AI设备进入市场,目前的通用处理器芯片无法满足需求,会有越来越多的AI芯片出现,我们将拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179292
  • AI芯片
    +关注

    关注

    17

    文章

    2063

    浏览量

    36566

原文标题:英特尔推出AI芯片:Nervana

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    今日看点丨英特尔获软银 20 亿美元投资;ARM 为自研芯片挖角对手:亚马逊 AI 芯片主管加盟

    的普通股。受此消息影响,英特尔股票在盘后交易中上涨了 4%。   此次投资被视为对英特尔的一次重要信任投票。近年来,英特尔在先进半导体领域未能充分抓住人工智能(AI)热潮带来的机遇,导
    发表于 08-19 10:36 1558次阅读

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘AI领域布局哪些
    的头像 发表于 08-04 08:46 6727次阅读
    4450亿美元!Edge <b class='flag-5'>AI</b>市场大爆发,<b class='flag-5'>英特尔</b>布局哪些<b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>?

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中一款6776P被用作是DGX B300的主控CPU,这款处理器究竟
    的头像 发表于 06-27 11:44 603次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    在2025北京机器视觉展览会(VisionChina)以“AI 视界:英特尔推动智能制造革新浪潮”为主题的英特尔论坛中,英特尔与诺达佳联合发布了 基于
    发表于 06-24 17:50 1391次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制器与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算事
    的头像 发表于 06-20 17:32 695次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔
    的头像 发表于 05-21 00:57 6960次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和
    的头像 发表于 05-20 12:27 5154次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2
    发表于 05-20 11:03 1665次阅读

    英特尔先进封装:助力AI芯片高效集成的技术力量

    ),以灵活性强、能效比高、成本经济的方式打造系统级芯片(SoC)。因此,越来越多的AI芯片厂商青睐这项技术。 英特尔自本世纪70年代起持续创新,深耕封装技术,积累了超过50年的丰富经验
    的头像 发表于 03-28 15:17 656次阅读
    <b class='flag-5'>英特尔</b>先进封装:助力<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>高效集成的技术力量

    英特尔借助开放生态系统,加速边缘AI创新

    英特尔推出全新AI边缘系统、边缘AI套件和开放边缘平台软件,赋能合作伙伴将AI无缝融入现有基础设施   英特尔发布全新
    发表于 03-21 11:31 302次阅读
    <b class='flag-5'>英特尔</b>借助开放生态系统,加速边缘<b class='flag-5'>AI</b>创新

    英特尔至强6再新品!打造最强AI“机头引擎”

    的产品矩阵,很好地满足市场的多样化需求;另一方面,凭借卓越的 AI 性能提升,英特尔为数据中心提供了性能强劲的机头节点 CPU,助力企业在数字时代的浪潮中稳步前行。 事实上,去年9月,英特尔就推出了配备128核的6900性能核处
    的头像 发表于 03-13 14:57 590次阅读

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    探索座舱“未至之境”:英特尔支持DeepSeek车内本地运行

    车载独立显卡的发布,更是将能支持的模型参数至32B。当下经典的AI驾舱应用,比如,驾驶员与AI助手讨论明天的行程,关于沿途各种地标的语音交互,乃至于如语音调节温度、问询操作指引等经典应用场景,由于DeepSeek的到来,会变得
    的头像 发表于 02-14 16:19 608次阅读
    探索座舱“未至之境”:<b class='flag-5'>英特尔</b>支持DeepSeek车内本地运行

    英特尔塑造未来出行:AI增强型软件定义汽车

    近日,英特尔正引领一场汽车行业的革命,通过其创新技术为用户带来前所未有的车载体验。基于英特尔第一代AI增强型软件定义车载SoC(系统级芯片)和全新
    的头像 发表于 01-14 11:20 888次阅读