0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔新一代AI芯片NNP-L1000明年面世

DPVg_AI_era 来源:未知 作者:胡薇 2018-05-25 14:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔首届AI开发者大会发布了一系列机器学习软件工具,并宣布包括其首款商用神经网络处理器产品将于2019年推出。英特尔在旧金山举办第一届AI开发者大会(AI Dev Con),英特尔人工智能负责人Naveen Rao做了开场演讲。

Rao此前是Nervana的CEO和联合创始人,该公司于2016年被英特尔收购。

Naveen Rao

在会上,Rao发布了一系列机器学习软件工具,并宣布英特尔新一代产品,其中包括其首款商用NNP产品NNP-L1000,将于2019年推出。

以下从软件和硬件两个方面介绍AI Dev Con的重点。

MKL-DNN是用于深层神经网络的数学内核库。它是神经网络中常见组件的数学程序列表,包括矩阵乘数、批处理规范、归一化和卷积。该库针对在英特尔CPU上部署模型进行了优化。

nGraph开发者选择不同的AI框架,它们都有各自的优点和缺点。为了使芯片具有灵活性,后端编译器必须能够有效地适应所有的芯片。

nGraph是一个编译器,它可以在英特尔的芯片上运行。开发人员可能想要在英特尔的Xeons处理器上训练他们的模型,然后使用英特尔的神经网络处理器(NNP)进行推理。

BigDL是Apache Spark的另一个库,它的目标是通过分布式学习在深度学习中处理更大的工作负载。应用程序可以用Scala或Python编写,并在Spark集群上执行。

OpenVINOA软件工具包用于处理“边缘”(即摄像头或移动电话)视频的模型。开发人员可以实时地做面部识别的图像分类。它预计将在今年晚些时候开放,但现在可以下载了。

再来看硬件部分。

英特尔在这方面比较沉默,没有透露更多的细节。

“几年前Xeons不适合AI,但现在真的已经改变了。”Rao强调,增加的内存和计算意味着自Haswell芯片以来性能提高了100倍,并且推理的性能提高了近200倍。

“你可能听说过GPU比CPU快100倍。这是错误的。”他补充说,“今天大多数推理都是在Xeons上运行的。”

Rao没有提到Nvidia,他解释说GPU在深度学习方面起了个好头,但受限于严重的内存限制。 Xeon拥有更多的内存,可以扩展到批量大的内存,因此它更适合推理。

在现场,ZIVA CEO James Jacobs还介绍了如何将Xeons用于3D图像渲染。

左边的狮子是没有使用AI,右边的狮子使用了AI,效果很棒。

他也简要地谈到了FPGA加速的问题,并表示英特尔正在研发一种“离散加速器”(discrete accelerator)进行推理,但没有透露更多细节。

同时,还介绍了Intel Movidius的神经计算棒。它是一个U盘,可以运行使用TensorFlow和Caffe编写的模型,耗电量大约一瓦。去年,英特尔公司决定终止其可穿戴设备,如智能手表和健身腕带。

现场还展示了一段用计算棒来进行AI作曲的DEMO,人类演奏者演奏一段曲子,AI能够在这段曲子的基础上进行创作。

英特尔去年宣布神经网络处理器(NNP)芯片。虽然没有发布任何基准测试结果,但英特尔表示将会有可供选择的客户。

Rao也没有透露多少细节。不过,大家所知道的是,它包含12个基于其“Lake Crest”架构的内核,总共拥有32GB内存,在未公开的精度下性能达到40 TFLOPS,理论上的带宽不足800纳秒,在低延迟的互连上,每秒2.4兆的带宽。

最后介绍了NNP L1000,Rao对它的介绍更少,这将是第一个商业NNP模型,并将在2019年推出。它将基于新的Spring Crest体系结构,预计将比之前的Lake Crest模型快3到4倍。

开发者大会的当天,英特尔官网发出一篇Rao的署名文章,对英特尔Nervana神经网络处理器(NNP)进行了介绍。

Nervana NNP有一个明确的设计目标,可实现高计算利用率和支持多芯片互连的真模型并行。

行业里讨论了很多关于最大的理论性能,然而,实际情况是,除非体系结构有能够支持这些计算元素的高利用率的储存器子系统,否则大部分计算都是没有意义的。此外,行业发布的大部分性能数据使用的是大型矩阵,这些矩阵通常在现实世界的神经网络中并不常见。

英特尔专注于为神经网络创建一个平衡的架构,它还包括低延迟的高芯片到芯片带宽。NNP系列的初始性能基准在利用率和互连方面显示出强劲的竞争力。具体包括:

使用A(1536, 2048)和B(2048, 1536)矩阵进行矩阵乘法运算的一般矩阵,在单个芯片上实现了96.4个百分点的计算利用率。这代表了在单个芯片上的实际(非理论)性能的38TOP/s。支持模型并行训练的多芯片分布式GEMM操作实现了A(6144,2048)和B(2048,1536)矩阵大小的接近线性缩放和96.2%的缩放效率,使得多个NNP能够连接在一起,并将我们从其他架构的内存限制中释放出来。

我们测量了89.4 %的单方向芯片到芯片的效率,理论上的带宽小于790ns(纳秒)的延迟,并且将其应用于2.4Tb/s的高带宽、低延迟互连。

所有这些都在单芯片总功率范围内低于210瓦的情况下进行,这只是英特尔Nervana NNP(Lake Crest)原型。

英特尔将在2019年提供第一个商用NNP产品——英特尔Nervana NNP-L1000(Spring Crest)。

预计英特尔Nervana NNP-L1000的性能将达到第一代Lake Crest产品的3-4倍。

在英特尔Nervana NNP-L1000中,还将支持bfloat16,这是一种业界广泛用于神经网络的数字格式。

随着时间的推移,英特尔将在其AI产品线上扩展bfloat16支持,包括英特尔Xeons处理器和英特尔FPGA。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10316

    浏览量

    181045
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302517
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208

原文标题:超越传统CPU?英特尔新一代AI芯片明年面世

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔炮轰,AMD回击!掌机市场芯片之争

    英特尔推出的才是专为掌机设计的最新处理器,信心源于新一代旗舰产品Panther Lake处理器。该处理器是首款基于英特尔18A工艺节点制造的消费级SoC,在“每瓦性能”数据上表现优异,结合XeSS 3超级采样技术和Arc核显,
    的头像 发表于 01-12 09:09 5325次阅读

    超越台积电?英特尔首个18A工艺芯片迈向大规模量产

    电子发烧友网报道(文/李弯弯)10月9日,英特尔公布了代号Panther Lake的新一代客户端处理器英特尔®酷睿™Ultra(第三)的架构细节,这款产品预计于今年晚些时候出货。Pa
    的头像 发表于 10-11 08:14 9368次阅读
    超越台积电?<b class='flag-5'>英特尔</b>首个18A工艺<b class='flag-5'>芯片</b>迈向大规模量产

    轻薄、AI、数日续航、性能强劲,第三英特尔酷睿Ultra新品重磅上市

    今日,英特尔在上海举办了第三英特尔酷睿Ultra处理器新品分享会。作为全球首款基于Intel 18A工艺打造的计算平台,第三英特尔酷睿
    的头像 发表于 03-19 13:12 232次阅读

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对边缘侧的
    的头像 发表于 11-19 21:51 7064次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得
    的头像 发表于 08-07 14:42 1521次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘AI领域布局哪些
    的头像 发表于 08-04 08:46 7339次阅读
    4450亿美元!Edge <b class='flag-5'>AI</b>市场大爆发,<b class='flag-5'>英特尔</b>布局哪些<b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>?

    英特尔发布边缘AI控制器与边缘智算体机,创造“AI新视界”

    处理器的边缘 AI 控制器 和 基于英特尔锐炫 ™ 显卡的边缘智算体机 ,为工业AI的规模化落地注入强劲动力。 英特尔与诺达佳联合发布边缘
    发表于 06-24 17:50 1564次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制器与边缘智算<b class='flag-5'>一</b>体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。
    的头像 发表于 06-20 17:32 1022次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔
    的头像 发表于 05-21 00:57 7710次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布<b class='flag-5'>新一代</b>GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和
    的头像 发表于 05-20 12:27 5616次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布<b class='flag-5'>新一代</b>GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2
    发表于 05-20 11:03 1910次阅读

    英特尔与面壁智能宣布建立战略合作伙伴关系,共同研发端侧原生智能座舱,定义下一代车载AI

    今日,英特尔与面壁智能签署合作备忘录。双方宣布达成战略级合作伙伴关系,旨在打造端侧原生智能座舱,定义下一代车载AI。目前,双方已合作推出“英特尔&面壁智能车载大模型GUI智能体”,将端
    的头像 发表于 04-23 21:46 1320次阅读
    <b class='flag-5'>英特尔</b>与面壁智能宣布建立战略合作伙伴关系,共同研发端侧原生智能座舱,定义下<b class='flag-5'>一代</b>车载<b class='flag-5'>AI</b>

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    4月23日,在上海车展上,英特尔发布第二英特尔AI增强软件定义汽车(SDV)SoC,并披露全新合作伙伴关系。第二
    的头像 发表于 04-23 21:20 1638次阅读
    <b class='flag-5'>英特尔</b>首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    基于芯粒架构的设计,进步扩展了英特尔在智能座舱领域的创新产品组合。同时,英特尔还宣布与黑芝麻智能、面壁智能、BOS Semiconductors等公司建立合作关系,共同攻克汽车智能化进程中的技术难题,建设开放共赢的智能汽车生态
    发表于 04-23 14:26 804次阅读

    从想象到现实,英特尔与MAXHUB带你走进AI PC新视界

    2025年4月16日,北京 ——专业视听行业的标志性年度盛会InfoComm China 2025今日盛大开幕。会上,英特尔携手MAXHUB联合发布MAXHUB 全新一代台式计算机。英特尔客户端计算
    的头像 发表于 04-21 10:40 612次阅读
    从想象到现实,<b class='flag-5'>英特尔</b>与MAXHUB带你走进<b class='flag-5'>AI</b> PC新视界