0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

今年Hot Chips大会上的一些有趣的讨论

电子工程师 来源:未知 作者:李倩 2018-09-05 10:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今年夏天,全球芯片领域的年度大事——Hot Chips大会,一共举办了25场会议,其中有16场或多或少都聚焦于处理人工智能(AI)任务的芯片上。这些芯片应用涉及范围广泛,从瞄准物联网(IoT)和智能手机的超低功耗组件,到数据中心所需的高耗电芯片等。

曾经围绕着x86架构的产业整并,使得这一微处理器年度盛事有好几年变得不那么有趣。而今,随着机器学习的崛起,Hot Chips再度成为专注于芯片架构的工程师热烈参与的年度盛会。

不管你相不相信,芯片业近来关注的重点并不只是深度学习。例如,大会中的一位发言人还介绍了可能取代DRAM的竞争方案,并呼吁探讨更多关于内存技术的话题。

赛灵思(Xilinx)展示了一款针对AI打造的全新FPGA变化版本,并邀请与会者针对基于安全的全新运算架构展开设计移动。

Alphabet董事长John Hennessey在发表专题演讲时指出,在Google计算机架构师发现安全漏洞之前,业界广泛使用的推测执行(speculative execution)技术易于遭受旁路攻击(side-channel attack)的情况已经存在长达20年了。

Insight64分析师Nathan Brookwood说:“这不禁令人怀疑还有什么是我们以往没有注意到的......鉴于这些产品如此复杂却仍能有效作业,这一点真的令人惊讶。”。

接下来,我们将重点介绍在今年Hot Chips大会上的一些有趣的讨论。我们将从其中一些令人印象深刻的创新想法和目标设计开始谈起。

新创公司Tachyum挑战Xeon

新创公司Tachyum无疑是其中最具有胆识的,但却并不被看好。该公司的目标在于透过其Prodigy芯片,从而在主流服务器(server)用处理器和AI加速器市场分一杯羹。Tachyum宣称其Prodigy芯片的核心“比英特尔(Intel)的Xeon更快,也比Arm核心更小”。

该公司表示,这款7纳米(nm) 290 mm2芯片支持多达64个核心,可在4GHz执行频率下提供高达2TFlops的运算效能,预计明年出样。

事实上,如果没有重大的性能升级以及经过多方测试,数据中心营运商不太可能在其x86架构中采用新创公司的芯片和软件。因此,分析师Brookwood对于Tachyum采用超长指令字(VLIW)架构抱持怀疑态度,毕竟这是英特尔在其Itanium中未能完美掌握的技术。他补充说,如果该芯片能取得任何市场吸引力,Tachyum很可能面临来自英特尔等巨擘的专利诉讼。

Tachyum的Prodigy芯片支持九阶整数和14阶浮点运算管线架构(本文图片来源:Hot Chips)

Optane引发法规争议?

英特尔描述其最新的14nm Xeon服务器处理器Cascade Lake。该公司在不久前的一场活动中才发布这款芯片,但在Hot Chips大会上提供了更多细节,但也引发一些争议。

Cascade Lake采用与英特尔现有14nm Xeon相同的机制、散热和插槽接口,也支持相同的核心数、快取结构以及I/O速度。新增部份包括微调14nm工艺,以提高一点性能和降低一些功耗。此外,该芯片还支持新的AI指令和硬件,以避免暴露于Meltdown/Spectre的旁路通道攻击。

但其重点在于,Cascade Lakes是第一款带有内存控制器的Xeon,可支持Intel Optane (即3D XPoint内存),可为每插槽提供高达3TB主存储器以及带来超越DRAM的读/写速度。

介绍该新产品的英特尔工程师并未评论Optane的耐用性。然而,他表示,这些主板使用的Jedec DDR4电气总线采用英特尔的专有协议,这已能让竞争对手近期内都望尘莫及。

Brookwood说:“我认为这并不至于构成法律挑战。”

“如果我是IBM或AMD,当Optane DIMM普及于数据中心而我却无法取得时,那么我可能会要大发牢骚了!英特尔占据了98%的服务器市场,在我看来,这就是一种垄断。”

英特尔目前正主导储存网络产业协会(SNIA),为Optane等替代主流内存打造软件平台

NEC加速器低价挑战Nvidia V100

NEC描述一款新的向量引擎,可搭载PCIe Gen 3板卡,而功耗还不到200W。该芯片专为搭配SX-Aurora超级计算机与Linux服务器中的x86主机而设计,据称其价格要比Nvidia V100更低得多。

NEC声称其向量芯片可提供高达307GFlops的双精度性能。在大多数基准检验下,其性能可介于Xeon和V100二者之间。该公司还指出,NEC芯片的内存带宽略高,而且在一些工作负载上的性能功耗比几乎相当于Nvidia GPU

相较于Nvidia V100芯片尺寸约840 mm2,NEC的1.6GHz、16nm向量芯片尺寸相对较小——480-mm2。此外,NEC的芯片支持多达6个Hi8或Hi4 HBM2内存堆栈,可提供高达48GB的总内存容量。

为IoT打造超低功耗AI加速器

美国哈佛大学(Harvard University)和Arm的研究人员连手发表一种用于物联网中执行深度学习任务的超低功耗加速器。这款所谓的SMIV芯片采用台积电(TSMC) 16-nm FFC工艺打造,芯片尺寸约为25 mm2。

SMIV可说是使用Arm Cortex-A核心的首款学术界开发芯片。它在always-on的加速器丛集中使用近阈值操作,并透过嵌入式FPGA模块提供大约80个硬件MAC和44Kbits RAM

因此,该芯片能以低功率提供更高精确度。同时,相较于竞争方案,它的功率和面积效率都提高了近10倍。

MIT打造更低功耗导航芯片

美国麻省理工学院(MIT)的研究人员则为机器人无人机打造了一款客制设计的导航芯片,据称该芯片的功耗较Arm CPU核心更低。这款Navion导航芯片采用65nm CMOS制造,在20-mm2芯片面积上打造视觉惯性测距引擎。

研究人员称,该芯片的性能是标准CPU的2倍至3倍,并可缩减多达5.4倍的内存占用空间。它在最大配置下的功耗为24mW,而在优化配置时的功耗仅2mW,而仍能实现实时导航。

在Hot Chips大会的多场会议中只针对已发布的组件(有的甚至都已经出货)提供较多细节。接下来我们将先介绍用于客户端系统的AI加速器和CPU,并将关注焦点转向服务器处理器和加速器。

Arm展示新款机器学习核心实力

Arm深入探讨其预计将在年底出现在芯片中的机器学习核心。新款机器学习核心可在1GHz提供约4TOPS运算性能,以及在以7nm制造的2.5-mm2核心上提供超过3TOPS/W性能。其乘法累加单元支持8个16位宽点乘积。

Arm介绍其机器学习核心上的8 x 8区块压缩

三星提升智能手机性能

三星举例说明聪明的工程师如何在工艺技术进展趋缓时显著提升性能。因此,从一系列基准检验来看,目前在其智能手机中使用的2.7GHz M3应用处理器,轻轻松松地就能超越前一代M2至少50%以上。

这项进展来自于在其分支预测器中使用神经网络,以及利用德州农工大学(Texas A&M )教授Daniel A. Jiménez的学术研究成果。不过,M3应用处理器的芯片尺寸是M2的2倍以上,但采用了10 LPP工艺——这是三星10 LPE工艺的微幅升级。

Mythic展示内存处理器最新进展

Mythic描述其内存处理器(PIM)设计细节,它可用于处理具有0.5 picojoules/MAC的深度学习影像。该芯片设计针对监控和工厂相机,功耗约为5W,包括所有数字控制逻辑。

PIM概念已出现多年了,但一直到最近才被应用于AI。Mythic打造基于NOR单元的可变电阻器数组,但并不在内存单元写入和读取深度学习权重。相反地,它将电压施加到数组线,以求和并读取电流级,进一步达到省电的效果。

初始芯片可处理有限数量的权重,但基于砖式(tile)的设计可为全标线芯片扩展多达5倍权重。此外,还可以添加Arm核心以创建可编程组件,而且多个芯片间可以协同工作以执行更大的应用程序(app)或更快地执行。但缺点之一在于无法利用神经网络的稀疏特性。

Mythic声称,这款40nm芯片的功耗只有GPU的一小部份。该公司预计明年年中提供样片,并预计于2019年底量产。

Mythic的PIM目的在于以MCU功率提供GPU性能,而不至于影响稀疏神经网络

Google侧写Pixel Visual Core

Google介绍在其最新智能手机中的Pixel Visual Core。这款基于A53的可编程引擎,专为手机摄影机执行目前仍在发展中的最新版HDR +算法。一位Google工程师打趣地说:“它能让你的社交媒体图片看来不会太糟糕。”

有趣的是,三星内存部门的一位工程师问道,未来世代是否会放弃典型的图像处理管线,转而采用新兴的深度学习技术?Google工程师回复说:“但我们还没在这个领域发布太多AI算法啊!”

Google声称其28nm Pixel核心执行HDR+作业的速度比10nm移动应用处理器的CPU快至少2.8倍

IBM强化Power 9服务器系统

针对服务器领域,IBM与英特尔似乎都在14nm节点停摆一段时间了。IBM这次在Hot Chips介绍其最新的计划,为基于其Power 9处理器的系统强化I/O和内存带宽,不过,至少要到2020年或之后才会针对新工艺提供新设计了。

IBM的目标是在其Power 9服务器上发掘更多内存带宽,同时为基于7-nm处理器的设计做好准备

富士通将Arm核心带入超级计算机

富士通(Fujitsu)描述了7-nm A64FX,其设计目标在于成为超级计算机中的首批Arm核心之一。该512位SIMD芯片为Arm架构带来向量扩展,以执行传统的超级运算和新的AI任务。52核心的芯片使用32GB HBM2内存,可提供2.7TFlops性能和1,024GB/s的内存带宽。

富士通的首款post-Sparc设计A64FX,瞄准用于将在2021年发表的日本新一代Post-K超级计算机

Nvidia展示其GPU服务器实力

Nvidia透过其DGX-2及其内部NVLink互连,从芯片进一步扩展到系统。该公司展示了几项基准检验,包括以DGX-2展现超越标准双GPU系统的性能。

英特尔、AMD以及…中东和平?

英特尔介绍如何使用其嵌入式多芯片互连桥接(EMIB)技术,将其Kaby Lake桌上型x86 CPU与AMD Radeon RX Vega M GPU连接在一个模块(下图)中,以用于轻薄型笔记本电脑

分析师Brookwood还与英特尔主讲人开玩笑说,“不管是谁来谈成这项协议的,接下来应该可以派他去进行中东和平的任务。“

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53554

    浏览量

    459304
  • 物联网
    +关注

    关注

    2939

    文章

    47334

    浏览量

    408079
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:Hot Chips 2018大会上13款最“热”芯片

文章出处:【微信号:FPGAer_Club,微信公众号:FPGAer俱乐部】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA AI网络闪耀2025云栖大会

    2025 云栖大会于 9 月 24 日至 9 月 26 日举办,NVIDIA 作为大会巅峰合作伙伴参与 2025 云栖大会。本文将带您回顾 NVIDIA AI 网络在本届云栖大会上的精
    的头像 发表于 10-13 11:19 808次阅读

    云栖大会上,感受AI汽车的"乐与路"

    外的天气热度,和会场内的人群热度,都达到了个相当高的程度。 每个我遇见的新老朋友都会说,今年大家对AI的关注度明显提高了,讨论的问题也都非常的实际。 而我这次对
    的头像 发表于 10-09 12:08 298次阅读
    云栖<b class='flag-5'>大会上</b>,感受AI汽车的&quot;乐与路&quot;

    芯导科技亮相2025亚洲AI音频大会

    近日,国内领先的功率半导体厂商芯导科技(股票代码:688230.SH)隆重出席了2025亚洲AI音频大会,在大会上,芯导科技深度展示了其针对智能耳机与智能音响领域的最新功率半导体解决方案,吸引了行业内外众多关注。
    的头像 发表于 09-20 11:33 1130次阅读
    芯导科技亮相2025亚洲AI音频<b class='flag-5'>大会</b>

    如何在TPU上使用JAX训练GPT-2模型

    如果您对如何使用 JAX 从头开始构建语言模型感到好奇,那么本文非常适合您。我们在 2025 年 Google Cloud Next 大会上举办了场关于此主题的研讨会,并获得了一些很好的反馈,我们也为所有无法参会的开发者编写了
    的头像 发表于 09-03 11:39 1430次阅读
    如何在TPU上使用JAX训练GPT-2模型

    NVIDIA在Hot Chips 2025大会展示创新技术

    本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Blackwell 以及 CUDA 如何为全球数
    的头像 发表于 08-27 12:52 1635次阅读

    Vicor邀您相约2025中国国际低空经济产业创新发展大会

    Vicor 将在 2025 中国国际低空经济产业创新发展大会上展示 eVTOL 800V 平台 DC-DC 解决方案。
    的头像 发表于 06-03 17:40 763次阅读

    2025 Google I/O大会演讲亮点回顾

    今年的 Google I/O 大会上,我们展示了如何在 Google 的各个平台进行应用构建,并利用 Google DeepMind 的卓越 AI 模型实现创新,大展拳脚。以下是开发者主旨演讲中的重磅亮点内容,不容错过。
    的头像 发表于 05-28 09:34 766次阅读

    Google I/O 2025大会回顾

    通常,在 I/O 大会的前几周,我们不会透露太多信息,因为我们会把最重磅的模型留到大会上发布。但在 Gemini 时代,我们很可能在三月某个周二已经推出最智能的模型,或者提前周公布像 AlphaEvolve 这样令人振奋的突破
    的头像 发表于 05-23 14:54 889次阅读

    Debian和Ubuntu哪个好一些

    兼容性对比Debian和Ubuntu哪个好一些,并为您揭示如何通过RAKsmart服务器释放Linux系统的最大潜能。
    的头像 发表于 05-07 10:58 866次阅读

    2025慕展:功率半导体厂商和产品的一些观察

    不少厂商在数据中心电源上发力,光伏储能、OBC等领域,多家碳化硅厂商已经大规模导入产品。当然,近期火热的人形机器人,也有部分厂商展示出一些基于GaN的方案。 那么下面就来看看本次慕展上,功率半导体领域有哪些值得关注的新品和
    的头像 发表于 04-25 09:08 1755次阅读
    2025慕展:功率半导体厂商和产品的<b class='flag-5'>一些</b>观察

    Google Cloud Next 2025大会亮点回顾

    我们在 Next 25 大会上展现了企业采用 AI 的强劲动能,并就已全面集成 AI 技术堆栈的各个层面推出系列创新功能。
    的头像 发表于 04-16 11:22 1724次阅读

    自然语言提示原型在英特尔Vision大会上首次亮相

    在英特尔Vision大会上,Network Optix首次展示了自然语言提示原型,该方案将重新定义视频管理,为各行各业由AI驱动的洞察和效率提速。
    的头像 发表于 04-09 09:30 792次阅读

    树莓派在自动化控制项目中的一些潜在应用

    自动化控制项目中的一些潜在应用。之前,我们已经为Arduino平台探讨了相同的话题。我们确定Arduino是个出色的教育工具,但由于一些限制,它无法在工业环境中完全
    的头像 发表于 03-25 09:45 479次阅读
    树莓派在自动化控制项目中的<b class='flag-5'>一些</b>潜在应用

    AN29-关于DC-DC转换器的一些想法

    电子发烧友网站提供《AN29-关于DC-DC转换器的一些想法.pdf》资料免费下载
    发表于 01-08 13:57 0次下载
    AN29-关于DC-DC转换器的<b class='flag-5'>一些</b>想法

    英特尔亮相2024巨量引擎城市生态大会

    近日,2024巨量引擎城市生态大会收官站成功举办。在大会上,英特尔作为数字化合作伙伴,针对“文旅+”行业的技术提供多样解决方案,从外展区到主题演讲,传递着Al等前沿技术场景对文旅行业赋能的新风向。
    的头像 发表于 12-20 10:44 773次阅读