0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当使用传统计算架构时功耗仍是一个巨大挑战

半导体动态 来源:工程师吴畏 作者:GLOBALFOUNDRIES 2018-12-22 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着传统市场走向下坡路和摩尔定律的逐渐失效,半导体行业正在不断革新,力求了解人工智能自动驾驶汽车、物联网等新市场的需求。

而其中最奇特的也许当属人工智能,因为它的计算范式与传统的“处理器-内存”方法有着明显差异。在近期于旧金山举办的国际电子器件大会上,法国研究员Damien Querlioz在谈及“神经形态计算的新型器件技术”时说道,“长期以来,模式识别和认知任务都是计算机的弱点,比如识别和解读图像、理解口语、自动翻译等。”

大约从2012年起,训练和推理阶段的人工智能技术开始加速发展,但当使用传统计算架构时,功耗仍是一个巨大挑战。

Querlioz是法国国家实验室CNRS的一名研究员,他举了一个活生生的例子:2016年Google的AlphaGo与围棋世界冠军李世石之间的著名围棋大战。李世石的大脑在比赛中消耗了大约20瓦,而AlphaGo估计需要超过250,000瓦才能使其CPUGPU保持运转。

虽然从那以后Google和其他公司均在功耗方面做出了改进,但越来越多的工作开始侧重于为神经形态计算技术设计耗电更少的新器件。

Ted Letavic是格芯的高级战略营销人员,他表示,回想人工智能的各个阶段,从改进传统计算技术,到设计耗电更少的全新器件和架构,在整个过程中,先进高效的封装将发挥关键作用。

Letavic称,“人工智能时代正在逐步到来,我们可以利用现有的技术,再加上衍生技术,通过DTCO(设计技术协同优化)进行全面优化,一直深入到位单元设计层面。”

格芯的技术人员正在努力降低14/12 nm FinFET平台的功耗并提升其性能,所采用的办法包括双功函数SRAM、更快且功耗更低的累加运算(MAC)元件、对SRAM的更高带宽访问等。基于FD-SOI的FDX处理器的功耗也将降低,尤其是在部署背栅偏置技术时。Letavic表示,设计师掌握了这些技术后,客户便可以“重新设计功耗包络更低的人工智能固有元件,甚至达到7 nm。”

除了这些DTCO改进以外,全球各地也在开展其他研发工作,希望实现基于相变存储器(PCM)、阻性RAM (ReRAM)、自选扭矩转换磁性RAM (STT-MRAM)和FeFET的嵌入式内存与内存中计算解决方案。

Querlioz在IEDM专题会议上提到,在IBM Almaden研究中心,由Jeff Welser领导开发的基于PCM的芯片已取得显著进展,而基于STT-MRAM和ReRAM的人工智能处理器也前景光明。Querlioz表示,“现在,我们极有可能成功为认知类型的任务和模式识别重新发明电子器件。”

Letavic称,降低功耗的道路还很长,对于推理处理而言尤其如此,而这正促使众多初创公司开发新的人工智能解决方案,格芯也与其中部分公司及长期合作伙伴AMD和IBM保持着密切合作关系。

Letavic认为,凭借对冯诺依曼计算模式的DTCO改进,我们只能发展到这一步。除了分类逻辑和内存,下一步是发展内存中计算和基于模拟的计算。此外,为计算行业服务了35年的指令集架构(ISA)将需要被新的软件堆栈和算法取代。他说道:“对于特定领域的计算,必须重新发明软件。IBM对软件堆栈有着深刻的见解。”

“各方都必须一同转向人工智能。格芯将与主要客户紧密合作,我们不能将算法与技术分开,”Letavic在谈及该系统技术协同优化(STCO)方面的紧密合作时说道,“随着我们迈入计算发展的第四个时代,STCO将是DTCO的自然延伸。我们将朝着特定领域的计算发展,共同迎接这一转变。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266902
  • 架构
    +关注

    关注

    1

    文章

    537

    浏览量

    26644
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    交直流混合微电网:混合架构的设计挑战与解决方案

    “交直流协同、源荷直连、高效节能”为核心,其混合架构的合理设计成为关键,但在工程实践中,混合架构设计面临诸多技术挑战,如何破解这些难题、优化架构设计,成为推动交直流混合微电网规模化落地
    的头像 发表于 04-20 16:47 894次阅读
    交直流混合微电网:混合<b class='flag-5'>架构</b>的设计<b class='flag-5'>挑战</b>与解决方案

    2022全新版!Java分布式架构设计与开发实战(完结)

    表数据量突破千万级大关,查询响应时间从毫秒级骤降至秒级甚至分钟级,传统的单库单表架构已无法支撑海量数据的存储与访问需求。分库分表作为解决这问题的核心架构方案,通过将数据分散存储到多个
    发表于 03-30 15:20

    代汽车中现代计算架构的性能组件和保护

    随着现代汽车的不断发展,其电气和电子(EE)架构必须进行调整,以有效管理日益增长的电力需求。传统分布式和基于域的控制系统在复杂性、大量布线和通信瓶颈等问题上举步维艰。分区控制架构通过将电子控制单元(ECU)整合到局部区域、优化功
    的头像 发表于 03-13 09:04 9478次阅读
    下<b class='flag-5'>一</b>代汽车中现代<b class='flag-5'>计算</b><b class='flag-5'>架构</b>的性能组件和保护

    MAX17017:低功耗架构四输出控制器的深度剖析与设计指南

    MAX17017:低功耗架构四输出控制器的深度剖析与设计指南 在当今的电子设备设计中,低功耗架构的需求日益增长,尤其是在超便携设备领域。MAX17017作为
    的头像 发表于 03-12 15:35 153次阅读

    突破传统限制:OxygenREC--基于指令跟随的“快慢思考”电商生成式推荐框架

    在电商推荐系统中,推荐模型长期面临着两核心矛盾:方面,传统的多阶段级联推荐系统存在目标不致和误差累积的问题;另方面,直接引入大型语言
    的头像 发表于 02-25 17:08 1197次阅读
    突破<b class='flag-5'>传统</b>限制:OxygenREC--<b class='flag-5'>一</b><b class='flag-5'>个</b>基于指令跟随的“快慢思考”电商生成式推荐框架

    【匠师共研】系列之 器件赋能系统,打通从生物大脑到新型半导体器件应用新途

    如何赋能系统、打通从生物大脑到新型半导体应用的工程路径”这核心议题,探讨类脑计算背后的器件逻辑与现实挑战。 从尖峰信号出发:类脑计算的器件原点 万老师指出,
    的头像 发表于 01-29 11:02 534次阅读
    【匠师共研】系列之<b class='flag-5'>一</b> 器件赋能系统,打通从生物大脑到新型半导体器件应用新途

    泰克专家探讨类脑计算背后的器件逻辑与现实挑战

    AI算力竞赛愈演愈烈,条源于生物大脑的技术路径,正在悄然重塑半导体器件与系统架构。近日,泰克专家在展台与类脑器件领域资深研究者万老师展开深度交流,围绕“器件如何赋能系统、打通从生物大脑到新型半导体应用的工程路径”这
    的头像 发表于 01-20 10:15 738次阅读

    Arm架构计算平台驱动融合型AI数据中心变革

    的意义远不止于统计数字,更重要的是它们构成了融合型人工智能 (AI) 数据中心这新型基础设施的计算核心。从云原生服务到最具
    的头像 发表于 12-15 14:51 690次阅读

    采用Prefetch+Cache架构有什么优势?

    我看官方说,采用Prefetch+Cache架构同频CoreMark 计算力/功耗比超越同类产品,这优势就是低功耗么?要是具体芯片比较的话,应该怎么比?
    发表于 12-11 07:35

    光谱成像技术在作物面积统计中的应用

    、作物面积统计的重要性与挑战 作物面积统计是农业资源管理、粮食安全评估、农业政策制定和农业保险理赔的重要依据。传统统计方法主要依赖人工实地
    的头像 发表于 12-05 10:44 444次阅读
    光谱成像技术在作物面积<b class='flag-5'>统计</b>中的应用

    华工正源推出新代3.2T NPO光引擎产品

    AI 大模型的参数量突破 10 万亿级,数据中心的 “光动脉” 正面临前所未有的挑战传统可插拔架构下,800G 光模块集群的功耗占比已
    的头像 发表于 09-25 15:23 2668次阅读

    国际首创新突破!中国团队以存算体排序架构攻克智能硬件加速难题

    sort-in-memory system based on memristors),解决了传统计算架构面对复杂非线性排序问题时计算效率低下的瓶颈问题,在这极难攻克的人工智能基础算
    的头像 发表于 07-02 16:50 981次阅读
    国际首创新突破!中国团队以存算<b class='flag-5'>一</b>体排序<b class='flag-5'>架构</b>攻克智能硬件加速难题

    传统蓝牙与低功耗蓝牙主要区别

    传统蓝牙即经典蓝牙,能够实现音频传输,可传输较大文件,功耗较大;BLE蓝牙即低功耗蓝牙,仅支持数据传输,只适合做短距离的数据采集,数据传输及物联网智能控制等。
    发表于 06-18 16:04

    聚徽厂家视角——X86 架构 vs. ARM 架构:工控体机的算力、功耗与成本差异解析

    在工业自动化不断发展的当下,工控体机作为核心设备,其架构选择至关重要。X86 架构与 ARM 架构在工控领域各领风骚,它们在算力、功耗与成
    的头像 发表于 06-07 14:56 1216次阅读

    Arm架构何以成为现代计算的基础

    2025 年 4 月,Arm 架构迎来了问世 40 周年。这个始于英国剑桥隅、怀揣雄心壮志的项目,如今已成为全球广泛采用的计算架构。从传感器、智能手机、笔记本电脑,到汽车、数据中心等
    的头像 发表于 05-20 10:02 1364次阅读