0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大规模人工智能(AI)处理器的功耗分析方法

天数智芯 来源:天数智芯 作者:天数智芯 2022-01-17 16:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,来自天数智芯公司Power团队的三位工程师阙诗璇、孙凌、甘振华合作发表的技术论文《左移:大规模人工智能(AI)处理器的功耗分析方法》顺利入选第58届(国际设计自动化会议,Design Automation Conference),并做poster presentation。

文章主要内容如下:

AI芯片最重要的设计指标之一就是单位功耗每瓦算力(TOPS/W),因此低功耗设计对于AI芯片的设计实现,在市场中具备竞争力都十分重要。然而原有的功耗分析方法存在一定的不足,对新的需求也无法满足:

1.原有方法只是对功能验证的场景,而缺乏真实的应用场景,跟真实的软件应用有一定的差距;

2.传统的功耗分析需要综合后的网表和门级的向量,这在项目早期很难获取,太晚介入会让功耗优化受限;

3.对于仿真时间长的向量,尤其是要按时间分析功耗时,所需的运行时间和资源都是巨大的;

4.自适应电压频率缩放等需要有实时的功耗才能进行软硬件控制,这是原有方法无法实现的;

5.为了抢占市场,需要更快的迭代设计,因此设计人员希望每周甚至每天都可以对低功耗功能进行验证,原有方法很难赶上验证迭代的速度;

为了解决这些挑战跟需求,天数智芯提出了一种创新的功耗分析方案:利用一种功耗分析工具对所给的仿真向量进行高性能的按时间分析功耗的分布,从而得到平均功耗和峰值功耗等参数。这种方法在RTL阶段就进行分析,有利于对AI处理器进行优化功耗的迭代,最终实现项目功耗目标。与之前的方法相比较,它在某些实验中,可以达到100甚至1000倍的加速。

接下来将展开描述该方案在实际工作中的一个应用:通过机器学习的训练得到实时功耗预测模型。

现在所用的新的功耗分析方法和原有的按时间分析网表的功耗分析方法,具有很好的相关一致性。所以利用它超高倍加速的分析能力,可以用于各种应用场景激励产生训练模型所需要的充足的数据集。当训练数据集达到百万甚至是上亿级别,通过机器学习算法得到的模型就比较准确。这是依赖新的分析方法才能得到的,传统的分析方法无法产生这么大的数据量。

我们用机器学习的算法对各个模块进行参数训练,从而得到最佳的预测模型,这样就可以用于预测实时功耗,从而实现软硬件的控制。

经过几天的训练,我们最终得到的预测模型与真实的功耗之间的误差只有不到5%。

总的来看,创新的功耗分析方法与传统流程相比,能在项目早期介入,所需要的运行时间跟内存消耗大大减少,可以在设计阶段进行快速的迭代。它不仅仅可以对原有的功能验证激励进行分析,对于原型验证的真实的应用场景向量也可以进行分析,从而得到更真实的功耗相关指标,且与项目最终签核时的数据具有一致性。利用它的快速和节省资源特性,能够为实时功耗的预测模型提供大量充足的数据样本,最终得到误差5%以内的预测模型。

关于DAC

DAC(国际设计自动化会议,Design Automation Conference)与ICCAD(国际计算机辅助设计会议,International Conference on Computer Aided Design)、DATE(欧洲设计自动化与测试学术会议,Design, Automation and Test in Europe)、ASP-DAC(亚太地区设计自动化会议,Asia and South Pacific Design Automation Conference)一起被公认为电子设计自动化领域水平最高的四大国际会议。

关于天数智芯

上海天数智芯半导体有限公司(简称“天数智芯”)于2018年正式启动7纳米通用并行(GPGPU)云端计算芯片设计,是中国第一家通用并行(GPGPU)云端计算芯片及高性能算力系统提供商。公司以“成为智能社会的赋能者”为使命,专注于云端服务器级的通用并行高性能云端计算芯片,瞄准以云计算、人工智能、数字化转型为代表的数据驱动技术市场,解决核心算力瓶颈问题。重点打造自主可控、国际一流的通用、标准、高性能云端计算GPGPU芯片,从芯片端解决算力问题。

原文标题:天数智芯技术论文入选第58届DAC

文章出处:【微信公众号:天数智芯】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 参数
    +关注

    关注

    11

    文章

    1868

    浏览量

    33760
  • 自动化
    +关注

    关注

    30

    文章

    5886

    浏览量

    89250
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261511

原文标题:天数智芯技术论文入选第58届DAC

文章出处:【微信号:IluvatarCoreX,微信公众号:天数智芯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    nRF52805),只占用几千字节的非易失性存储(NVM)。这使得以前被认为不可能的应用也能增加 ML 功能。例如,您现在可以在广泛的传感网络的每个节点上进行人工智能处理,而在这
    发表于 08-31 20:54

    AI 芯片浪潮下,职场晋升新契机?

    方向,就明确涵盖了人工智能芯片的研发、部署与优化技术岗位 。如果你从事 GPU 相关研发工作,在申报职称时,就需着重突出在图形处理加速、大规模并行计算等方面的成果,因为 GPU 的高并行结构及强大浮点
    发表于 08-19 08:58

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    本文转自:TechSugar编译自ElectronicDesign人工智能浪潮已然席卷全球,将人工智能加速处理器整合到各类应用中也变得愈发普遍。然而,围绕它们是什么、如何运作、能如
    的头像 发表于 08-07 13:21 874次阅读
    关于<b class='flag-5'>人工智能</b><b class='flag-5'>处理器</b>的11个误解

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为
    的头像 发表于 07-09 15:59 896次阅读

    开售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 处理器、神经网络处理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    发表于 04-23 10:55

    光子 AI 处理器的核心原理及突破性进展

    电子发烧友网(文 / 李弯弯)光子 AI 处理器,作为一种借助光子执行信息处理人工智能AI)计算的新型硬件设备,正逐渐崭露头角。与传统基
    的头像 发表于 04-19 00:40 3637次阅读

    支持实时物体识别的视觉人工智能处理器RZ/V2MA数据手册

    DRP-AI 采用了一种由动态可重构处理器(DRP)和 AI-MAC组成的人工智能加速,该加速
    的头像 发表于 03-18 18:12 742次阅读
    支持实时物体识别的视觉<b class='flag-5'>人工智能</b>微<b class='flag-5'>处理器</b>RZ/V2MA数据手册

    用于实时人类和物体识别的视觉-AI ASSP人工智能处理器RZ/V2M数据手册

    配置了DRP和AI-MAC的人工智能硬件IP DRP-AI将高速人工智能推理和低功耗结合起来,实现了1TOPS/W级别的功率性能。此外,图像
    的头像 发表于 03-14 17:41 735次阅读
    用于实时人类和物体识别的视觉-<b class='flag-5'>AI</b> ASSP<b class='flag-5'>人工智能</b>微<b class='flag-5'>处理器</b>RZ/V2M数据手册

    基于嵌入式人工智能的高速图像处理的微处理器RZ/A2M数据手册

    和特征提取,与ARM®Cortex®A9 CPU紧密结合,用于人工智能推理。 *附件:基于嵌入式人工智能的高速图像处理的微处理器RZA2M数据手册.pdf 特性 中央
    的头像 发表于 03-11 15:54 843次阅读
    基于嵌入式<b class='flag-5'>人工智能</b>的高速图像<b class='flag-5'>处理</b>的微<b class='flag-5'>处理器</b>RZ/A2M数据手册

    人工智能、云计算、区块链三者区别对比

    AI人工智能基于算法和数据,擅长处理复杂数据;云计算依赖虚拟化和网络,提供高效计算;区块链利用密码学,保证数据安全透明。三者在数据处理、安全性和应用场景上各有特色,
    的头像 发表于 02-20 14:45 1193次阅读

    端侧 AI 音频处理器:集成音频处理AI 计算能力的创新芯片

    电子发烧友网综合报道:端侧 AI 音频处理器是专为智能物联网(AIoT)端侧设备设计,集成了人工智能AI)加速
    的头像 发表于 02-16 00:13 3061次阅读

    功耗处理器的优势分析

    随着科技的飞速发展,电子设备的种类和数量不断增加,人们对设备的能效要求也越来越高。低功耗处理器因其在节能、环保和成本效益方面的优势而受到广泛关注。 低功耗处理器的定义 低
    的头像 发表于 02-07 09:14 1788次阅读