0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大规模人工智能(AI)处理器的功耗分析方法

天数智芯 来源:天数智芯 作者:天数智芯 2022-01-17 16:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,来自天数智芯公司Power团队的三位工程师阙诗璇、孙凌、甘振华合作发表的技术论文《左移:大规模人工智能(AI)处理器的功耗分析方法》顺利入选第58届(国际设计自动化会议,Design Automation Conference),并做poster presentation。

文章主要内容如下:

AI芯片最重要的设计指标之一就是单位功耗每瓦算力(TOPS/W),因此低功耗设计对于AI芯片的设计实现,在市场中具备竞争力都十分重要。然而原有的功耗分析方法存在一定的不足,对新的需求也无法满足:

1.原有方法只是对功能验证的场景,而缺乏真实的应用场景,跟真实的软件应用有一定的差距;

2.传统的功耗分析需要综合后的网表和门级的向量,这在项目早期很难获取,太晚介入会让功耗优化受限;

3.对于仿真时间长的向量,尤其是要按时间分析功耗时,所需的运行时间和资源都是巨大的;

4.自适应电压频率缩放等需要有实时的功耗才能进行软硬件控制,这是原有方法无法实现的;

5.为了抢占市场,需要更快的迭代设计,因此设计人员希望每周甚至每天都可以对低功耗功能进行验证,原有方法很难赶上验证迭代的速度;

为了解决这些挑战跟需求,天数智芯提出了一种创新的功耗分析方案:利用一种功耗分析工具对所给的仿真向量进行高性能的按时间分析功耗的分布,从而得到平均功耗和峰值功耗等参数。这种方法在RTL阶段就进行分析,有利于对AI处理器进行优化功耗的迭代,最终实现项目功耗目标。与之前的方法相比较,它在某些实验中,可以达到100甚至1000倍的加速。

接下来将展开描述该方案在实际工作中的一个应用:通过机器学习的训练得到实时功耗预测模型。

现在所用的新的功耗分析方法和原有的按时间分析网表的功耗分析方法,具有很好的相关一致性。所以利用它超高倍加速的分析能力,可以用于各种应用场景激励产生训练模型所需要的充足的数据集。当训练数据集达到百万甚至是上亿级别,通过机器学习算法得到的模型就比较准确。这是依赖新的分析方法才能得到的,传统的分析方法无法产生这么大的数据量。

我们用机器学习的算法对各个模块进行参数训练,从而得到最佳的预测模型,这样就可以用于预测实时功耗,从而实现软硬件的控制。

经过几天的训练,我们最终得到的预测模型与真实的功耗之间的误差只有不到5%。

总的来看,创新的功耗分析方法与传统流程相比,能在项目早期介入,所需要的运行时间跟内存消耗大大减少,可以在设计阶段进行快速的迭代。它不仅仅可以对原有的功能验证激励进行分析,对于原型验证的真实的应用场景向量也可以进行分析,从而得到更真实的功耗相关指标,且与项目最终签核时的数据具有一致性。利用它的快速和节省资源特性,能够为实时功耗的预测模型提供大量充足的数据样本,最终得到误差5%以内的预测模型。

关于DAC

DAC(国际设计自动化会议,Design Automation Conference)与ICCAD(国际计算机辅助设计会议,International Conference on Computer Aided Design)、DATE(欧洲设计自动化与测试学术会议,Design, Automation and Test in Europe)、ASP-DAC(亚太地区设计自动化会议,Asia and South Pacific Design Automation Conference)一起被公认为电子设计自动化领域水平最高的四大国际会议。

关于天数智芯

上海天数智芯半导体有限公司(简称“天数智芯”)于2018年正式启动7纳米通用并行(GPGPU)云端计算芯片设计,是中国第一家通用并行(GPGPU)云端计算芯片及高性能算力系统提供商。公司以“成为智能社会的赋能者”为使命,专注于云端服务器级的通用并行高性能云端计算芯片,瞄准以云计算、人工智能、数字化转型为代表的数据驱动技术市场,解决核心算力瓶颈问题。重点打造自主可控、国际一流的通用、标准、高性能云端计算GPGPU芯片,从芯片端解决算力问题。

原文标题:天数智芯技术论文入选第58届DAC

文章出处:【微信公众号:天数智芯】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 参数
    +关注

    关注

    11

    文章

    1870

    浏览量

    34030
  • 自动化
    +关注

    关注

    31

    文章

    5982

    浏览量

    90630
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266880

原文标题:天数智芯技术论文入选第58届DAC

文章出处:【微信号:IluvatarCoreX,微信公众号:天数智芯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    自然智能与人工智能融合如何重塑芯片设计

    人类大脑是所有处理器中最复杂的,能够构思出不可思议的创意,解决复杂、微妙的问题。相比之下,人工智能擅长快速分析海量数据并高效执行任务。当自然智能
    的头像 发表于 01-15 13:58 680次阅读

    Magna AI加入NVIDIA Inception计划,推动生产级人工智能规模化发展

    智能交付的顶尖人工智能机构行列。 Magna AI的加入,体现了其与NVIDIA人工智能平台之间高度契合的技术协同关系。这一合作基于Magna A
    的头像 发表于 01-12 15:46 266次阅读

    瑞芯微SOC智能视觉AI处理器

    需要连接多种外设的产品。显示: 支持双屏异显,最高4K@60fps输出。 RK1126B: 一款集成自研NPU的智能视觉AI处理器,专注于视频输入端的AI
    发表于 12-19 13:44

    瑞萨电子RZ/V系列微处理器助力边缘AI开发

    边缘AI越来越多地应用于诸如工业摄像头和公共设施摄像头等嵌入式设备中,并要求嵌入式产品小型化且具有低功耗。瑞萨电子RZ/V系列微处理器(MPU)内置AI加速
    的头像 发表于 09-23 10:31 1104次阅读
    瑞萨电子RZ/V系列微<b class='flag-5'>处理器</b>助力边缘<b class='flag-5'>AI</b>开发

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    nRF52805),只占用几千字节的非易失性存储(NVM)。这使得以前被认为不可能的应用也能增加 ML 功能。例如,您现在可以在广泛的传感网络的每个节点上进行人工智能处理,而在这
    发表于 08-31 20:54

    AI 芯片浪潮下,职场晋升新契机?

    方向,就明确涵盖了人工智能芯片的研发、部署与优化技术岗位 。如果你从事 GPU 相关研发工作,在申报职称时,就需着重突出在图形处理加速、大规模并行计算等方面的成果,因为 GPU 的高并行结构及强大浮点
    发表于 08-19 08:58

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    本文转自:TechSugar编译自ElectronicDesign人工智能浪潮已然席卷全球,将人工智能加速处理器整合到各类应用中也变得愈发普遍。然而,围绕它们是什么、如何运作、能如
    的头像 发表于 08-07 13:21 1238次阅读
    关于<b class='flag-5'>人工智能</b><b class='flag-5'>处理器</b>的11个误解

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理
    发表于 07-16 15:29

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    格罗方德拟收购人工智能处理器IP供应商MIPS

    近日,格罗方德(GlobalFoundries)宣布达成一项最终协议,拟收购人工智能AI)和处理器IP领域的领先供应商MIPS。此次战略收购将拓展格罗方德可定制IP产品的阵容,使其能够借助IP和软件能力,进一步凸显工艺技术的差
    的头像 发表于 07-09 18:03 1311次阅读

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为
    的头像 发表于 07-09 15:59 1950次阅读

    如何构建边缘人工智能基础设施

    随着人工智能的不断发展,其争议性也越来越大;而在企业和消费者的眼中,人工智能价值显著。如同许多新兴科技一样,目前人工智能的应用主要聚焦于大规模、基础设施密集且高
    的头像 发表于 06-09 09:48 1199次阅读