0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于深度学习硬件加速器的介绍和应用

西门子EDA 来源:djl 2019-10-11 14:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Chips&Media 成功采用 Mentor Catapult High-Level Synthesis (HLS) 平台实现了首个计算机视觉 IP;

Chips&Media 通过 Catapult HLS 将模块设计/验证时间缩短了一半,并实现了关键的现场可编程门阵列 (FPGA) 演示系统;

Catapult HLS 方法论使探索多种架构并为深度神经网络加速器寻找最佳实现方案成为了可能。

Mentor, A Siemens Business 宣布 Chips&Media 已成功部署 Mentor Catapult HLS 平台,将使用深度神经网络 (DNN) 算法设计和验证其 c.WAVE 计算机视觉 IP 的实时对象检测。Chips&Media 是一家面向片上系统 (SoC) 设计高性能、高质量视频 IP 的领先供应商,其产品广泛应用于汽车、监控和消费电子领域。

Chips&Media 需要通过减少功能验证时间、时序收敛、自定义和最终优化来大幅提高生产力,把更多时间用于机器算法和架构的研发上,从而为客户快速提供差异化的机器学习 IP。为实现这些目标,他们弃用了传统的手工编码寄存器传输级 (RTL) 流程,转而采用 Catapult HLS 平台,以使用 C 语言编写算法和验证平台。与同一项目中使用 RTL 流程的团队相比,HLS 设计和验证团队将项目时间缩短了一半。

“要应对以推理为目标的设备带来的加速挑战,我们认为关键在于使用深度神经网络建立一个专注于功耗、性能和面积 (PPA) 并高度优化的硬件架构,”Chips&Media 首席技术官 Mickey Jeon 表示。“HLS 使我们能够极其高效地完成这项工作。我们的项目取得了突出的成绩,我们计划在接下来的项目中部署应用 Catapult 的 HLS 流程。”

基于 DNN 的计算机视觉处理的特征,就是乘法/加法/累加的重复计算,同时通过神经网络层进行大量数据迁移。DNN 是在 Caffe 或 TensorFlow 等框架上开发的,然后在 C 模型中捕获其算法。Chips&Media 将此算法 C 模型改进为可综合的 C 代码,并使用 Catapult HLS 平台快速探索各种架构并综合到 RTL 中,以找到此类设计的最佳解决方案。

“根据我们的观察,在市场快速变化的多个应用领域,采用 Catapult HLS 是提高生产力来获得成功的唯一途径,”Mentor 数字设计和实施解决方案总经理 Badru Agarwala 表示。“我们一直与 Chips&Media 密切合作,以确保他们平稳过渡到 HLS。该平台可以让他们专注于算法/架构设计,而不是底层实现和调试等细节,从而更快地把想法变成产品,然后推向市场。”

借助 Catapult HLS 平台,设计人员便能利用行业标准 ANSI C++ 和 SystemC 来描述功能意图,并将其提高到生产率更高的抽象层次。根据这些高层次的描述,Catapult 即可快速生成产品级的 RTL。Catapult 平台将综合与形式 C 属性检查功能相结合,以便及早发现 C++/SystemC 级别的错误并在综合之前全面验证源代码。高度交互的 Catapult 工作流程可提供对综合过程的完全可见性和控制,使设计人员能够迅速收敛到 PPA 的最佳实现方案。此外,Catapult 的高级功耗优化功能也可以自动大幅降低动态功耗。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47458
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123921
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业级-专业液晶图形显示加速器RA8889ML3N简介+显示方案选型参考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 编辑 专业液晶图形显示加速器能够有效减少对MCU运算资源的占用,对于只需普通单片机运算资源的仪器仪表来说,专业图形显示加速器
    发表于 11-14 16:03

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 441次阅读
    边缘计算中的AI<b class='flag-5'>加速器</b>类型与应用

    常用硬件加速的方法

    之前总结了一些常用硬件加速方法 1)面积换速度:也就是串转并运算,可以多个模块同时计算; 2)时间换空间:时序收敛下通过频率提高性能,虽然面积可能稍微加大点; 3)流水线操作:流水线以面积换性能,以
    发表于 10-29 06:20

    硬件协同技术分享 - 任务划分 + 自定义指令集

    开发技术。分文将分享介绍硬件加速器与软件结合的协同开发方式 软硬件任务划分 我们的硬件设计涉及到MFCC模块。直接交由CPU的一次指令的五级流水线处理在麦克风数据取入上的资源耗费
    发表于 10-28 08:03

    硬件加速模块的时钟设计

    硬件加速模块需要四个时钟,分别为clk_l , clk_r , clk_c , clk_n 。 clk_l : 整个硬件加速模块为了最大化的节约时间成本而采用了类似处理的流水线设计,具体上将每一层
    发表于 10-23 07:28

    如何验证硬件加速是否真正提升了通信协议的安全性?

    验证硬件加速是否真正提升通信协议的安全性,需从 安全功能正确性、抗攻击能力增强、安全性能适配、合规一致性 等核心维度展开,结合实验室测试与真实场景验证,避免 “硬件参与即安全提升” 的表面判断。以下
    的头像 发表于 08-27 10:16 833次阅读
    如何验证<b class='flag-5'>硬件加速</b>是否真正提升了通信协议的安全性?

    有哪些方法可以确保硬件加速与通信协议的兼容性?

      确保硬件加速与通信协议的兼容性,核心是从 硬件选型、协议标准匹配、软硬件接口适配、全场景测试验证 四个维度建立闭环,避免因硬件功能缺失、接口不兼容或协议特性支持不全导致的性能损耗、
    的头像 发表于 08-27 10:07 666次阅读

    如何利用硬件加速提升通信协议的安全性?

    产品实拍图 利用硬件加速提升通信协议安全性,核心是通过 专用硬件模块或可编程硬件 ,承接软件层面难以高效处理的安全关键操作(如加密解密、认证、密钥管理等),在提升性能的同时,通过硬件
    的头像 发表于 08-27 09:59 658次阅读
    如何利用<b class='flag-5'>硬件加速</b>提升通信协议的安全性?

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的
    的头像 发表于 08-26 19:18 2592次阅读
    英特尔Gaudi 2E AI<b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习
    的头像 发表于 08-20 17:43 1890次阅读

    大模型推理显存和计算量估计方法研究

    GPU、FPGA等硬件加速。通过分析硬件加速器的性能参数,可以估算模型在硬件加速下的计算量。 四、实验与分析 为了验证上述估计方法的有效性,我们选取了几个具有代表性的深度
    发表于 07-03 19:43

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 2557次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    TPU处理的特性和工作原理

    张量处理单元(TPU,Tensor Processing Unit)是一种专门为深度学习应用设计的硬件加速器。它的开发源于对人工智能(AI)和机器学习应用的需求,尤其是
    的头像 发表于 04-22 09:41 3390次阅读
    TPU处理<b class='flag-5'>器</b>的特性和工作原理

    小型加速器中子源监测系统解决方案

    小型加速器中子源是一种基于先进加速器技术的中子产生装置,凭借体积小、成本低、安全性高的优势,在医学、工业、科研、安全、能源等多个领域展现出巨大的应用潜力和价值。无论是用于医学领域的精准放疗,还是工业
    的头像 发表于 03-13 11:19 1156次阅读
    小型<b class='flag-5'>加速器</b>中子源监测系统解决方案

    数据中心中的FPGA硬件加速器

      再来看一篇FPGA的综述,我们都知道微软包括国内的云厂商其实都在数据中心的服务中部署了FPGA,所以这篇论文就以数据中心的视角,来看下FPGA这个硬件加速器。 还是一样,想要论文原文的可以私信
    的头像 发表于 01-14 10:29 1217次阅读
    数据中心中的FPGA<b class='flag-5'>硬件加速器</b>