0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kria K26 SOM性能解决方案的对比分析

YCqV_FPGA_EETre 来源:FPGA开发圈 作者:FPGA开发圈 2021-07-02 14:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

赛灵思的研究结果表明,K26 SOM 提供了比英伟达 Jetson Nano 高出大约 3 倍的性能。此外,它的单位功耗性能较之英伟达 Jetson TX2 提升了 2 倍。对于 SSD MobileNet-v1 这样的网络,K26 SOM 的低时延、高性能深度学习处理单元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

与未来兼容的 Kria K26 SOM

智能应用除了要求亚微秒级的时延,还需要具备私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架构为基础,Kria K26 SOM 提供了业界一流的单位功耗性能和更低的总体拥有成本,使之成为边缘设备的理想选择。

原始计算能力

就在边缘设备上部署解决方案而言,硬件必须拥有充足的算力,才能处理先进 ML 算法工作负载。我们可以使用各种深度学习处理单元 (DPU) 配置对 Kria K26 SOM 进行配置,还能根据性能要求,将最适用的配置集成到设计内。

支持更低精度的数据类型

深度学习算法正在以极快的速度演进发展,各种更低精度的数据类型和定制数据正在进入使用。传统的 GPU 厂商已无法满足当前的市场需求,而 Kria K26 SOM 能够支持全系列数据类型精度,如 PF32、INT8、二进制和其他定制数据类型。

运算的能耗成本

低时延与低功耗

为了改善软件可编程能力,GPU 架构需要频繁访问外部 DDR。这种做法非常低效,有时候会对高带宽设计要求构成瓶颈。相反,Zynq MPSoC 架构具有高能效,它的可重配置能

力便于开发者设计的应用减少或不必访问外部存储器。这不仅有助于减少应用的总功耗,也通过降低端到端时延改善了响应能力。

典型 GPU 与 Zynq MPSoC 架构

灵活性

与数据流固定的 GPU 不同,赛灵思硬件提供了灵活性用来专门地重新配置数据路径,从而实现最大吞吐量并降低时延。此外,可编程的数据路径也降低了对批处理的需求,而批处理是 GPU 的一个重大不足,需要在降低时延或提高吞吐量之间做出权衡取舍。Kria SOM 灵活的架构已在稀疏网络中展示出巨大潜力。

02

与英伟达 Jetson 性能比较

深度学习模型性能比较

根据测试数据,所有模型在 K26 SOM 上的性能数值均优于英伟达 Jetson Nano。而且对于 SSD Mobilenet-V1 等部分模型,吞吐量则为 Jetson Nano 的四倍以上,为 Jetson Tx2 的两倍左右,从下表可以很容易地看到显著的吞吐量提升。

FPS(时延优化)

功耗测量

边缘设备提供最佳性能这点非常重要,但同时必须降低能耗。赛灵思测量了英伟达和赛灵思 SOM 模块在执行具体模型时发生的峰值功率,结果很明显,K26 SOM 优于 Jetson Nano

3.5 倍,优于 Jetson TX2 2.4 倍。

FPS/瓦

实际应用性能比较

为了分析实际用例,我们选择了一种准确检测和识别车辆牌照的基于机器学习的应用。将 Uncanny Vision 行业领先的 ANPR 算法部署在 Kria SOM 上后,与英伟达用 Deepstream-SDK 完成的“车牌识别”的公开数据进行比较,结果说明,Uncanny Vision 的 ANPR 流水线在针对 KV260 入门套件进行优化后,实现了超过 33fps 的吞吐量,显著优于英伟达基准测试中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。这种前所未有的性能水平为 ANPR 集成商和 OEM 厂商提供了优于竞争对手的开发灵活性。

实际应用测试显示,K26 SOM 不仅在标准性能比较中表现极其优异,并且在为开发者提供加速整体 AI 和视觉流水线所需的原始性能时,效率也更高。通过对比,在标准的基准测试领域之外,竞争解决方案倾向于提供较低效率水平,而且功耗较高。

文章出处:【微信公众号:FPGA开发圈】

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 赛灵思
    +关注

    关注

    33

    文章

    1797

    浏览量

    133142
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134443
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97649

原文标题:白皮书 | Kria K26:边缘端视觉 AI 理想平台

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    无源探头与高压探头技术对比分析

    本文对比分析了无源探头与高压探头的技术原理、性能参数及应用场景,为选择合适探头提供参考。
    的头像 发表于 11-30 15:47 357次阅读

    传统普通扫码枪与RFID扫描枪对比分析

    本文深入对比传统普通扫码枪与RFID扫描枪的核心差异,从成本结构、使用场景到技术特点进行全面分析,帮助企业选择最适合的数据采集解决方案
    的头像 发表于 11-19 11:03 912次阅读
    传统普通扫码枪与RFID扫描枪<b class='flag-5'>对比分析</b>

    AMD Kria KV260视觉AI入门套件更新升级

    各种软件工具与加速应用,适合各种专业水平的开发人员。这款开箱即用的套件能极大助力希望利用量产版 Kria K26 SOM 加速产品上市并实现批量部署的客户。
    的头像 发表于 07-18 09:50 701次阅读

    国内外电机结构 工艺对比分析

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:国内外电机结构 工艺对比分析.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 05-29 14:06

    主流汽车电子SoC芯片对比分析

    主流汽车电子SoC芯片对比分析 随着汽车智能化、电动化趋势加速,系统级芯片(SoC)已成为汽车电子核心硬件。本文从技术参数、市场定位、应用场景及国产化进程等维度,对主流汽车电子SoC芯片进行对比分析
    的头像 发表于 05-23 15:33 4756次阅读

    Made with KiCad(126):Antmicro OV5640 双摄像头子板

    的 Jetson Orin 底板 支持 AMD-Xilinx KRIA K26 模块化系统的 Kria K26 Devboard 支持 Google Coral 模块化系统的 Goo
    发表于 05-12 18:13

    Variscite提供ISO 13485认证SoM解决方案

    Variscite是全球知名的系统模块 (SoM) 供应商,近二十年来专注于先进嵌入式解决方案的研发。作为白金合作伙伴,Variscite与恩智浦建立了稳固而持久的合作关系,凭借恩智浦先进的处理器,提供可扩展的高性能
    的头像 发表于 05-12 15:11 1213次阅读

    机器人开发套件 Kria KR260

    机器人的潜力 用户指南 产品简介 Kria KR260机器人入门套件包括载卡、Kria K26 SOM和散热解决方案。该
    的头像 发表于 04-11 13:15 1388次阅读
    机器人开发套件 <b class='flag-5'>Kria</b> KR260

    广和通携手阿里云推出随身智能解决方案

    2月,广和通与全球领先的云解决方案提供商阿里云达成合作:广和通AI模组及解决方案,基于阿里云通义千问大模型,推出“随身智能解决方案”,赋能消费电子行业。
    的头像 发表于 02-25 16:04 858次阅读

    多频段白色蝴蝶天线:通信领域的高性能解决方案

    深圳安腾纳天线|多频段白色蝴蝶天线:通信领域的高性能解决方案
    的头像 发表于 02-21 09:07 774次阅读

    集特海光3350处理器工业主板GM9-5602:为工业应用打造的高性能解决方案

    集特海光3350处理器工业主板GM9-5602:为工业应用打造的高性能解决方案
    的头像 发表于 02-20 17:29 1511次阅读

    半导体激光器和光纤激光器的对比分析

    半导体激光器和光纤激光器是现代激光技术中的两种重要类型,它们在结构、工作原理、性能及应用领域等方面有着显著的区别。本文将从增益介质、发光机理、散热性能、输出特性及应用领域等多个方面,对这两种激光器进行详细的对比分析
    的头像 发表于 02-03 14:18 2373次阅读

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    随着HarmonyOS NEXT的正式推出,鸿蒙原生应用开发热度高涨,数量激增。但在三方应用鸿蒙化进程中,性能问题频出。为此,HarmonyOS NEXT推出了一整套原生页面高性能解决方案,包括
    发表于 01-02 18:00

    TNC连接器对比分析:与其他射频连接器的性能对决

    德索工程师说道在射频连接器领域,TNC连接器以其卓越的性能和广泛的应用而著称。以下是TNC连接器与其他射频连接器的性能对比分析: TNC连接器vs SMA连接器 频率范围:TNC连接器的工作频率
    的头像 发表于 12-17 10:58 1561次阅读
    TNC连接器<b class='flag-5'>对比分析</b>:与其他射频连接器的<b class='flag-5'>性能</b>对决

    广和通率先推出5G融合Wi-Fi 7智能解决方案

    近期,广和通率先推出5G融合Wi-Fi 7智能解决方案,以高性能、高速率、高可靠的无线连接帮助客户快速迭代智能终端。目前,该5G+Wi-Fi 7智能解决方案已在智能手持客户商用,帮助客户以更优成本、更短开发周期迈向高速连接。
    的头像 发表于 12-06 15:11 1264次阅读