0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思Kria K26 SOM应运而生为ML边缘应用开发提供了更加理想的选择

Xilinx赛灵思官微 来源:Xilinx赛灵思官微 作者:Xilinx赛灵思官微 2021-07-01 11:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着人工智能机器学习算法取得一系列新进展

众多高计算强度的应用正在被部署到边缘设备上

当下,业界迫切需要一种高效率的硬件

既能高效率地执行复杂算法

又能适应这种技术的快速演进

在此背景下,赛灵思 Kria K26 SOM应运而生

为 ML 边缘应用开发提供了更加理想的选择

赛灵思的研究结果表明,K26 SOM 提供了比英伟达 Jetson Nano 高出大约 3 倍的性能。此外,它的单位功耗性能较之英伟达 Jetson TX2 提升了 2 倍。对于 SSD MobileNet-v1 这样的网络,K26 SOM 的低时延、高性能深度学习处理单元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

与未来兼容的 Kria K26 SOM

智能应用除了要求亚微秒级的时延,还需要具备私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架构为基础,Kria K26 SOM 提供了业界一流的单位功耗性能和更低的总体拥有成本,使之成为边缘设备的理想选择。

原始计算能力

就在边缘设备上部署解决方案而言,硬件必须拥有充足的算力,才能处理先进 ML 算法工作负载。我们可以使用各种深度学习处理单元 (DPU) 配置对 Kria K26 SOM 进行配置,还能根据性能要求,将最适用的配置集成到设计内。

支持更低精度的数据类型

深度学习算法正在以极快的速度演进发展,各种更低精度的数据类型和定制数据正在进入使用。传统的 GPU 厂商已无法满足当前的市场需求,而 Kria K26 SOM 能够支持全系列数据类型精度,如 PF32、INT8、二进制和其他定制数据类型。

低时延与低功耗

为了改善软件可编程能力,GPU 架构需要频繁访问外部 DDR。这种做法非常低效,有时候会对高带宽设计要求构成瓶颈。相反,Zynq MPSoC 架构具有高能效,它的可重配置能

力便于开发者设计的应用减少或不必访问外部存储器。这不仅有助于减少应用的总功耗,也通过降低端到端时延改善了响应能力。

灵活性

与数据流固定的 GPU 不同,赛灵思硬件提供了灵活性用来专门地重新配置数据路径,从而实现最大吞吐量并降低时延。此外,可编程的数据路径也降低了对批处理的需求,而批处理是 GPU 的一个重大不足,需要在降低时延或提高吞吐量之间做出权衡取舍。Kria SOM 灵活的架构已在稀疏网络中展示出巨大潜力。

02

与英伟达 Jetson 性能比较

深度学习模型性能比较

根据测试数据,所有模型在 K26 SOM 上的性能数值均优于英伟达 Jetson Nano。而且对于 SSD Mobilenet-V1 等部分模型,吞吐量则为 Jetson Nano 的四倍以上,为 Jetson Tx2 的两倍左右,从下表可以很容易地看到显著的吞吐量提升。

功耗测量

边缘设备提供最佳性能这点非常重要,但同时必须降低能耗。赛灵思测量了英伟达和赛灵思 SOM 模块在执行具体模型时发生的峰值功率,结果很明显,K26 SOM 优于 Jetson Nano

3.5 倍,优于 Jetson TX2 2.4 倍。

实际应用性能比较

为了分析实际用例,我们选择了一种准确检测和识别车辆牌照的基于机器学习的应用。将 Uncanny Vision 行业领先的 ANPR 算法部署在 Kria SOM 上后,与英伟达用 Deepstream-SDK 完成的“车牌识别”的公开数据进行比较,结果说明,Uncanny Vision 的 ANPR 流水线在针对 KV260 入门套件进行优化后,实现了超过 33fps 的吞吐量,显著优于英伟达基准测试中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。这种前所未有的性能水平为 ANPR 集成商和 OEM 厂商提供了优于竞争对手的开发灵活性。

实际应用测试显示,K26 SOM 不仅在标准性能比较中表现极其优异,并且在为开发者提供加速整体 AI 和视觉流水线所需的原始性能时,效率也更高。通过对比,在标准的基准测试领域之外,竞争解决方案倾向于提供较低效率水平,而且功耗较高。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136069
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266937
  • SOM
    SOM
    +关注

    关注

    0

    文章

    74

    浏览量

    16576

原文标题:白皮书 | Kria K26:边缘端视觉 AI 理想平台

文章出处:【微信号:赛灵思,微信公众号:Xilinx赛灵思官微】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FPGA电源解决方案全解析

    FPGA电源解决方案全解析 在当今的电子设计领域,现场可编程门阵列(FPGA)凭借其出色的设计灵活性和较低的工程成本,在众多应用和终端市场中占据重要地位。然而,FPGA的电源设
    的头像 发表于 04-02 15:45 211次阅读

    时频同步产品手册

    时频同步产品手册
    发表于 03-24 16:02 0次下载

    分享时钟服务器的解决方案及其优势

    随着科技的不断发展,各种应用场景对于时间同步和精确性的要求也越来越高。在这种情况下,时钟服务器应运而生,为各行各业提供高效、稳定、可靠的时间同步解决方案。本文将详细介绍时钟服务器的解决方案及其优势
    的头像 发表于 01-06 17:35 5936次阅读
    <b class='flag-5'>赛</b><b class='flag-5'>思</b>分享时钟服务器的解决方案及其优势

    工程师必入!288 元解锁开发

    做项目、练技术、备赛事却找不到高性价比开发板?合众恒跃重磅福利——ZYNQ系列开发板限时特惠,HZ-XC-7Z010-SP_EVM宠粉
    的头像 发表于 12-17 17:48 1009次阅读
    工程师必入!288 元解锁<b class='flag-5'>赛</b><b class='flag-5'>灵</b><b class='flag-5'>思</b><b class='flag-5'>开发</b>板

    探索Xilinx Kria KR260机器人入门套件:开启机器人应用开发新旅程

    Kria KR260机器人入门套件由K26系统级模块(SOM)的非生产版本、机器人载板和散热解决方案组成。SOM非常紧凑
    的头像 发表于 12-15 14:45 593次阅读

    探索 AMD Kria KD240 驱动入门套件:开启电机控制与电源转换新征程

    探索 AMD Kria KD240 驱动入门套件:开启电机控制与电源转换新征程 在电子工程师的日常工作中,不断探索和评估新的硬件平台对于开发创新产品至关重要。今天,我们将深入研究 AMD Kria
    的头像 发表于 12-15 14:35 932次阅读

    探索AMD Kria K24 SOM:高性能嵌入式平台的卓越之选

    (System-on-Module)作为一款紧凑的嵌入式平台,为众多应用场景提供强大的解决方案。今天,我们就来深入了解一下这款产品。 文件下载: AMD , Xilinx KriaK
    的头像 发表于 12-15 14:35 611次阅读

    DLP800XE 0.8 4K+ 数字微镜器件:高亮度 4K+ 显示的理想之选

    DLP800XE 0.8 4K+ 数字微镜器件:高亮度 4K+ 显示的理想之选 在当今的显示技术领域,高亮度、高分辨率的显示需求日益增长。TI 的 DLP800XE 数字微镜器件(DMD)应运
    的头像 发表于 12-10 14:00 464次阅读

    【作品合集】汇博SEEK100开发板测评

    第二期合集: 创龙科技TLT113/TL3562-MiniEVM开发板测评作品合集 第三期合集: 嘉楠科技01 Studio K230开发板测评作品合集 第四期合集: 昉科技Vis
    发表于 09-15 10:24

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    应用。 为什么选择 Neuton 作为开发人员,在产品中使用边缘人工智能的两个最大障碍是: ML 模型对于您所选微控制器的内存来说太大。 创建自定义
    发表于 08-31 20:54

    特威第二届机器视觉大会即将举办

    去年盛夏,首届易特威机器视觉技术大会点燃行业创新的火花。易惊艳亮相的 TJ375
    的头像 发表于 08-13 09:53 1570次阅读

    AMD Kria KV260视觉AI入门套件更新升级

    各种软件工具与加速应用,适合各种专业水平的开发人员。这款开箱即用的套件能极大助力希望利用量产版 Kria K26 SOM 加速产品上市并实现批量部署的客户。
    的头像 发表于 07-18 09:50 1132次阅读

    【嘉楠堪智K230开发板试用体验】K230机器视觉相关功能体验

    K230开发板摄像头及AI功能测评 摄像头作为机器视觉应用的基础,能够给机器学习模型提供输入,提供输入的质量直接影响机器学习模型的效果。 K
    发表于 07-08 17:25

    Made with KiCad(126):Antmicro OV5640 双摄像头子板

    的 Jetson Orin 底板 支持 AMD-Xilinx KRIA K26 模块化系统的 Kria K26 Devboard 支持 Google Coral 模块化系统的 Goo
    发表于 05-12 18:13

    Deepseek海SD3403边缘计算AI产品系统

    SD3403边缘计算AI框架,提供一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进行AI特征标定,AI模型训练,AI应用部署的
    发表于 04-28 11:05