0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思Kria K26 SOM应运而生为ML边缘应用开发提供了更加理想的选择

Xilinx赛灵思官微 来源:Xilinx赛灵思官微 作者:Xilinx赛灵思官微 2021-07-01 11:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着人工智能机器学习算法取得一系列新进展

众多高计算强度的应用正在被部署到边缘设备上

当下,业界迫切需要一种高效率的硬件

既能高效率地执行复杂算法

又能适应这种技术的快速演进

在此背景下,赛灵思 Kria K26 SOM应运而生

为 ML 边缘应用开发提供了更加理想的选择

赛灵思的研究结果表明,K26 SOM 提供了比英伟达 Jetson Nano 高出大约 3 倍的性能。此外,它的单位功耗性能较之英伟达 Jetson TX2 提升了 2 倍。对于 SSD MobileNet-v1 这样的网络,K26 SOM 的低时延、高性能深度学习处理单元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

与未来兼容的 Kria K26 SOM

智能应用除了要求亚微秒级的时延,还需要具备私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架构为基础,Kria K26 SOM 提供了业界一流的单位功耗性能和更低的总体拥有成本,使之成为边缘设备的理想选择。

原始计算能力

就在边缘设备上部署解决方案而言,硬件必须拥有充足的算力,才能处理先进 ML 算法工作负载。我们可以使用各种深度学习处理单元 (DPU) 配置对 Kria K26 SOM 进行配置,还能根据性能要求,将最适用的配置集成到设计内。

支持更低精度的数据类型

深度学习算法正在以极快的速度演进发展,各种更低精度的数据类型和定制数据正在进入使用。传统的 GPU 厂商已无法满足当前的市场需求,而 Kria K26 SOM 能够支持全系列数据类型精度,如 PF32、INT8、二进制和其他定制数据类型。

低时延与低功耗

为了改善软件可编程能力,GPU 架构需要频繁访问外部 DDR。这种做法非常低效,有时候会对高带宽设计要求构成瓶颈。相反,Zynq MPSoC 架构具有高能效,它的可重配置能

力便于开发者设计的应用减少或不必访问外部存储器。这不仅有助于减少应用的总功耗,也通过降低端到端时延改善了响应能力。

灵活性

与数据流固定的 GPU 不同,赛灵思硬件提供了灵活性用来专门地重新配置数据路径,从而实现最大吞吐量并降低时延。此外,可编程的数据路径也降低了对批处理的需求,而批处理是 GPU 的一个重大不足,需要在降低时延或提高吞吐量之间做出权衡取舍。Kria SOM 灵活的架构已在稀疏网络中展示出巨大潜力。

02

与英伟达 Jetson 性能比较

深度学习模型性能比较

根据测试数据,所有模型在 K26 SOM 上的性能数值均优于英伟达 Jetson Nano。而且对于 SSD Mobilenet-V1 等部分模型,吞吐量则为 Jetson Nano 的四倍以上,为 Jetson Tx2 的两倍左右,从下表可以很容易地看到显著的吞吐量提升。

功耗测量

边缘设备提供最佳性能这点非常重要,但同时必须降低能耗。赛灵思测量了英伟达和赛灵思 SOM 模块在执行具体模型时发生的峰值功率,结果很明显,K26 SOM 优于 Jetson Nano

3.5 倍,优于 Jetson TX2 2.4 倍。

实际应用性能比较

为了分析实际用例,我们选择了一种准确检测和识别车辆牌照的基于机器学习的应用。将 Uncanny Vision 行业领先的 ANPR 算法部署在 Kria SOM 上后,与英伟达用 Deepstream-SDK 完成的“车牌识别”的公开数据进行比较,结果说明,Uncanny Vision 的 ANPR 流水线在针对 KV260 入门套件进行优化后,实现了超过 33fps 的吞吐量,显著优于英伟达基准测试中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。这种前所未有的性能水平为 ANPR 集成商和 OEM 厂商提供了优于竞争对手的开发灵活性。

实际应用测试显示,K26 SOM 不仅在标准性能比较中表现极其优异,并且在为开发者提供加速整体 AI 和视觉流水线所需的原始性能时,效率也更高。通过对比,在标准的基准测试领域之外,竞争解决方案倾向于提供较低效率水平,而且功耗较高。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134478
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261624
  • SOM
    SOM
    +关注

    关注

    0

    文章

    72

    浏览量

    16403

原文标题:白皮书 | Kria K26:边缘端视觉 AI 理想平台

文章出处:【微信号:赛灵思,微信公众号:Xilinx赛灵思官微】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DLP800XE 0.8 4K+ 数字微镜器件:高亮度 4K+ 显示的理想之选

    DLP800XE 0.8 4K+ 数字微镜器件:高亮度 4K+ 显示的理想之选 在当今的显示技术领域,高亮度、高分辨率的显示需求日益增长。TI 的 DLP800XE 数字微镜器件(DMD)应运
    的头像 发表于 12-10 14:00 60次阅读

    科技与理想汽车续签激光雷达合作

    今日,全球激光雷达领先企业禾科技(NASDAQ: HSAI;HKEX: 2525)正式宣布获得理想汽车全新一代辅助驾驶平台全系车型激光雷达定点,包括 L 系列、 i 系列和 MEGA。禾科技也将继续作为
    的头像 发表于 11-13 10:21 1529次阅读

    【作品合集】汇博SEEK100开发板测评

    第二期合集: 创龙科技TLT113/TL3562-MiniEVM开发板测评作品合集 第三期合集: 嘉楠科技01 Studio K230开发板测评作品合集 第四期合集: 昉科技Vis
    发表于 09-15 10:24

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    应用。 为什么选择 Neuton 作为开发人员,在产品中使用边缘人工智能的两个最大障碍是: ML 模型对于您所选微控制器的内存来说太大。 创建自定义
    发表于 08-31 20:54

    AMD Kria KV260视觉AI入门套件更新升级

    各种软件工具与加速应用,适合各种专业水平的开发人员。这款开箱即用的套件能极大助力希望利用量产版 Kria K26 SOM 加速产品上市并实现批量部署的客户。
    的头像 发表于 07-18 09:50 718次阅读

    【嘉楠堪智K230开发板试用体验】K230机器视觉相关功能体验

    K230开发板摄像头及AI功能测评 摄像头作为机器视觉应用的基础,能够给机器学习模型提供输入,提供输入的质量直接影响机器学习模型的效果。 K
    发表于 07-08 17:25

    Made with KiCad(126):Antmicro OV5640 双摄像头子板

    的 Jetson Orin 底板 支持 AMD-Xilinx KRIA K26 模块化系统的 Kria K26 Devboard 支持 Google Coral 模块化系统的 Goo
    发表于 05-12 18:13

    Deepseek海SD3403边缘计算AI产品系统

    SD3403边缘计算AI框架,提供一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进行AI特征标定,AI模型训练,AI应用部署的
    发表于 04-28 11:05

    边缘计算与AI融合:技术创新与产业变革的交汇点

    工智能的融合应运而生,为各行各业的智能化转型提供新的可能性。本文将深入探讨边缘计算与AI的技术融合、协同创新、应用场景以及未来发展前景,旨在为边缘
    的头像 发表于 04-21 14:15 1038次阅读
    <b class='flag-5'>边缘</b>计算与AI融合:技术创新与产业变革的交汇点

    机器人开发套件 Kria KR260

    AMD/XilinxKria KR260机器人入门套件是一款基于Kria K26 SOM开发平台,设计用于机器人和工业应用。它具有高性能接口和原生ROS2支持,便于机器人和软件
    的头像 发表于 04-11 13:15 1409次阅读
    机器人<b class='flag-5'>开发</b>套件 <b class='flag-5'>Kria</b> KR260

    边缘计算盒子有什么发展情景和应用案例?

    随着新时代大数据的几何级增长,将信息上传云端平台进行处理再下发智能硬件终端的方式,已无法满足现在海量数据处理的需求。边缘计算网关与边缘计算盒子应运而生,代替云端平台实现快速实时的数据处理。边缘
    的头像 发表于 04-02 10:22 877次阅读
    <b class='flag-5'>边缘</b>计算盒子有什么发展情景和应用案例?

    Arm发布基于Armv9架构的Cortex-A320处理器

    边缘 AI 需要更卓越的计算性能、更强大的安全性,以及更出色的软件灵活性。随着软件愈发复杂化,Armv9 架构应运而生,以提供先进的机器学习 (ML) 和 AI 功能,并具备增强的安全
    的头像 发表于 02-27 17:10 1157次阅读

    国产EDA亿®接入DeepSeek

    国产EDA软件亿(eLinx)软件接入DeepSeek,为EDA行业注入变革性力量,开启FPGA应用开发的崭新篇章。通过集成DeepSeek插件,eLinx软件构建起连接FPGA开发
    的头像 发表于 02-21 17:26 1325次阅读
    国产EDA亿<b class='flag-5'>灵</b><b class='flag-5'>思</b>®接入DeepSeek

    低温失效的原因,有没有别的方法或者一些见解?

    低温失效的原因,有没有别的方法或者一些见解。就是芯片工作温度在100°--40°区间,然后呢我们到了0°以下就不工作了,然后在低温的情况下监测电流和电压都正常,频率也都正常,频
    发表于 12-30 16:28

    Silicon Labs携手Eta Compute简化边缘ML开发

    Silicon Labs(芯科科技)与 Eta Compute近期共同宣布建立合作伙伴关系,将支持产品开发人员将机器学习(ML)高级功能无缝集成到其边缘ML嵌入式产品中,以添加多样应用
    的头像 发表于 12-12 10:26 1075次阅读