0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍一款基于昆仑芯AI加速卡的高效模型推理部署框架

昆仑芯科技 来源:昆仑芯科技 2023-10-17 11:16 次阅读

引言

昆仑芯科技公众号全新栏目“用芯指南”重磅推出!面向AI行业技术从业者,系列好文将提供手把手的昆仑芯产品使用指南。第一期围绕昆仑芯自研效能工具——昆仑芯Anyinfer展开,这是一款基于昆仑芯AI加速卡的高效模型推理部署框架。种种行业痛点,昆仑芯Anyinfer轻松搞定。

当下,AI技术蓬勃发展,AI算法应用需求井喷。行业技术从业者在项目的不同阶段面临种种现实问题,这些问题无疑也增加了项目的复杂性和不确定性:

算法选型:

技术从业者极有可能遇到不同框架格式的算法模型;即便是同一个开源算法的实现,也可能是经过不同训练框架导出,因此模型的保存格式也会有所不同。

算法验证:

想在AI加速卡上评估算法的推理效果,就要针对不同推理框架的接口构造上百行代码的推理程序;如果效果不达预期,可能还需要更换其他框架的模型,这就需要重新构造一份不同的推理程序......

真正到了算法部署阶段,则将迎来更加严峻的挑战。

以上种种业内痛点,是否也在困扰您?看完这篇,基于昆仑芯AI加速卡的高效模型推理部署框架——昆仑芯Anyinfer,帮您一键全搞定!

1昆仑芯Anyinfer

1.昆仑芯Anyinfer架构图

f8bb754c-6c1e-11ee-939d-92fbcf53809c.png

2.昆仑芯Anyinfer核心优势

A强兼容性

在多个平台上支持零代码推理PaddlePaddle、PyTorch、ONNX、TensorFlow等多个主流框架格式的众多领域模型。

B高人效

内置多款推理引擎,针对不同领域,用户无需学习特定框架编程接口,更不用编写多份推理程序,零代码验证模型在不同框架中的效果。

C零代码

只需一行命令,即可完成模型验证评估,无需依据模型构建输入数据,也无需撰写模型转换、前后处理及推理脚本代码。

D部署友好

支持C++Python两套接口逻辑统一的API,用户在生产环境中部署模型更方便。

2运行演示

1. 快速完成算法模型验证评估

一行命令,即可轻松验证模型精度、一键评估模型的推理性能等关键指标。

AONNX、PyTorch和TensorFlow模型在昆仑芯AI加速卡和CPU上的计算精度对比

f8d3ee9c-6c1e-11ee-939d-92fbcf53809c.gif

BPaddlePaddle模型在昆仑芯AI加速卡上的推理性能统计

f8f5aaa0-6c1e-11ee-939d-92fbcf53809c.gif

2.获取模型性能分析报告,为下一步模型优化做足准备

在初步完成算法模型的验证评估后,可利用昆仑芯Anyinfer深入研究模型中各个层面的性能,包括推理框架层面和算子执行层面等,助力进一步调优模型的推理性能。

f9195356-6c1e-11ee-939d-92fbcf53809c.gif

一键开启昆仑芯自研推理引擎的性能分析模式,统计框架层和算子层面的计算耗时

f93f8bfc-6c1e-11ee-939d-92fbcf53809c.gif

一键开启Paddle inference的性能分析模式,统计框架层和算子层面的耗时

3. 模型的基础性能调优

完成对模型的性能评估后,可以使用基础的调优方法来提高模型的推理性能。昆仑芯Anyinfer提供了一项非常便捷的功能:最佳QPS搜索。此功能将以往需要修改多个参数并多次执行的操作化繁为简,快速确定最适合项目需求的配置,提高用户体验。

f968afe6-6c1e-11ee-939d-92fbcf53809c.gif

搜索最佳QPS

4. 模型的高性能部署

完成算法模型的验证后,最关键的一步来了!昆仑芯Anyinfer可轻松应对生产环境部署这一挑战。仅需三个统一的C++接口,即可顺利将验证后的模型部署至生产环境中。

此外,昆仑芯Anyinfer还提供了方便的调试功能,例如算子的自动精度对比、模型转换等。同时,也提供了丰富的使用示例,包括多输入、多线程、多进程、多流推理等。种种行业痛点,昆仑芯Anyinfer轻松搞定。简洁而强大的解决方案,帮您把模型推理部署变得简单、高效。

目前,昆仑芯Anyinfer已在多个行业客户中投入使用,切实降低了行业客户人力成本,提高了项目交付效率,助力客户在行业竞争中取得领先优势。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4456

    浏览量

    90760
  • AI
    AI
    +关注

    关注

    87

    文章

    26459

    浏览量

    264085
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47696
  • 昆仑芯科技
    +关注

    关注

    0

    文章

    27

    浏览量

    381

原文标题:一键搞定!昆仑芯Anyinfer助您零代码实现昆仑芯AI加速卡模型推理

文章出处:【微信号:昆仑芯科技,微信公众号:昆仑芯科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    EdgeBoard FZ5 边缘AI计算盒及计算

    作为人工智能项目落地的硬件平台,也可以将EdgeBoard计算嵌入终端设备,使设备具备AI推理能力。 继7月份发布第一款 EdgeBoard FZ3计算
    发表于 08-31 14:12

    科技推出了针对来RISC-V平台的AI部署工具包(tinyAI SDK)

    11.01倍(相较原生AI算法)的显著推断性能提升。千科技的tinyAI SDK成为首个支持来UX600图像AI计算部署
    发表于 11-21 10:08

    基于SRAM的方法可以加速AI推理

    基于SRAM的方法可加速AI推理
    发表于 12-30 07:28

    基于加速卡的FPGA生态系统布局是怎样的?

    FPGA加速卡是如何产生的?主要的FPGA加速卡产品有哪些?基于加速卡的FPGA生态系统布局是怎样的?
    发表于 06-17 06:07

    Dllite_micro (轻量级的 AI 推理框架

    DLLite-Micro 是个轻量级的 AI 推理框架,可以为 OpenHarmony OS 的轻量设备和小型设备提供深度模型
    发表于 08-05 11:40

    介绍在STM32cubeIDE上部署AI模型的系列教程

    介绍在STM32cubeIDE上部署AI模型的系列教程,开发板型号STM32H747I-disco,值得看。MCUAI原文链接:【嵌入式
    发表于 12-14 09:05

    MLU220-M.2边缘端智能加速卡支持相关资料介绍

    。可以轻松实现终端设备和边缘段设备的AI赋能方案。MLU220-M.2加速卡用于离线模型部署,离线模型在MLU220上运行, 不依赖
    发表于 08-08 17:37

    嵌入式边缘AI应用开发指南

    部署到TI硬件上。然而,将深度学习模型部署到硬件加速器上只是难题的冰山角。为帮助您快速构建高效
    发表于 11-03 06:53

    压缩模型加速推理吗?

    你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 将简单的 CNN 导入到 STM32L462RCT我发现压缩模型推理时间没有影响。aiRun 程序在 8
    发表于 01-29 06:24

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件设备 AI 模型推理
    发表于 12-14 11:41

    基于NVIDIA Triton的AI模型高效部署实践

    NVIDIA Triton 推理服务器(以前称为 TensorRT 推理服务器)是一款开源软件,可简化深度学习模型在生产环境中的部署。借助
    的头像 发表于 06-28 15:49 1333次阅读

    昆仑芯科技产业级AI模型部署全攻略

      12月28日,昆仑芯科技将联合百度飞桨FastDeploy团队带来“产业级AI模型部署全攻略 -昆仑芯科技专场”直播课程,就产业
    的头像 发表于 12-28 10:27 1280次阅读
    <b class='flag-5'>昆仑</b>芯科技产业级<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>全攻略

    昆仑芯新品R100正式发布,强大算力赋能边缘推理场景

    近日,昆仑芯新品R100于2022智算峰会「智能芯力量」专题论坛正式发布。昆仑AI加速卡R100(以下简称“昆仑芯R100”)定位于边缘大
    的头像 发表于 12-29 11:36 1752次阅读

    三种主流模型部署框架YOLOv8推理演示

    深度学习模型部署有OpenVINO、ONNXRUNTIME、TensorRT三个主流框架,均支持Python与C++的SDK使用。对YOLOv5~YOLOv8的系列模型,均可以通过C+
    的头像 发表于 08-06 11:39 1844次阅读

    瞬变对AI加速卡供电的影响

    的算力,尤其是在学习和推理时。这种需求不断地将供电网络的边界推向前所未有的新水平。这些高密度工作负载变得愈加复杂,更高的瞬态需求推动配电网络的每个部分都必须高效运行。AI加速卡严格的功
    的头像 发表于 12-01 18:10 208次阅读
    瞬变对<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>供电的影响