0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于深度学习的人工智能(AI)应用

安富利 来源:安富利 作者:安富利 2020-09-02 11:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,基于深度学习(DL)的人工智能AI)应用越来越广泛,不论是在与个人消费者相关的智能家居、智能驾驶等领域,还是在视频监控、智慧城市等公共管理领域,我们都能看到其身影。 众所周知,实施一个完整的AI应用需要经历训练和推理两个过程。所谓“训练”,就是我们要将大量的数据代入到神经网络模型中运算并反复迭代,“教会”算法模型如何正确的工作,训练出一个DL模型。而接下来,我们就可以利用训练出来的模型来在线响应用户的需求,根据输入的新数据做出正确而及时的决策判断,这个过程就是“推理”。

通常来讲,一个AI应用中“训练”只需要做一次——有时这个工作会交给第三方专业的且有充沛算力资源的团队去做,而应用开发工程师要做的则是将训练好的模型部署到特定的硬件平台上,满足目标应用场景中推理过程的需要。由于推理过程会直接联系最终用户,推理的准确性和速度也会直接影响到用户体验的好坏,因此如何有效地为AI推理做加速,也就成了当下开发者普遍关心的一个热门的话题。

AI推理加速,FPGA胜出! 从硬件架构来看,可以支持AI推理加速的有四个可选方案,它们分别是:CPUGPU、FPGA和ASIC,如果对这几类器件的特性进行比较,会发现按照从左到右的顺序,器件的灵活性/适应性是递减的,而处理能力和性能功耗比则是递增的。 CPU是基于冯∙诺依曼架构,虽然其很灵活,但由于存储器访问往往要耗费几个时钟周期才能执行一个简单的任务,延迟会很长,应对神经网络(NN)这种计算密集型的任务,功耗也会比较大,显然最不适合做AI推理。 GPU具有强大的数据并行处理能力,在做海量数据训练方面优势明显,而推理计算通常一次只对一个输入项进行处理的应用,GPU并行计算的优势发挥不出来,再加上其功耗相对较大,所以在AI推理方面也不是最优选择。 从高性能和低功耗的角度来看,定制的ASIC似乎是一种理想的解决方案,但其开发周期长、费用高,对于总是处于快速演进和迭代中的DL和NN算法来说,灵活性严重受限,风险太大,在AI推理中人们通常不会考虑它。

所以我们的名单上只剩下FPGA了。这些年来大家对于FPGA快速、灵活和高效的优点认识越来越深入,硬件可编程的特性使其能够针对DL和NN处理的需要做针对性的优化,提供充足的算力,而同时又保持了足够的灵活性。今天基于FPGA的异构计算平台,除了可编程逻辑,还会集成多个Arm处理器内核、DSP、片上存储器等资源,DL所需的处理能力可以很好地映射到这些FPGA资源上,而且所有这些资源都可以并行工作 ,即每个时钟周期可触发多达数百万个同时的操作,这对于AI推理是再合适不过了。 与CPU和GPU相比,FPGA在AI推理应用方面的优势还表现在:

不受数据类型的限制,比如它可以处理非标准的低精度数据,从而提高数据处理的吞吐量。

功耗更低,针对相同的NN计算,FPGA与CPU/GPU相比平均功耗低5~10倍。

可通过重新编程以适应不同任务的需要,这种灵活性对于适应持续发展中的DL和NN算法尤为关键。

应用范围广,从云端到边缘端的AI推理工作,都可胜任。

总之一句话,在AI推理计算的竞争中,FPGA的胜出没有悬念。

GPU无缝对接,FPGA即插即用

不过,虽然FPGA看上去“真香”,但是很多AI应用的开发者还是对其“敬而远之”,究其原因最重要的一点就是——FPGA上手使用太难了! 难点主要体现在两个方面:

首先,对FPGA进行编程需要特定的技能和知识,要熟悉专门的硬件编程语言,还要熟练使用FPGA的特定工具,才能通过综合、布局和布线等复杂的步骤来编译设计。这对于很多嵌入式工程师来说,完全是一套他们所不熟悉的“语言”。

再有,因为很多DL模型是在GPU等计算架构上训练出来的,这些训练好的模型移植、部署到FPGA上时,很可能会遇到需要重新训练和调整参数等问题,这要求开发者有专门的AI相关的知识和技能。

如何能够降低大家在AI推理中使用FPGA的门槛?在这方面,Mipsology公司给我们带来了一个“惊喜”——该公司开发了一种基于FPGA的深度学习推理引擎Zebra,可以让开发者在“零努力(Zero Effort)”的情况下,对GPU训练的模型代码进行转换,使其能够在FPGA上运行,而无需改写任何代码或者进行重新训练。 这也就意味着,调整NN参数甚至改变神经网络并不需要强制重新编译FPGA,而这些重新编译工作可能需要花费数小时、数天,甚至更长时间。可以说,Zebra让FPGA对于开发者成了“透明”的,他们可以在NN模型训练好之后,无缝地从CPU或GPU切换到FPGA进行推理,而无需花费更多的时间! 目前,Zebra可以支持Caffe、Caffe2、MXNet和TensorFlow等主流NN框架。在硬件方面,Zebra已经可以完美地支持Xilinx的系列加速卡,如Alveo U200、Alveo U250和Alveo U50等。对于开发者来说,“一旦将FPGA板插入PC,只需一个Linux命令”,FPGA就能够代替CPU或GPU立即进行无缝的推断,可以在更低的功耗下将计算速度提高一个数量级。对用户来说,这无疑是一种即插即用的体验。

图1,Zebra可适应由GPU加速器训练的NN,并无缝地在FPGA上部署

强强联手,全生态支持 更好的消息是:为了能够加速更多AI应用的落地,安富利亚洲和 Mipsology 达成了合作协议,将向其亚太区客户推广和销售 Mipsology 这一独特的 FPGA 深度学习推理加速软件 —— Zebra。 这对于合作的双方无疑是一个双赢的局面:对于Mipsology来说,可以让Zebra这个创新的工具以更快的速度覆盖和惠及更多的开发者;对安富利来说,此举也进一步扩展了自身强大的物联网生态系统,为客户带来更大的价值,为希望部署DL的客户提供一整套全面的服务,包括硬件、软件、系统集成、应用开发、设计链和专业技术。

安富利推理加速成功应用案例:智能网络监控平台AI Bluebox 想学习更多Zebra 软件的“神奇之处”,掌握如何基于Zebra 软件、安富利服务器以及赛灵思的Alveo加速卡,方便有效地安装正确的 CNN 神经网络推理加速器,深入地体验基于Zebra 的解决方案如何无缝替代 GPU 板卡做AI 推理?立即报名参加9月3日(周四)下午1430【活动预告】安富利携手 Mipsology 加速 AI 解决方案部署网络研讨会,技术大咖为您一一解答!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50293

    浏览量

    266843
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124609

原文标题:无缝替代GPU,让FPGA加速你的AI推理!

文章出处:【微信号:AvnetAsia,微信公众号:安富利】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    内容概要:文档内容介绍了中图仪器(Chotest)影像测量仪融合人工智能深度学习与飞拍技术的自动化检测解决方案。系统通过AI深度
    发表于 03-31 17:11

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak
    的头像 发表于 02-22 08:24 326次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    人工智能与机器学习在这些行业的深度应用

    人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能AI)与机器
    的头像 发表于 02-04 14:44 657次阅读

    嵌入式系统中的人工智能

    本文编译自ElectronicDesign人工智能AI)正彻底变革嵌入式系统,改变技术融入日常生活的方式。如今的人工智能不再局限于执行基础任务,它还被应用于智能汽车、工业自动化、医疗
    的头像 发表于 12-18 11:49 1180次阅读
    嵌入式系统中<b class='flag-5'>的人工智能</b>

    AI 芯片浪潮下,职场晋升新契机?

    单元)、FPGA(现场可编程门阵列)、ASIC(专用集成电路)以及神经拟态芯片等几大类。在职称评审体系中,这些细分领域对应着不同的专业方向。以东莞市工程系列人工智能专业职称评审为例,其人工智能硬件专业
    发表于 08-19 08:58

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到医疗诊断,AI的应用场景不断扩展,推动社会向
    的头像 发表于 07-16 15:01 2270次阅读

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    视觉开发板开箱即用的离线AI能力,分类列出学习课程知识点和实操参考,希望能够帮助大家快速掌握离线 AI 智能硬件的基础知识与实战技能,同时了解相关A
    发表于 07-04 11:14

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    Nordic收购 Neuton.AI 关于产品技术的分析

    示例和支持,方便开发者在 Nordic 的各类芯片上实现高效的边缘 AI 应用; 如果对这个AI人工智能应用感兴趣,请评论区联系我们.
    发表于 06-28 14:18

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55