0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于深度学习的人工智能(AI)应用

安富利 来源:安富利 作者:安富利 2020-09-02 11:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,基于深度学习(DL)的人工智能AI)应用越来越广泛,不论是在与个人消费者相关的智能家居、智能驾驶等领域,还是在视频监控、智慧城市等公共管理领域,我们都能看到其身影。 众所周知,实施一个完整的AI应用需要经历训练和推理两个过程。所谓“训练”,就是我们要将大量的数据代入到神经网络模型中运算并反复迭代,“教会”算法模型如何正确的工作,训练出一个DL模型。而接下来,我们就可以利用训练出来的模型来在线响应用户的需求,根据输入的新数据做出正确而及时的决策判断,这个过程就是“推理”。

通常来讲,一个AI应用中“训练”只需要做一次——有时这个工作会交给第三方专业的且有充沛算力资源的团队去做,而应用开发工程师要做的则是将训练好的模型部署到特定的硬件平台上,满足目标应用场景中推理过程的需要。由于推理过程会直接联系最终用户,推理的准确性和速度也会直接影响到用户体验的好坏,因此如何有效地为AI推理做加速,也就成了当下开发者普遍关心的一个热门的话题。

AI推理加速,FPGA胜出! 从硬件架构来看,可以支持AI推理加速的有四个可选方案,它们分别是:CPUGPU、FPGA和ASIC,如果对这几类器件的特性进行比较,会发现按照从左到右的顺序,器件的灵活性/适应性是递减的,而处理能力和性能功耗比则是递增的。 CPU是基于冯∙诺依曼架构,虽然其很灵活,但由于存储器访问往往要耗费几个时钟周期才能执行一个简单的任务,延迟会很长,应对神经网络(NN)这种计算密集型的任务,功耗也会比较大,显然最不适合做AI推理。 GPU具有强大的数据并行处理能力,在做海量数据训练方面优势明显,而推理计算通常一次只对一个输入项进行处理的应用,GPU并行计算的优势发挥不出来,再加上其功耗相对较大,所以在AI推理方面也不是最优选择。 从高性能和低功耗的角度来看,定制的ASIC似乎是一种理想的解决方案,但其开发周期长、费用高,对于总是处于快速演进和迭代中的DL和NN算法来说,灵活性严重受限,风险太大,在AI推理中人们通常不会考虑它。

所以我们的名单上只剩下FPGA了。这些年来大家对于FPGA快速、灵活和高效的优点认识越来越深入,硬件可编程的特性使其能够针对DL和NN处理的需要做针对性的优化,提供充足的算力,而同时又保持了足够的灵活性。今天基于FPGA的异构计算平台,除了可编程逻辑,还会集成多个Arm处理器内核、DSP、片上存储器等资源,DL所需的处理能力可以很好地映射到这些FPGA资源上,而且所有这些资源都可以并行工作 ,即每个时钟周期可触发多达数百万个同时的操作,这对于AI推理是再合适不过了。 与CPU和GPU相比,FPGA在AI推理应用方面的优势还表现在:

不受数据类型的限制,比如它可以处理非标准的低精度数据,从而提高数据处理的吞吐量。

功耗更低,针对相同的NN计算,FPGA与CPU/GPU相比平均功耗低5~10倍。

可通过重新编程以适应不同任务的需要,这种灵活性对于适应持续发展中的DL和NN算法尤为关键。

应用范围广,从云端到边缘端的AI推理工作,都可胜任。

总之一句话,在AI推理计算的竞争中,FPGA的胜出没有悬念。

GPU无缝对接,FPGA即插即用

不过,虽然FPGA看上去“真香”,但是很多AI应用的开发者还是对其“敬而远之”,究其原因最重要的一点就是——FPGA上手使用太难了! 难点主要体现在两个方面:

首先,对FPGA进行编程需要特定的技能和知识,要熟悉专门的硬件编程语言,还要熟练使用FPGA的特定工具,才能通过综合、布局和布线等复杂的步骤来编译设计。这对于很多嵌入式工程师来说,完全是一套他们所不熟悉的“语言”。

再有,因为很多DL模型是在GPU等计算架构上训练出来的,这些训练好的模型移植、部署到FPGA上时,很可能会遇到需要重新训练和调整参数等问题,这要求开发者有专门的AI相关的知识和技能。

如何能够降低大家在AI推理中使用FPGA的门槛?在这方面,Mipsology公司给我们带来了一个“惊喜”——该公司开发了一种基于FPGA的深度学习推理引擎Zebra,可以让开发者在“零努力(Zero Effort)”的情况下,对GPU训练的模型代码进行转换,使其能够在FPGA上运行,而无需改写任何代码或者进行重新训练。 这也就意味着,调整NN参数甚至改变神经网络并不需要强制重新编译FPGA,而这些重新编译工作可能需要花费数小时、数天,甚至更长时间。可以说,Zebra让FPGA对于开发者成了“透明”的,他们可以在NN模型训练好之后,无缝地从CPU或GPU切换到FPGA进行推理,而无需花费更多的时间! 目前,Zebra可以支持Caffe、Caffe2、MXNet和TensorFlow等主流NN框架。在硬件方面,Zebra已经可以完美地支持Xilinx的系列加速卡,如Alveo U200、Alveo U250和Alveo U50等。对于开发者来说,“一旦将FPGA板插入PC,只需一个Linux命令”,FPGA就能够代替CPU或GPU立即进行无缝的推断,可以在更低的功耗下将计算速度提高一个数量级。对用户来说,这无疑是一种即插即用的体验。

图1,Zebra可适应由GPU加速器训练的NN,并无缝地在FPGA上部署

强强联手,全生态支持 更好的消息是:为了能够加速更多AI应用的落地,安富利亚洲和 Mipsology 达成了合作协议,将向其亚太区客户推广和销售 Mipsology 这一独特的 FPGA 深度学习推理加速软件 —— Zebra。 这对于合作的双方无疑是一个双赢的局面:对于Mipsology来说,可以让Zebra这个创新的工具以更快的速度覆盖和惠及更多的开发者;对安富利来说,此举也进一步扩展了自身强大的物联网生态系统,为客户带来更大的价值,为希望部署DL的客户提供一整套全面的服务,包括硬件、软件、系统集成、应用开发、设计链和专业技术。

安富利推理加速成功应用案例:智能网络监控平台AI Bluebox 想学习更多Zebra 软件的“神奇之处”,掌握如何基于Zebra 软件、安富利服务器以及赛灵思的Alveo加速卡,方便有效地安装正确的 CNN 神经网络推理加速器,深入地体验基于Zebra 的解决方案如何无缝替代 GPU 板卡做AI 推理?立即报名参加9月3日(周四)下午1430【活动预告】安富利携手 Mipsology 加速 AI 解决方案部署网络研讨会,技术大咖为您一一解答!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49741

    浏览量

    261575
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123912

原文标题:无缝替代GPU,让FPGA加速你的AI推理!

文章出处:【微信号:AvnetAsia,微信公众号:安富利】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到医疗诊断,AI的应用场景不断扩展,推动社会向
    的头像 发表于 07-16 15:01 1196次阅读

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    视觉开发板开箱即用的离线AI能力,分类列出学习课程知识点和实操参考,希望能够帮助大家快速掌握离线 AI 智能硬件的基础知识与实战技能,同时了解相关A
    发表于 07-04 11:14

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    AI人工智能隐私保护怎么样

    在当今科技飞速发展的时代,AI人工智能已经深入到我们生活的方方面面,从医疗诊断到交通调度,从教育辅助到娱乐互动,其影响力无处不在。然而,随着AI人工智能的广泛应用,其安全性问题也备受关
    的头像 发表于 03-11 09:46 958次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>人工智能</b>隐私保护怎么样

    AI智能质检系统 工业AI视觉检测

    AI质检(智能)系统的优点有哪些? 随着工业4.0和智能制造的快速发展,人工智能AI)技术在工业生产中的应用日益广泛,其中
    的头像 发表于 02-26 17:36 1201次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>智能</b>质检系统 工业<b class='flag-5'>AI</b>视觉检测

    AI商业应用平台的特点

    AI商业应用平台集成了自然语言处理、机器学习深度学习等前沿的人工智能技术。以下,是对AI商业应
    的头像 发表于 02-22 09:58 876次阅读

    Stellantis与Mistral AI深化人工智能合作

    近日,Stellantis宣布与Mistral AI进一步扩大人工智能战略合作伙伴关系,旨在将人工智能技术深度整合到车辆工程、车内体验等多个关键领域,共同推动汽车行业的
    的头像 发表于 02-11 15:50 651次阅读

    数学专业转人工智能方向:考研/就业前景分析及大学四年学习路径全揭秘

    随着AI技术的不断进步,专业人才的需求也日益增长。数学作为AI的基石,为机器学习深度学习、数据分析等提供了理论基础和工具,因此越来越多的数
    的头像 发表于 02-07 11:14 1702次阅读
    数学专业转<b class='flag-5'>人工智能</b>方向:考研/就业前景分析及大学四年<b class='flag-5'>学习</b>路径全揭秘

    人工智能和机器学习以及Edge AI的概念与应用

    人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能和机器学习是现代科技的核心技术
    的头像 发表于 01-25 17:37 1581次阅读
    <b class='flag-5'>人工智能</b>和机器<b class='flag-5'>学习</b>以及Edge <b class='flag-5'>AI</b>的概念与应用

    AI自动化生产:深度学习在质量控制中的应用

    随着科技的飞速发展,人工智能AI)与深度学习技术正逐步渗透到各个行业,特别是在自动化生产中,其潜力与价值愈发凸显。深度
    的头像 发表于 01-17 16:35 1213次阅读
    <b class='flag-5'>AI</b>自动化生产:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在质量控制中的应用