0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Xilinx AI加速+阿里云FaaS 在云AI推断方面有显著的成本优势

lyj159 来源:Xilinx 作者:Xilinx 2020-03-19 08:58 次阅读

中国是全球最大的在线零售市场,而阿里巴巴则是中国最大的电子商务公司。作为阿里巴巴集团旗下的云计算和数据智能部门,阿里云为国际客户的在线业务及阿里巴巴集团自身的电子商务生态系统提供综合全面的成套全球云计算服务。在公有云服务提供商市场上,阿里云的市场份额位居亚太地区首位。

阿里云的业务之一是为众多第三方厂商处理海量产品图像。由于一些图像内含有未付费广告等多余文本信息,给付费广告业务造成不利影响,因此,为了确保电子商务网站提供一致的体验,需要以 AI 推断对每天数千万幅图像中嵌入的有害文本或多余文本进行检测,随之而来的是巨大的 AI 推断计算工作负载以及高昂的运营成本。

借助 ML 框架在赛灵思 FPGA 上直接加速 Yolo-v2

阿里巴巴过去使用 GPU 运行 Yolo-v2 Tiny(数据类型为 Float32),通过这种方法掌握每日千万级的图像内容。由于该架构未经充分优化,GPU 只能实现有限的每秒查询次数 (QPS) 吞吐量,导致用电成本高、服务器空间占用大。为了降低运营费用,阿里巴巴寻求比 GPU 成本更低的解决方案来检测有害或多余的文本信息。

依托于赛灵思 16nm Virtex UltraScale+™ FPGA 的高度自适应架构,阿里云 FaaS 团队在 Int16 上运行 Yolo-v2 Tiny 模型,在媲美 GPU 精度的前提下实现一流的 QPS 性能。单片赛灵思 UltraScale+ FPGA 每秒能处理数百幅图片,与最初的 GPU 实现方案相比性能提高 3.5 倍。在 FaaS 的启发下,虽然GPU通过完成类似优化也可以达到类似性能,但赛灵思解决方案的单幅图像成本更低。除此之外,赛灵思 Vitis AI 在加快开发速度方面也有着上佳表现。

Xilinx AI加速+阿里云FaaS 在云AI推断方面有显著的成本优势

VU9P 与 GPU 运行 YOLO V2 Tiny 的对比

赛灵思 Vitis AI 堆栈

在不降低精度的前提下节省 75% 总拥有成本

Vitis AI 支持开发者在无需编写任何 RTL 代码的情况下,优化 DNN 模型并将预训练的 DNN 模型部署到赛灵思 FPGA 中。其运行时及外壳程序让开发者无需成为 FPGA 专家就能够充分从赛灵思硬件加速中获益。

阿里巴巴云和智能FPGA异构计算负责人张振祥负责领导该项目并成功在 F3 实例上实施了 AI 加速。

阿里云 FaaS 在云端提供统一的硬件平台与中间件。在赛灵思 Vitis AI 的支持下,阿里云 FaaS 能够大幅降低 AI 加速器的开发成本与部署成本。加速器厂商可以将加速器以服务形式提供给用户,克服加速技术的硬件壁垒。用户可以按需使用加速服务,不必理解底层硬件详情。借助 Vitis AI,阿里巴巴和赛灵思联合开发 AI 加速解决方案的最大优势在于,阿里巴巴不需要任何人成为使用 FPGA 技术的专家。

此外,张振祥还指出:“起初,很多人对于将 FPGA 用于 AI 领域的前景并不看好,因为 GPU 使用方便且支持所有框架。但是,阿里云与赛灵思合作充分证明了其实 FPGA 更适合该领域中的特定场景。”

FPGA 更适合!

FPGA 更适合某些领域中的特定场景,尤其是在云 AI 推断方面有显著的成本优势。例如:

云端外壳程序使开发工作大幅简化;

小宽度及修剪所需成本及功耗大幅降低;

图像锐化及 FFT 过滤器等 IP 会为部分创新应用创造额外价值。

通过 FaaS 平台,加上大量的 ISV 及独立的 IP 开发商,FPGA 会在云端 AI 推断领域迎来大量机遇。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Xilinx
    +关注

    关注

    70

    文章

    2119

    浏览量

    119368
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264029
收藏 人收藏

    评论

    相关推荐

    NanoEdge AI的技术原理、应用场景及优势

    工业生产过程中,NanoEdge AI 可以帮助实现对生产线的实时监控和故障预测,提高生产效率和降低维护成本。 3.智能交通:通过将 NanoEdge AI 应用于交通信号灯、无人
    发表于 03-12 08:09

    【国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    使用硬件加速器来进一步提升性能。我写的这个简化的代码只是为了帮助理解FPGA如何可能参与AI计算的过程。实际的FPGA AI加速项目中,还
    发表于 02-12 16:18

    【KV260视觉入门套件试用体验】KV260系列之Petalinux镜像+Resnet 50探索

    Vitis AI 概述 AMD Vitis™ AI 开发环境可在 AMD 硬件平台上加速 AI 推断,包括边缘器件和 AMD Versal™
    发表于 10-16 04:22

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    推断开发平台,它可以帮助开发者赛灵思的 FPGA 和自适应 SoC 上实现高效的 AI 应用部署。它是一个强大而灵活的 AI 开发平台,它可以让您充分利用赛灵思硬件平台的
    发表于 10-14 15:34

    【KV260视觉入门套件试用体验】Vitis-AI加速的YOLOX视频目标检测示例体验和原理解析

    本文将介绍如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测,并对相关源码进行解读。由于演示的示例程序源码是Vitis-AI开源项目提供的,本文演示之前会介绍所需要的准备工作。演示之后
    发表于 10-06 23:32

    【KV260视觉入门套件试用体验】基于Vitis AI的ADAS目标识别

    一、基础知识 (一)Vitis™ AI开发环境 Vitis™ AI开发环境可在赛灵思硬件平台上加速 AI 推断,包括边缘器件和 Alveo™
    发表于 09-27 23:21

    AI智能呼叫中心

    、数据驱动决策以及人力成本节约,旨在深入剖析其核心优势和对企业的重要意义。一、自动化处理AI智能呼叫中心通过引入自然语言处理(NLP)、机器学习和自动化技术,使得呼叫中心的处理过程更加高效和准确,
    发表于 09-20 17:53

    【KV260视觉入门套件试用体验】5、简单几步体验Vitis AI

    Vitis AI 是Vitis 统一软件平台的重要组件,Vitis AI 开发环境是一个专门的开发环境,用于 AMD 嵌入式平台、Alveo 加速卡或云端 FPGA 实例上
    发表于 09-18 21:54

    AIXilinx如何加速暗物质搜索

    电子发烧友网站提供《AIXilinx如何加速暗物质搜索.pdf》资料免费下载
    发表于 09-15 14:19 1次下载
    <b class='flag-5'>AI</b>和<b class='flag-5'>Xilinx</b>如何<b class='flag-5'>加速</b>暗物质搜索

    STM32通过NB-IoT连接阿里IOT平台

    NB-IoT技术介绍 整体框架结构 • 硬件连接注意事项 • DEMO运行效果 • 阿里物联网平台创建并配置产品 • 平台创建
    发表于 09-11 07:04

    【KV260视觉入门套件试用体验】Vitis AI 初次体验

    赛灵思硬件平台上加速 AI 推断,包括边缘器件和 Alveo™ 加速器卡。此环境由经过最优化的 IP 核、工具、库、模型和设计示例组成。其设计以高效和易用为核心,旨在通过赛灵思 SoC
    发表于 09-10 13:15

    【书籍评测活动NO.18】 AI加速器架构设计与实现

    加速器架构设计与实现》 主要内容本书是一本讲解NPU硬件架构设计与技术实现的著作。作者将自己CPU、GPU和NPU领域15年的软硬件工作经验融会贯通,将四代NPU架构设计经验融为一体,将端侧和
    发表于 07-28 10:50

    AI视觉检测工业领域的应用

    、判断和检测生产线上的各种产品,保证产品的质量和一致性。与传统的视觉检测方法相比,工业AI视觉检测系统具有如下几个显著优点: 1.高效性:工业AI视觉检测系统可以实现自动化检测,大大提高了生产效率
    发表于 06-15 16:21

    i.MX93 EVKCM上的EthosU NPU上推断AI模型时遇到错误怎么解决?

    尝试 i.MX93 EVKCM 上的 EthosU NPU 上推断 AI 模型时遇到错误。 使用的 BSP:Linux imx93evk 6.1.1+g29549c7073bf 首先,我从
    发表于 06-05 11:36

    阿里组件的底层HAL TCP相关接口是不是有问题?

    使能AT组件,选择EC200S连接阿里,出现错误,一直解析不出来地址,换的AIR720也是这样,阿里组件的底层HAL TCP相关接口是不是有问题bug?
    发表于 05-05 14:41