0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何破解两把“剪刀差”加速AI落地

YCqV_FPGA_EETre 来源:fqj 2019-04-28 17:18 次阅读

“深化大数据、人工智能等研发应用,培育新一代信息技术、高端装备、生物医药、新能源汽车、新材料等新兴产业集群,壮大数字经济。”,“打造工业互联网平台,拓展“智能+”,为制造业转型升级赋能。”……刚闭幕不久的中国两会上,人工智能(AI)连续第三年被写入政府工作报告中,并首次将人工智能衍生为“智能+”的概念。作为国家战略的人工智能将加速与产业融合,为经济结构优化升级发挥重要作用。

在近日举办的第八届EEVIA年度中国ICT媒体论坛暨2019产业和技术展望研讨会上,人工智能也是其中的一个重要主题。自适应和智能计算的全球领先企业赛灵思公司人工智能市场总监刘竞秀在“FPGA — 人工智能计算的加速引擎”的主题演讲中开场就对“智能+”概念作出了通俗的诠释:“AI的本质就是高性能计算,就像电力一样是一项通用能力,是能对所有行业进行产业升级以及产品迭代起促进作用的存在。”

刘竞秀:AI的本质就是算力,是像电力一样的一项通用能力

破解两把“剪刀差”的掣肘,关键“方法论”是FPGA

对人工智能落地速度的表现刘竞秀似乎并不满意,他认为当前顶多应该算是“智能服务”的时代,而不是真正人工智能的时代。他将当前的语音人机对话、智能视频应用等落地项目认为是比较初期的智能应用,“例如,人机对话可以用于最基本的生活服务,但很难真正对话超过20句,后面基本上是尬聊。”与产业和媒体关注热度相比,人工智能这几年真正落地的速度有点慢,刘竞秀给出了两个剪刀差阻碍发展的关键判断。

首先是海量的数据和计算芯片所能够提供的处理能力之间的“剪刀差”,主要表现在受限于摩尔定律,传统芯片算力的进步已经远远跟不上爆炸性增长的数据对算力的需求;其次是芯片开发的长周期和快速迭代的市场和技术发展之间的“剪刀差”,传统芯片开发的完整的流程通常长达18~24个月,然而当前的AI项目经常需要几个月就提出解决方案,从而抢占市场。按照过去的芯片漫长的研发流片流程,当芯片出货时市场需求可能已经发生了根本的改变。

异构架构是普适智能时代加速新工作负载的趋势

另外一个不争的事实是,目前AI芯片已经发展到需要采用28纳米甚至16纳米制造工艺,倘若AI算力的需求全靠工艺的迭代,所需的资金投入和风险都是一般中小企业或创新创业企业难以承受的,而且鉴于时间窗口问题,几乎没有企业愿意或有实力在这块市场进行尝试。“因此具备可编程性且灵活多变的FPGA便成了最好的选择。人工智能创新企业可以将其核心研发资源聚焦在特定领域(算法和框架方面)和应用上,从这些层面来创造更多的价值。”刘竞秀指出。

常见的AI落地应用场景

ACAP让AI“飞起来”,首个自适应计算平台再加速

在赛灵思发明FPGA以来的35年中,这种可编程逻辑器件凭借性能、上市时间、成本、稳定性和长期维护方面的优势,在通信、医疗、工控和安防等领域均拥有了无法取代的一席之地。然而,也是需要和传统处理器“分庭抗礼”的一席之地。但最近几年,由于云计算、高性能计算和人工智能的兴起,拥有先天优势的FPGA有望开始“独领风骚”的时代。

按赛灵思财报显示的数据,FPGA在人工智能领域强大的优势和发展前景,以及赛灵思为此历经数年推动的公司转型, 让赛灵思在过去三年内股价增长近三倍。从单纯的FPGA到集成DSP、内存,到28nm集成Arm以及RFSoC的推出,赛灵思一直都是在用创新技术驱动应用创新,显然赛灵思的前瞻性战略布局并不会满足于收割在人工智能时代FPGA的优势“老本”,特别是总裁兼CEO Victor Peng上任以来更是在人工智能领域动作频频,以数据中心优先、加速主流市场的增长和驱动灵活应变的计算三大战略更加清晰化市场布局,其ACAP(自适应计算加速平台)的全新品类的推出为扩大人工智能产业优势奠定了关键伏笔。

作为高度集成的多核异构计算平台,ACAP被媒体称为赛灵思面向下一点计算“蝶变”的利器,是赛灵思器件家族的新物种。为打造ACAP,赛灵思投入上千工程师,历经五年研发,投资逾10亿美元。其核心是新一代FPGA架构,能根据各种应用与工作负载的需求从硬件层对其进行灵活修改。ACAP的灵活应变能力可在工作过程中进行动态调节,它的功能将远超FPGA的极限。在本次论坛上,刘竞秀也对ACAP第一款产品Versal做了阐释:“顾名思义,Versal等于various(各种不同的、各种各样的)+ Universal (通用的,万能的) , 可以支持所有的开发者的各种应用。这是一款完全支持软件编程的异构计算平台,可将标量引擎、自适应引擎和智能引擎相结合,实现显著的性能提升,其速度超过当前最高速的 FPGA 20 倍、比当今最快的 CPU 实现快 100 倍。”

Versal ACAP自适应计算加速平台

Versal系列产品均基于台积电最新的7nm FinFET工艺,是第一个将软件可编程性与特定领域硬件加速和灵活应变能力完美结合的平台。该平***特的架构针对云端、网络无线通信乃至边缘计算和端计算等不同市场的众多应用,提供了独特的可扩展性和AI推断功能,将为所有开发者开发新应用开启一个最新且最快速的创新时代。赛灵思已经发布了Versal基础系列和Versal AI核心系列,Versal旗舰系列、AI Edge以及Versal HBM系列将在未来陆续发布。

从硬件平台到算法模型,完整工具链让AI轻松落地

人工智能的爆热与庞大的市场前景为全球半导体市场注入了“兴奋剂”,也为几乎所有的半导体公司所觊觎。目前,市场上已不断有各种新的处理器产品方案发布。“把芯片本身做出来不难,但如果没有足够高性能的软件、生态环境、工具链以及各种参考应用,应用落地将需要花费更长的时间。”刘竞秀表示。对于赛灵思,丰富的FPGA传统芯片组合以及创新的ACAP平台为AI落地提供了众多选择。“对于客户AI开发而言,传统的解决方案提供的支持还远远不够,赛灵思为客户提供了更多的不同层次的支持,除了底层硬件、各种IP以及软件,还提供了应用层各种神经网络模型。”刘竞秀指出。赛灵思公司拥有非常丰富的神经网络模型库。据悉,仅视觉相关的神经网络模型就超过70种。随着在AI市场的快速崛起,赛灵思正在从传统的芯片提供商向平台方案提供商转变。

赛灵思在人工智能/边缘/嵌入式和云端/数据中心总体解决方案

据刘竞秀透露,在收购深鉴科技后,深鉴科技上百人的研发团队继续专注在赛灵思DNNDK(深度神经网络开发套件)的研发上。DNNDK面向AI异构计算平台深度学习处理器DPU (深度学习处理器单元),可支持神经网络推理阶段模型压缩、编译优化和高效运行时支持的不同功能需求,为DPU平台各种深度学习应用开发和部署提供一套高效全栈式解决方案,实现从深度学习算法到DPU硬件平台的高效映射,为DPU从移动端到数据中心端各类应用提供统一的开发工具包和编程接口

DNNDK在极大降低DPU平台深度学习应用开发门槛和部署难度的同时,还能够显著加速AI产品从开发到面市的进程。“赛灵思在方案底层定义了高效的指令集和IP,结合成套的工具和SDK为客户提供的接口,客户甚至不需要写任何一行代码,只需要把我们IP资源调用起来,就可以支持不同行业不同场景的应用。”刘竞秀表示。赛灵思通过打造通用的处理器平台和完善的工具集,努力为客户提供卓越的高效率开发体验。

赛灵思边缘计算人工智能解决方案

人工智能在具体应用场景的落地是一个复杂的开发过程。据悉,传统处理器开发周期可以达到三至六个月,甚至一年都是常见的。“用我们现有的方案,最快几个小时就可以把新的网络部署在硬件上,快速地将系统运行起来。”刘竞秀强调。速度对当前的人工智能创业公司和合作伙伴而言是最重要的考虑要素之一,通过快速实现原型机,从而尽早去实现真正的场景性能、功能迭代和数据收集,才能将产品比别人更快地推向市场。

赛灵思人工智能视频分析模型库

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算
    +关注

    关注

    2

    文章

    431

    浏览量

    38479
  • 人工智能
    +关注

    关注

    1776

    文章

    43871

    浏览量

    230627

原文标题:如何破解两把“剪刀差”加速AI落地?Xilinx给出了答案

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    电子发烧友网报道(文/黄晶晶)在嵌入式领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI 加速
    的头像 发表于 04-16 09:10 2311次阅读
    Arm推动生成式<b class='flag-5'>AI</b><b class='flag-5'>落地</b>边缘!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer 架构,性能提升四倍

    NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

    本案例介绍了 NVIDIA 在加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域,通过学习人类思维方式,能快速挖掘海量内容,满足不同需求。
    的头像 发表于 03-29 15:28 276次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    ,你可以它想象成一个专门用来加速AI计算的“厨师”。 input wire clk, reset, input clk是时钟信号,就像是我们大脑的脉冲,告诉“厨师”什么时候该开始工作
    发表于 02-12 16:18

    AI大模型在端侧加速落地已成必然趋势,芯片厂商提前布局!

    普遍认为,2024年AI大模型在商业应用会有极大突破。   “AI大模型在端侧的加速落地已成必然趋势。”在星宸科技上周举办的2023开发者大会暨产品发布会上,该公司董事长&总经理林永育
    的头像 发表于 12-29 00:47 1474次阅读
    <b class='flag-5'>AI</b>大模型在端侧<b class='flag-5'>加速</b><b class='flag-5'>落地</b>已成必然趋势,芯片厂商提前布局!

    安谋科技赵永超:生成式AI加速落地,行业应用创新从“芯”突破

    生成式AI的发展机遇,以及企业要如何面对生成式AI落地难题。   随着ChatGPT等生成式AI的横空出世,为各行各业带来了新的驱动力。而如何利用好生成式
    的头像 发表于 12-26 14:32 692次阅读
    安谋科技赵永超:生成式<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>落地</b>,行业应用创新从“芯”突破

    瞬变对AI加速卡供电的影响

    图形处理单元(GPU)、张量处理单元(TPU)和其他类型的专用集成电路(ASIC)通过提供并行处理能力来实现高性能计算,以满足加速人工智能(AI)训练和推理工作负载的需求 。 AI需要大量
    的头像 发表于 12-01 18:10 208次阅读
    瞬变对<b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡供电的影响

    基于紫光同创FPGA的图像采集及AI加速(盘古50K开发板)

    基于紫光同创FPGA的图像采集及AI加速(盘古50K开发板)
    发表于 11-03 11:02

    基于紫光同创FPGA的多路视频采集与AI轻量化加速的实时目标检测系统

    基于紫光同创FPGA的多路视频采集与AI轻量化加速的实时目标检测系统#2023集创赛#紫光同创#小眼睛科技助力紫光同创高校生态建设@小眼睛科技 获奖作品展示:华南理工大学+CR8_Pro队
    发表于 11-02 17:51

    签了!英特尔与联想、爱奇艺引领加速AI PC落地

    10月31日下午,英特尔公司、联想集团、爱奇艺三方备忘合作发布会在北京举行。三家企业签署合作备忘录,旨在携手加速AI变革在应用端的落地,为用户带来全新的AI高级智能化体验。此次签署备忘
    的头像 发表于 11-01 14:06 245次阅读
    签了!英特尔与联想、爱奇艺引领<b class='flag-5'>加速</b><b class='flag-5'>AI</b> PC<b class='flag-5'>落地</b>

    AI加速器架构设计与实现》+第2章的阅读概括

    。感兴趣的话可以好好看看。 2.4和2.5小节分别介绍了卷积顺序的选择和池化模块的设计。这节的介绍也很详细,图片也很多。 阅读感受 整本书里面,不仅有文字说明,还有大量图片的配合,有内容的深度,也有图片的直观具体。对于想了解AI加速
    发表于 09-17 16:39

    AI加速器架构设计与实现》+第一章卷积神经网络观后感

    AI加速器架构设计与实现》+第一章卷积神经网络观感    在本书的引言中也提到“一图胜千言”,读完第一章节后,对其进行了一些归纳(如图1),第一章对常见的神经网络结构进行了介绍,举例了一些结构
    发表于 09-11 20:34

    AI:机械手石头剪刀

    VISUAL&AI人工智能正在占据越来越多的应用和生活场景,例如图像检测和分类,翻译和推荐系统等等。基于机器学习技术的应用数量庞大且还在不断增长。采用Enclustra(瑞苏盈科)结合
    的头像 发表于 09-09 08:12 783次阅读
    <b class='flag-5'>AI</b>:机械手石头<b class='flag-5'>剪刀</b>布

    【书籍评测活动NO.18】 AI加速器架构设计与实现

    经验总结图解NPU算法、架构与实现,从零设计产品级加速器当前,ChatGPT和自动驾驶等技术正在为人类社会带来巨大的生产力变革,其中基于深度学习和增强学习的AI计算扮演着至关重要的角色。新的计算范式需要
    发表于 07-28 10:50

    AI边缘计算盒子是如何推动边缘AI应用落地

    AI边缘计算盒子(AI Edge Computing Box)是一种集成了边缘计算和AI算法处理能力的设备,可以用于推动边缘AI应用的落地
    的头像 发表于 05-26 14:08 698次阅读