0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思推出了自适应计算加速平台Versal和加速器Alveo

Xilinx赛灵思官微 来源:djl 作者:赛灵思 2019-07-26 16:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1XDF(赛灵思开发者大会)在北京国际饭店举行。作为业界最权威、最具深度的FPGA交流大会之一,Xilinx把行业最顶尖的FPGA专家和企业汇聚一堂,集思广益,分享和交流FPGA产品开发经验与应用方案,为业内软硬件开发者与设计者提供独到的见解和灵感。Xilinx CEO Victor Peng 、华为IT智能计算业务副总裁张小华、阿里云FPGA异构计算研发总监张振祥等业内领袖出席。同时,在会上,赛灵思推出了业界首款自适应计算加速平台Versal和加速器Alveo,引爆现场。

作为Xilinx在中国智能汽车电子领域唯一的Certified member,深圳市自行科技有限公司(简称:自行科技)受邀参加,公司联合创始人兼CTO谌璟博士在现场分享了“基于FPGA的计算机视觉系统设计与开发”的主题演讲。谌璟博士结合其多年的深度学习与FPGA开发经验,从性能、成本、开发难度等多个维度出发,提出一套系统化的FPGA深度神经网络优化流程,受到了Xilinx AI及边缘计算产品营销总监Nick与机器学习产品营销高级经理Andy等业内专家的高度赞赏。

图文:自行科技联合创始人兼CTO谌璟博士做主题演讲

谌博认为,CNN与FPGA的结合可以组合利用多种算法模块,充分发挥FPGA在计算速度、功耗、成本等方面的优势,降低开发难度与周期,减少开发成本。但是CNN中存在大量冗余计算,因此如何在FPGA中实现CNN加速设计就尤为重要。

谌璟博士演讲获得现场嘉宾观众一致好评

自行科技通过多年CNN与FPGA自主研发经验,开发出业内最具性价比的FPGA加速设计方案。会中,她表示,FPGA加速设计需要算法工程师和FPGA工程师共同参与。一方面,通过剪枝压缩、权值压缩等方法对网络压缩算法进行优化,以减少网络冗余计算,释放可用资源。例如,我们可以仅仅将少数“重要”的卷积核量化为8bit权值,其余卷积核用1bit权值表示,构造混合精度网络,在确保网络检测性能的基础上大幅度提高计算效率。另一方面,不同的FPGA架构需要适配对应的CNN网络结构,因此需要有针对性地进行并行化和结构化设计,让计算模块得到充分利用,避免大量计算资源闲置。同时,在进行网络设计时还要充分利用FPGA片内资源,避免DSP计算资源与逻辑资源的浪费。

以SSD网络为例,在不考虑其他操作带来的时延(DDR时延、FSM状态转移时延~等)的情况下,Xilinx zynq7020在CNN计算帧率最高可达5.7fps;但是,自行科技通过权值压缩、并行化设计等CNN网络加速设计和算法优化后,计算帧率提升了4-5倍,大大提高了芯片的运行效率,成为了业内低成本高效率FPGA应用典范!

最后,谌博总结到:“FPGA与CNN的结合具备广泛的应用前景,但是在开发的过程中也需要我们不断克服困难和挑战。当前FPGA平台技术与工具不断迭代更新,这就需要我们时刻关注世界最前沿的技术。今天我非常高兴在现场见证了业界首款自适应计算加速平台Versal ACAP以及新一代FPGA加速器卡Alveo。这不仅可以加快公司软硬件迭代创新进程,还为我们探索更优秀的FPGA加速方案提供了思路。未来,随着CNN的计算量不断上升,数据吞吐量也会显著增大,这就需要不断提高FPGA片内BRAM资源利用效率,深入研究CNN模型压缩算法,优化基于FPGA的CNN框架,这也需要行业共同的努力!”

目前,该方案已经成功应用于公司的三大产品:前向ADAS系统、驾驶员监控(DMS)系统和智能环视影像系统,产品都已顺利实现量产。基于FPGA平台与CNN算法的深度结合,自行科技率先开发出国内首款基于深度学习技术的驾驶员监控(DMS)系统,打造出业内功能最全面、性价比最高的驾驶员监控(DMS)系统,成为国内驾驶员监控系统标杆企业。

除此之外,自行科技前向ADAS系统与智能环视影像系统以其可靠的目标检测准确性和语义分割精度获得国内众多传统车厂(乘用车与商用车)、新能源和互联网造车公司和Tier1汽车零部件供应商的高度认可。相信随着FPGA开发技术的不断成熟,CNN加速设计将获得更广泛的应用,让我们拭目以待!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 监控系统
    +关注

    关注

    21

    文章

    4149

    浏览量

    184346
  • 高效率
    +关注

    关注

    0

    文章

    58

    浏览量

    10753
  • 异构计算
    +关注

    关注

    2

    文章

    110

    浏览量

    17024
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业级-专业液晶图形显示加速器RA8889ML3N简介+显示方案选型参考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 编辑 专业液晶图形显示加速器能够有效减少对MCU运算资源的占用,对于只需普通单片机运算资源的仪器仪表来说,专业图形显示加速器
    发表于 11-14 16:03

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 422次阅读
    边缘<b class='flag-5'>计算</b>中的AI<b class='flag-5'>加速器</b>类型与应用

    AMD Versal自适应SoC内置自校准的工作原理

    本文提供有关 AMD Versal 自适应 SoC 内置自校准 (BISC) 工作方式的详细信息。此外还详述了 Versal 的异步模式及其对 BISC 的影响。
    的头像 发表于 10-21 08:18 3849次阅读

    高压放大器驱动:基于FPGA的SPGD自适应光学控制平台的探索

    了整个系统的模块组成及功能框图,并对设计的方案进行可行性分析。 测试设备:高压放大器 、函数传感、SPGD控制、波前校正等。 实验过程: 图1:自适应光学系统实验
    的头像 发表于 10-11 17:48 667次阅读
    高压放大器驱动:基于FPGA的SPGD<b class='flag-5'>自适应</b>光学控制<b class='flag-5'>平台</b>的探索

    创客总部加入MathWorks加速器计划

    全球领先的数学计算软件开发商 MathWorks 日前宣布,创客总部已加入 MathWorks 加速器计划。作为中关村科创孵化,创客总部致力于为人工智能创业企业、高校院所技术精英搭建推动与实体经济
    的头像 发表于 08-22 10:00 828次阅读

    粒子加速器 —— 科技前沿的核心装置

    、生命科学等多学科交叉的基础研究平台,广泛应用于医疗、工业、辐照加工、环保等诸多领域。典型的粒子加速器主要由粒子源、真空加速室、束流导引与聚焦系统、束流输送与分析系统等
    的头像 发表于 06-19 12:05 2532次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    Versal 600G DCMAC Subsystem LogiCORE IP产品指南

    AMD 自适应计算文档按一组标准设计进程进行组织,以便帮助您查找当前开发任务相关的内容。您可以在设计中心页面上访问 AMD Versal 自适应 SoC 设计进程。您还可以使用设计流程助手来更深入了解设计流程,并找到特定于预期设
    的头像 发表于 06-03 14:25 582次阅读
    <b class='flag-5'>Versal</b> 600G DCMAC Subsystem LogiCORE IP产品指南

    第二代AMD Versal Premium系列SoC满足各种CXL应用需求

    第二代 AMD Versal Premium 系列自适应 SoC 是一款多功能且可配置的平台,提供全面的 CXL 3.1 子系统。该系列自适应 SoC 旨在满足从简单到复杂的各种 CX
    的头像 发表于 04-24 14:52 966次阅读
    第二代AMD <b class='flag-5'>Versal</b> Premium系列SoC满足各种CXL应用需求

    小型加速器中子源监测系统解决方案

    检测中的无损探伤,亦或是科研中的材料分析,小型加速器中子源都能提供高效、可靠的解决方案。为了确保中子束流的稳定性、安全性和精准性,对中子特性和加速器束流参数的精确测量至关重要。
    的头像 发表于 03-13 11:19 1145次阅读
    小型<b class='flag-5'>加速器</b>中子源监测系统解决方案

    GPU加速计算平台的优势

    传统的CPU虽然在日常计算任务中表现出色,但在面对大规模并行计算需求时,其性能往往捉襟见肘。而GPU加速计算平台凭借其独特的优势,吸引了行业
    的头像 发表于 02-23 16:16 757次阅读

    消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

    近日,据外媒 videocardz 报道,参考 AMD 最新推出的 AMD - GFX 补丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器设计将有重大变革,其将配备 8
    的头像 发表于 02-05 15:07 1374次阅读

    利用NVIDIA DPF引领DPU加速计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA Blu
    的头像 发表于 01-24 09:29 1272次阅读
    利用NVIDIA DPF引领DPU<b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

    AMD Versal自适应SoC器件Advanced Flow概览(下)

    在 AMD Vivado Design Suite 2024.2 版本中,Advanced Flow 自动为所有 AMD Versal 自适应 SoC 器件启用。请注意,Advanced Flow
    的头像 发表于 01-23 09:33 1340次阅读
    AMD <b class='flag-5'>Versal</b><b class='flag-5'>自适应</b>SoC器件Advanced Flow概览(下)

    AMD Versal自适应SoC器件Advanced Flow概览(上)

    在最新发布的 AMD Vivado Design Suite 2024.2 中,引入的新特性之一是启用了仅适用于 AMD Versal 自适应 SoC 器件的 Advanced Flow 布局布线
    的头像 发表于 01-17 10:09 1166次阅读
    AMD <b class='flag-5'>Versal</b><b class='flag-5'>自适应</b>SoC器件Advanced Flow概览(上)

    AMD Alveo媒体加速产品组合SDK 1.2.1发布

    我们很高兴地宣布AMD Alveo 媒体加速产品组合( AMA )SDK 1.2.1 版本发布,从而进一步扩展 AMD Alveo MA35D 媒体加速卡功能。
    的头像 发表于 12-18 16:01 1035次阅读