0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思推出了业界首款自适应计算加速平台Versal和加速器Alveo

佐思汽车研究 来源:未知 作者:李倩 2018-10-23 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

10月16日,XDF(赛灵思开发者大会)在北京国际饭店举行。作为业界最权威、最具深度的FPGA交流大会之一,Xilinx把行业最顶尖的FPGA专家和企业汇聚一堂,集思广益,分享和交流FPGA产品开发经验与应用方案。

Xilinx CEOVictor Peng 、华为IT智能计算业务副总裁张小华、阿里云FPGA异构计算研发总监张振祥等业内领袖出席。同时,在会上,赛灵思推出了业界首款自适应计算加速平台Versal和加速器Alveo。

作为Xilinx在中国智能汽车电子领域唯一的Certified member,深圳市自行科技有限公司(简称:自行科技)受邀参加,公司联合创始人兼CTO谌璟博士在现场分享了“基于FPGA的计算机视觉系统设计与开发”的主题演讲。谌璟博士结合其多年的深度学习与FPGA开发经验,从性能、成本、开发难度等多个维度出发,提出一套系统化的FPGA深度神经网络优化流程。

图:自行科技联合创始人兼CTO谌璟博士做主题演讲

谌博认为,CNN与FPGA的结合可以组合利用多种算法模块,充分发挥FPGA在计算速度、功耗、成本等方面的优势,降低开发难度与周期,减少开发成本。但是CNN中存在大量冗余计算,因此如何在FPGA中实现CNN加速设计就尤为重要。

图:谌璟博士演讲获得现场嘉宾观众好评

自行科技通过多年CNN与FPGA自主研发经验,开发出业内领先性价比的FPGA加速设计方案。会中,她表示,FPGA加速设计需要算法工程师和FPGA工程师共同参与。

一方面,通过剪枝压缩、权值压缩等方法对网络压缩算法进行优化,以减少网络冗余计算,释放可用资源。例如,我们可以仅仅将少数“重要”的卷积核量化为8bit权值,其余卷积核用1bit权值表示,构造混合精度网络,在确保网络检测性能的基础上大幅度提高计算效率。

另一方面,不同的FPGA架构需要适配对应的CNN网络结构,因此需要有针对性地进行并行化和结构化设计,让计算模块得到充分利用,避免大量计算资源闲置。同时,在进行网络设计时还要充分利用FPGA片内资源,避免DSP计算资源与逻辑资源的浪费。

以SSD网络为例,在不考虑其他操作带来的时延(DDR时延、FSM状态转移时延~等)的情况下,Xilinx zynq7020在CNN计算帧率最高可达5.7fps;但是,自行科技通过权值压缩、并行化设计等CNN网络加速设计和算法优化后,计算帧率提升了4-5倍,大大提高了芯片的运行效率。

最后,谌博总结到:“FPGA与CNN的结合具备广泛的应用前景,但是在开发的过程中也需要我们不断克服困难和挑战。当前FPGA平台技术与工具不断迭代更新,这就需要我们时刻关注世界最前沿的技术。今天我非常高兴在现场见证了业界首款自适应计算加速平台Versal ACAP以及新一代FPGA加速器卡Alveo。这不仅可以加快公司软硬件迭代创新进程,还为我们探索更优秀的FPGA加速方案提供了思路。未来,随着CNN的计算量不断上升,数据吞吐量也会显著增大,这就需要不断提高FPGA片内BRAM资源利用效率,深入研究CNN模型压缩算法,优化基于FPGA的CNN框架,这也需要行业共同的努力!”

目前,该方案已经成功应用于公司的三大产品:前向ADAS系统、驾驶员监控(DMS)系统和智能环视影像系统,产品都已顺利实现量产。基于FPGA平台与CNN算法的深度结合,自行科技率先开发出国内首款基于深度学习技术的驾驶员监控(DMS)系统,打造出业内功能最全面、性价比最高的驾驶员监控(DMS)系统,成为国内驾驶员监控系统标杆企业。

除此之外,自行科技前向ADAS系统与智能环视影像系统以其可靠的目标检测准确性和语义分割精度获得国内众多传统车厂(乘用车与商用车)、新能源和互联网造车公司和Tier1汽车零部件供应商的高度认可。相信随着FPGA开发技术的不断成熟,CNN加速设计将获得更广泛的应用。

更多自行科技的 ADAS解决方案信息:www.autocruis.com

附:赛灵思发布7nm 自适应计算加速平台Versal及新一代FPGA加速器Alveo

2018年10月16日,FPGA大厂赛灵思(Xilinx)在北京召开了一年一度的“Xilinx开发者大会 ”(XDF) 。在本次会议上,赛灵思发布了全球首款自适应计算加速平台 (Adaptive Compute Acceleration Platform ,ACAP)芯片系列Versal。与此同时,赛灵思还针对云端和本地数据中心市场还发布了一款功能强大的加速器卡——Alveo。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40305
  • 赛灵思
    +关注

    关注

    33

    文章

    1798

    浏览量

    133743
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124748

原文标题:自行科技CTO谌璟博士出席赛灵思开发者大会,推出FPGA CNN加速设计方案

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD Versal Gen 2开发实战进阶工坊系列活动即将举办

    在人工智能与边缘计算深度融合的当下,如何用新一代自适应计算技术实现系统高效加速,已经成为产品落地与技术升级的核心。为了帮大家快速掌握硬核开发能力,AMD 分别联手 AVNET 和 COMTECH
    的头像 发表于 04-15 11:37 516次阅读

    选择AMD Alveo V80加速卡的五大理由

    V80 是一用途高度多样化的加速卡,业已应用于高性能计算、金融科技、数据分析、传感处理、网络、存储等众多市场,能利用 AMD Versal
    的头像 发表于 04-10 14:59 458次阅读

    如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始实现中的一些功能?

    )。 如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始实现中的一些功能。 Example: I do not want to call arm_mat_trans_q15 powerquad
    发表于 04-03 06:37

    第二代AMD VERSAL AI EDGE系列全面赋能汽车ADAS系统

    选择 AMD 自适应 SoC 和 FPGA 第二代 AMD Versal AI Edge 系列自适应 SoC 带来一种高性能单芯片解决方案,为自动驾驶赋能助力。该系列器件配备用于 ISP 等功能
    的头像 发表于 03-27 16:30 1065次阅读
    第二代AMD <b class='flag-5'>VERSAL</b> AI EDGE系列全面赋能汽车ADAS系统

    AMD Versal自适应SoC中eMMC烧录/启动调试检查表(上)

    本篇博文提供了有关 AMD Versal 自适应 SoC 中 eMMC 烧录和启动设置的技巧和指南。它还可用于调试 eMMC 烧录/启动失败。提交服务申请个案前,应先复查以下检查表。
    的头像 发表于 03-09 10:24 2113次阅读
    AMD <b class='flag-5'>Versal</b><b class='flag-5'>自适应</b>SoC中eMMC烧录/启动调试检查表(上)

    AMD Alveo MA35D加速器:开启大规模交互式流媒体新时代

    AMD Alveo MA35D加速器:开启大规模交互式流媒体新时代 在当今全球视频市场被直播主导的背景下,低延迟应用不断涌现,对基础设施和视频处理技术的成本结构及部署策略产生了深远影响。AMD推出
    的头像 发表于 12-15 14:35 643次阅读

    工业级-专业液晶图形显示加速器RA8889ML3N简介+显示方案选型参考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 编辑 专业液晶图形显示加速器能够有效减少对MCU运算资源的占用,对于只需普通单片机运算资源的仪器仪表来说,专业图形显示加速器
    发表于 11-14 16:03

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 1129次阅读
    边缘<b class='flag-5'>计算</b>中的AI<b class='flag-5'>加速器</b>类型与应用

    AMD Versal自适应SoC内置自校准的工作原理

    本文提供有关 AMD Versal 自适应 SoC 内置自校准 (BISC) 工作方式的详细信息。此外还详述了 Versal 的异步模式及其对 BISC 的影响。
    的头像 发表于 10-21 08:18 4521次阅读

    高压放大器驱动:基于FPGA的SPGD自适应光学控制平台的探索

    了整个系统的模块组成及功能框图,并对设计的方案进行可行性分析。 测试设备:高压放大器 、函数传感、SPGD控制、波前校正等。 实验过程: 图1:自适应光学系统实验
    的头像 发表于 10-11 17:48 1036次阅读
    高压放大器驱动:基于FPGA的SPGD<b class='flag-5'>自适应</b>光学控制<b class='flag-5'>平台</b>的探索

    创客总部加入MathWorks加速器计划

    全球领先的数学计算软件开发商 MathWorks 日前宣布,创客总部已加入 MathWorks 加速器计划。作为中关村科创孵化,创客总部致力于为人工智能创业企业、高校院所技术精英搭建推动与实体经济
    的头像 发表于 08-22 10:00 1465次阅读

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上实现 PC 级别的 AI 图形性能,为未来的端侧 AI 创新奠定基础 神经超级采样是 Arm 神经技术的首
    的头像 发表于 08-14 17:59 2997次阅读

    Microchip推出Adaptec® SmartRAID 4300 系列加速器 提供安全的可扩展 NVMe® RAID 存储解决方案

    Technology Inc.(微芯科技公司)推出 Adaptec ®  SmartRAID 4300 系列 NVMe® RAID 存储加速器。这是一功能丰富又安全的支持RAID的高性能软件定义存储(SDS)解决方案
    的头像 发表于 08-06 16:31 1.9w次阅读
    Microchip<b class='flag-5'>推出</b>Adaptec® SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可扩展 NVMe® RAID 存储解决方案

    粒子加速器 —— 科技前沿的核心装置

    、生命科学等多学科交叉的基础研究平台,广泛应用于医疗、工业、辐照加工、环保等诸多领域。典型的粒子加速器主要由粒子源、真空加速室、束流导引与聚焦系统、束流输送与分析系统等
    的头像 发表于 06-19 12:05 4454次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    Versal 600G DCMAC Subsystem LogiCORE IP产品指南

    AMD 自适应计算文档按一组标准设计进程进行组织,以便帮助您查找当前开发任务相关的内容。您可以在设计中心页面上访问 AMD Versal 自适应 SoC 设计进程。您还可以使用设计流程助手来更深入了解设计流程,并找到特定于预期设
    的头像 发表于 06-03 14:25 1033次阅读
    <b class='flag-5'>Versal</b> 600G DCMAC Subsystem LogiCORE IP产品指南