0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何学习基于Tansformer的目标检测算法呢?

3D视觉工坊 来源:3D视觉工坊 2023-08-07 16:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

说到纯视觉的自动驾驶方案,大家第一个想到的就是Tesla吧。的确,早在2021年,Tesla就已经实现了纯视觉的BEV检测方案,而且效果非常好。

240e9aa2-32e1-11ee-9e74-dac502259ad0.png

细心的同学可能发现了,这套BEV方案中将相机空间的图像转换到BEV空间的核心组件就是Transformer。

Transformer来源于自然语言处理领域,首先被应用于机器翻译。后来,大家发现它在计算机视觉领域效果也很不错,而且在各大排行榜上碾压CNN网络。

2435d4a0-32e1-11ee-9e74-dac502259ad0.png

目标检测领域中,视觉Transformer不仅可以实现2D检测、3D检测,还可以实现多模态检测,BEV视角下的检测,性能也非常出色。

245b52ac-32e1-11ee-9e74-dac502259ad0.png

因此,掌握Transformer相关知识和工程基础成为了企业招聘算法工程师的一个技能要求点,也是简历上的一个很大的加分项。

然而,想要掌握基于Transformer的目标检测算法,有以下3个难点

理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。

2475f544-32e1-11ee-9e74-dac502259ad0.png

掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。

24a3cd02-32e1-11ee-9e74-dac502259ad0.png2

Transformer代码不易看懂,因为作用机制与CNN有不少差别,所以完全理解代码并实践应用需要花费很大功夫。

24c35ec4-32e1-11ee-9e74-dac502259ad0.png3

那么如何学习基于Tansformer的目标检测算法呢?

实践部分

24d6a84e-32e1-11ee-9e74-dac502259ad0.png24fc84a6-32e1-11ee-9e74-dac502259ad0.png






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47457
  • 自动驾驶
    +关注

    关注

    791

    文章

    14673

    浏览量

    176625
  • Transformer
    +关注

    关注

    0

    文章

    154

    浏览量

    6818

原文标题:Transformer在自动驾驶中的应用前景怎么样?

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    有哪些常见的AI算法可以用于装置数据的异常检测

    在装置数据(如工业设备传感器数据、电子装置运行参数、化工装置工况数据等)的异常检测中,AI 算法的选择需结合数据特点(如 时序性、维度、标注情况 )、检测目标(如实时性、精度、可解释性
    的头像 发表于 09-18 09:27 424次阅读
    有哪些常见的AI<b class='flag-5'>算法</b>可以用于装置数据的异常<b class='flag-5'>检测</b>?

    基于FPGA的SSD目标检测算法设计

    随着人工智能的发展,神经网络正被逐步应用于智能安防、自动驾驶、医疗等各行各业。目标识别作为人工智能的一项重要应用也拥有着巨大的前景,随着深度学习的普及和框架的成熟,卷积神经网络模型的识别精度越来越高
    的头像 发表于 07-10 11:12 2231次阅读
    基于FPGA的SSD<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>设计

    【嘉楠堪智K230开发板试用体验】K230机器视觉相关功能体验

    画图 机器学习模型在通过摄像头获取图像后,经过处理输入后,在输出环节通常还需要进行后处理,例如图像检测应用中,目标位置的框选等。 在K230中提供了画图的功能,可以实现画线段、画矩形、画圆、画箭头
    发表于 07-08 17:25

    基于RK3576开发板的车辆检测算法

    车辆检测是一种基于深度学习的对人进行检测定位的目标检测,能广泛的用于园区管理、交通分析等多种场景,是违停识别、堵车识别、车流统计等多种
    的头像 发表于 05-08 17:34 1273次阅读
    基于RK3576开发板的车辆<b class='flag-5'>检测算法</b>

    基于RK3576开发板的安全帽检测算法

    安全帽佩戴检测是工地、生产安全、安防的重中之重,但人为主观检测的方式时效性差且不能全程监控。AI技术的日渐成熟催生了安全帽佩戴检测方案,成为了监督佩戴安全帽的利器。本安全帽检测算法是一
    的头像 发表于 05-08 16:59 1872次阅读
    基于RK3576开发板的安全帽<b class='flag-5'>检测算法</b>

    基于RK3576开发板的人员检测算法

    展示了RK3576开发板的人员检测算法例程及API说明
    的头像 发表于 05-07 17:33 654次阅读
    基于RK3576开发板的人员<b class='flag-5'>检测算法</b>

    基于RV1126开发板的车辆检测算法开发

    车辆检测是一种基于深度学习的对人进行检测定位的目标检测,能广泛的用于园区管理、交通分析等多种场景,是违停识别、堵车识别、车流统计等多种
    的头像 发表于 04-14 16:00 620次阅读
    基于RV1126开发板的车辆<b class='flag-5'>检测算法</b>开发

    基于RV1126开发板的吸烟检测算法开发

    吸烟检测是一种基于深度学习的对抽烟人群进行检测定位的目标检测,能广泛的用于安防、生产安全、园区管理等多种场景。配合摄像头,实时识别监控区内人
    的头像 发表于 04-14 15:37 573次阅读
    基于RV1126开发板的吸烟<b class='flag-5'>检测算法</b>开发

    基于RV1126开发板的安全帽检测算法开发

    安全帽佩戴检测是工地、生产安全、安防的重中之重,但人为主观检测的方式时效性差且不能全程监控。AI技术的日渐成熟催生了安全帽佩戴检测方案,成为了监督佩戴安全帽的利器。本安全帽检测算法是一
    的头像 发表于 04-14 15:10 663次阅读
    基于RV1126开发板的安全帽<b class='flag-5'>检测算法</b>开发

    基于RV1126开发板的火焰检测算法开发

    火焰检测是一种基于深度学习的对火焰进行检测定位的目标检测。基于大规模火焰数据识别训练,配合摄像头,实时识别监控区内明火情况立刻发出警报,提醒
    的头像 发表于 04-14 14:53 596次阅读
    基于RV1126开发板的火焰<b class='flag-5'>检测算法</b>开发

    基于RV1126开发板的人脸检测算法开发

    在RV1126上开发人脸检测算法组件
    的头像 发表于 04-14 10:19 744次阅读
    基于RV1126开发板的人脸<b class='flag-5'>检测算法</b>开发

    轩辕智驾红外目标检测算法在汽车领域的应用

    在 AI 技术蓬勃发展的当下,目标检测算法取得了重大突破,其中红外目标检测算法更是在汽车行业掀起了波澜壮阔的变革,从根本上重塑着汽车的安全性能、驾驶体验与产业生态。
    的头像 发表于 03-27 15:55 747次阅读

    睿创微纳推出新一代目标检测算法

    随着AI技术的发展,目标检测算法也迎来重大突破。睿创微纳作为热成像领军者,凭借深厚的技术积累与创新能力,结合AI技术推出新一代目标检测算法,以三大核心技术带来AI视觉感知全场景解决方案
    的头像 发表于 03-20 13:49 802次阅读

    采用华为云 Flexus 云服务器 X 实例部署 YOLOv3 算法完成目标检测

    一、前言 1.1 开发需求 这篇文章讲解: 采用华为云最新推出的 Flexus 云服务器 X 实例部署 YOLOv3 算法,完成图像分析、目标检测。 随着计算机视觉技术的飞速发展,深度学习
    的头像 发表于 01-02 12:00 1027次阅读
    采用华为云 Flexus 云服务器 X 实例部署 YOLOv3 <b class='flag-5'>算法</b>完成<b class='flag-5'>目标</b><b class='flag-5'>检测</b>

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    广泛的应用,然而,在移动端工业领域的实际应用中,对目标检测算法提出了更为苛刻的要求:需要实现高速度、高精度、小体积、易部署等特性。为应对这一挑战,百度于2021年末发布了一篇关于移动端性能卓越的实时
    发表于 12-19 14:33