激光雷达的3D成像原理及应用分类
就和人的两个眼睛一样,各种两个摄像头的手机大都会用这种方法来获得深度信息,从而得到三维图像。但深度受....
空间稀疏推理(SSI)加速深度生成模型
生成模型近年来发展迅猛,已经表现出极强的真实感合成能力,在三维重建、AI绘画、音视频创作、可控图像生....
基于结构光的高精度开源三维重建系统
许多面向建筑领域的机器人作业都需要获得高精度的三维表面信息以完成类似于自动水泥抛光汇总石膏喷涂等作业....
基于深度神经网络的多领域实时目标检测算法
基于深度神经网络的目标检测器不断发展,并用于多种应用,每个应用都有自己的一组要求。安全关键型的应用程....
Meta开发AITemplate,大幅简化多GPU后端部署
AITemplate 在 CNN、Transformer 和 Diffusion 模型上都能提供接近....
基于纯Radar的障碍物和可行驶区域检测
作者在BEV二维平面检测和生成Free Space,分别生成的是2D检测框和稠密的占位栅格地图(de....
用于评估不同平台上的定位和建图精度的多传感器校园数据集
结合多个传感器使机器人能够最大限度地感知环境,并增强其对外部干扰的鲁棒性,对机器人导航至关重要。
S3E:用于协作SLAM的大规模多模态数据集
对于内部同步,触发单元周期性地产生脉冲来触发激光雷达、双目摄像机和IMU。值得注意的是,FPGA产生....
基于深度学习的3D分割综述(RGB-D/点云/体素/多目)
数据集对于使用深度学习训练和测试3D分割算法至关重要。然而,私人收集和标注数据集既麻烦又昂贵,因为它....
求一种有效的低光图像增强方案
低光图像是夜晚拍照时极为常见的一种现象。不充分的光照会极大的降低图像的视觉质量,细节损失、低对比度不....
介绍一种模块化多模式架构DeepFusion
作者提出了一种模块化网络架构,用于融合激光雷达、相机和雷达,以实现精确、稳健和远距离的3D物体检测。
用于处理三维点云的深度学习方法的分析
3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每年在各大会议上....
基于视觉传感器的ORB-SLAM系统的学习
视觉SLAM是一种基于视觉传感器的 SLAM 系统,与激光传感器相比,视觉传感器具有成本低、保留环境....
一种使用transformer架构的新型线段描述符
虽然在SLAM和SFM中,特征点已经被广泛研究,但在图像中分布不均匀的特征点可能会导致不稳定和不准确....
VSLAM系统方法的各种特点
近年来,基于视觉的传感器在SLAM系统中显示出显著的性能、精度和效率提升。在这方面,视觉SLAM(V....
介绍一个重要的惯性框架数据集Berkeley DeepDrive Drone
研究自动驾驶车辆在复杂路况下的行为决策具有重要意义,但目前大多数自动驾驶数据集只关注结构化场景,很少....
基于Transformer的越野场景可通行区域检测模型OFF-Net
可通行区域检测对于自动驾驶车辆的环境感知和路径规划至关重要。过去十年基于学习的可通行区域检测算法取得....
基于文本驱动的三维模型风格化方法
来自华南理工大学、香港理工大学、跨维智能、鹏城实验室等机构的研究团队提出了一种基于文本驱动的三维模型....
一个利用GT-SAM的紧耦合激光雷达惯导里程计的框架
LIO-SAM 提出了一个利用GT-SAM的紧耦合激光雷达惯导里程计的框架。实现了高精度、实时的移动....
一种手动校准Livox雷达和相机之间外参的方法
该功能包提供了一个手动校准Livox雷达和相机之间外参的方法,已经在Mid-40,Horizon和T....
基于自动驾驶汽车记录的3D激光扫描的SLAM闭环问题讨论
同时定位和映射(SLAM)是大多数自主系统所需的基本能力。在本文中,我们讨论了基于自动驾驶汽车记录的....
TOIST借助COCO掩码将问题扩展到实例分割问题实现更精细的定位
归功于大规模视觉语言模型,名词指代表达理解模型已经取得了巨大的进展。然而,在像智能服务机器人这样的现....
基于线段的激光雷达单目曲面重建
运动结构(SfM)在缺乏合适的视觉特征的环境中往往无法估计出正确的位姿。在这种情况下,最终的三维网格....
如何以模型和场景为中心的方式控制数据生成
首先,NeRF学习仅基于图像数据和摄像头姿态信息从新视图生成数据。相反,传统的图形学流水线需要目标的....
基于Transform的神经网络结构FlowFormer用于光流量估计
光流估计任务要求输出逐像素位移场f: R2→R2,将源图像的每个二维位置x∈R2 Is映射到目标图像....
第一个大规模点云的自监督预训练MAE算法Voxel-MAE
Voxel-MAE证明了对大规模点云进行基于掩码的自监督预训练学习,来提高无人车的感知性能是可行的。....
Block nerf:可缩放的大型场景神经视图合成
为了在大场景中应用神经辐射场(NeRF)模型,文章提出将大型场景分解为相互重叠的子场景 (block....