0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3D视觉工坊

文章:432 被阅读:117.6w 粉丝数:28 关注数:0 点赞数:3

广告

一种基于自然语言的轨迹修正方法

本研究提出了ExTraCT框架,利用自然语言进行轨迹校正。该框架结合了大型语言模型(LLMs)用于自....
的头像 3D视觉工坊 发表于 01-19 10:45 1493次阅读
一种基于自然语言的轨迹修正方法

标注神器!AAAI'24最新:第一个交互式3D目标检测器!

考虑到3D点云的稀疏性质,iDet3D设计了负点击模拟 (NCS),通过减少误报预测来提高准确性。还....
的头像 3D视觉工坊 发表于 01-16 16:08 1292次阅读
标注神器!AAAI'24最新:第一个交互式3D目标检测器!

新势力第一车企诞生

另外,之前被网友调侃是“和谐号”车头的理想MEGA也将于3月1日正式发布,比原定发布时间推迟了2个多....
的头像 3D视觉工坊 发表于 01-14 10:00 1919次阅读
新势力第一车企诞生

顶刊TPAMI最全综述!深入自动驾驶BEV感知的魔力!

BEV感知的主要工作。在输入模态下," L "为LiDAR," SC "为单相机," MC "为多相....
的头像 3D视觉工坊 发表于 01-14 09:53 2265次阅读
顶刊TPAMI最全综述!深入自动驾驶BEV感知的魔力!

自动驾驶领域中,什么是BEV?什么是Occupancy?

BEV是Bird's Eye View 的缩写,意为鸟瞰视图。在自动驾驶领域,BEV 是指....
的头像 3D视觉工坊 发表于 01-13 09:41 4602次阅读
自动驾驶领域中,什么是BEV?什么是Occupancy?

基于NID-SLAM对神经SLAM在动态环境下的性能提升

TUM数据集上相机跟踪结果,评价指标是ATE RMSE [ m ] (↓),表示相关文献未提及这个数....
的头像 3D视觉工坊 发表于 01-12 11:24 956次阅读
基于NID-SLAM对神经SLAM在动态环境下的性能提升

如何用3D Occupancy处理遮挡问题下的图像匹配?

图像匹配是各种视觉应用中基本且关键的任务,如同时定位与地图构建( Simultaneous Loca....
的头像 3D视觉工坊 发表于 01-06 10:24 1527次阅读
如何用3D Occupancy处理遮挡问题下的图像匹配?

基于神经辐射场的自监督多相机占用预测

本研究提出了一种自监督的多摄相机3D占据预测方法,名为OccNeRF。该方法旨在解决无界场景的建模问....
的头像 3D视觉工坊 发表于 01-02 14:53 1191次阅读
基于神经辐射场的自监督多相机占用预测

PatchMatch MVS求解器中深度估计的挑战性问题

本文提出了一种全新的学习型PatchMatch MVS框架,DS-PMNet,并嵌入了DeformS....
的头像 3D视觉工坊 发表于 01-02 09:25 1802次阅读
PatchMatch MVS求解器中深度估计的挑战性问题

一种新的分割模型Stable-SAM

SAM、HQ-SAM、Stable-SAM在提供次优提示时的性能比较,Stable-SAM明显优于其....
的头像 3D视觉工坊 发表于 12-29 14:35 1726次阅读
一种新的分割模型Stable-SAM

手持RGB-D传感器广泛应用的情况

DisCo方法:提出了一种基于扩散的跨模态形状重建方法。该方法利用三平面扩散模型,结合部分点云和多视....
的头像 3D视觉工坊 发表于 12-26 16:44 1218次阅读
手持RGB-D传感器广泛应用的情况

NeRF何去何从?GS SLAM到底哪家强?来看看最新的开源方案!

Gaussian-SLAM提出了用于seeding和优化Gaussian splats的新策略,以将....
的头像 3D视觉工坊 发表于 12-26 16:38 2291次阅读
NeRF何去何从?GS SLAM到底哪家强?来看看最新的开源方案!

阵列相机三维重建系统,谁才是顶流?

该标定过程仅需10分钟,能够自动完成所有校准步骤,无需人工干预。通过该标定解决方案,相机模组能够实现....
的头像 3D视觉工坊 发表于 12-19 15:14 3107次阅读

一个用于6D姿态估计和跟踪的统一基础模型

今天笔者将为大家分享NVIDIA的最新开源方案FoundationPose,是一个用于 6D 姿态估....
的头像 3D视觉工坊 发表于 12-19 09:58 2501次阅读
一个用于6D姿态估计和跟踪的统一基础模型

基于事件的视觉惯性速度计

这个速度计框架以事件数据和IMU测量作为输入。图中所示分别为:(a) 无人机在狭窄走廊中进行攻击行为....
的头像 3D视觉工坊 发表于 12-18 15:43 1135次阅读
基于事件的视觉惯性速度计

单目深度估计开源方案分享

可以看一下单目深度估计效果,这个深度图的分辨率是真的高,物体边界分割的非常干净!这里也推荐工坊推出的....
的头像 3D视觉工坊 发表于 12-17 10:01 1792次阅读
单目深度估计开源方案分享

一种通过视图合成增强预训练的2D扩散模型的可扩展技术

现有的3D物体检测方法通常需要使用完全注释的数据进行训练,而使用预训练的语义特征可以带来一些优势。
的头像 3D视觉工坊 发表于 12-14 10:00 1958次阅读
一种通过视图合成增强预训练的2D扩散模型的可扩展技术

三项SOTA!MasQCLIP:开放词汇通用图像分割新网络

MasQCLIP在开放词汇实例分割、语义分割和全景分割三项任务上均实现了SOTA,涨点非常明显。这里....
的头像 3D视觉工坊 发表于 12-12 11:23 1867次阅读
三项SOTA!MasQCLIP:开放词汇通用图像分割新网络

放下你的PhotoShop!无限图像编辑已开源!

我们知道扩散模型生成图像是通过反转采样来进行的,重点是识别噪声。LEDITS++从DDPM反演中提取....
的头像 3D视觉工坊 发表于 12-10 10:09 1665次阅读
放下你的PhotoShop!无限图像编辑已开源!

逼真到头发丝,光线可调,Meta推出实时3D头像合成方法

2021 年,Facebook 将「元宇宙(metaverse)」作为公司主营业务,并将公司名称更改....
的头像 3D视觉工坊 发表于 12-10 10:02 1576次阅读
逼真到头发丝,光线可调,Meta推出实时3D头像合成方法

深度学习神器DYnet++:轻松驾驭复杂自由曲面,3D测量无难度!

利用深度学习网络模型DYnet++从单个复合图案中获取相位信息。为了训练深度学习模型,作者使用了一个....
的头像 3D视觉工坊 发表于 12-04 15:29 1521次阅读
深度学习神器DYnet++:轻松驾驭复杂自由曲面,3D测量无难度!

基于深度学习的三维重建技术

多视图立体几何(Multi-View Stereo,MVS)是计算机视觉中重要的研究领域,也是迈入三....
的头像 3D视觉工坊 发表于 12-04 10:08 1707次阅读
基于深度学习的三维重建技术

怎么去处理视觉SLAM长期定位中的外观变化和轨迹漂移呢?

服务机器人、巡检机器人、自动驾驶车辆等SLAM应用,需要进行长时间的定位和导航,但是可能会遇到很多光....
的头像 3D视觉工坊 发表于 12-04 10:01 1865次阅读
怎么去处理视觉SLAM长期定位中的外观变化和轨迹漂移呢?

一种基于RGB-D图像序列的协同隐式神经同步定位与建图(SLAM)系统

提出了一种基于RGB-D图像序列的协同隐式神经同步定位与建图(SLAM)系统,该系统由完整的前端和后....
的头像 3D视觉工坊 发表于 11-29 10:35 1739次阅读
一种基于RGB-D图像序列的协同隐式神经同步定位与建图(SLAM)系统

香港大学最新提出!实现超现实的人类图像生成:HyperHuman

最后,为了进一步提高视觉质量,我们提出了一种结构引导细化器来组合预测条件,以更详细地生成更高分辨率。....
的头像 3D视觉工坊 发表于 11-27 16:03 1545次阅读
香港大学最新提出!实现超现实的人类图像生成:HyperHuman

基于RGM的鲁棒且通用的特征匹配

在一对图像中寻找匹配的像素是具有各种应用的基本计算机视觉任务。由于光流估计和局部特征匹配等不同任务的....
的头像 3D视觉工坊 发表于 11-27 11:32 1601次阅读
基于RGM的鲁棒且通用的特征匹配

英伟达联合多伦多大学最新提出用于高效神经辐照场渲染的自适应外壳!

分配样本数量:根据场景的不同区域,分配不同数量的样本来表示地面真实外观。对于复杂的模糊表面,需要更多....
的头像 3D视觉工坊 发表于 11-25 11:49 1657次阅读
英伟达联合多伦多大学最新提出用于高效神经辐照场渲染的自适应外壳!

基于Transformer的可泛化人体表征设计方案

本文在ZJU-MoCap和H36M上进行了泛化性实验,结果如下图所示。主要分为四个setting: ....
的头像 3D视觉工坊 发表于 11-23 11:25 1327次阅读
基于Transformer的可泛化人体表征设计方案

一种在线激光雷达语义分割框架MemorySeg

本文提出了一种在线激光雷达语义分割框架MemorySeg,它利用三维潜在记忆来改进当前帧的预测。传统....
的头像 3D视觉工坊 发表于 11-21 10:48 1437次阅读
一种在线激光雷达语义分割框架MemorySeg

EmerNeRF:全面基于NeRF的自动驾驶仿真框架,无需分割

在自动驾驶中,感知、表示和重建动态场景对于代理程序理解并与其环境进行交互至关重要。
的头像 3D视觉工坊 发表于 11-21 10:23 4651次阅读
EmerNeRF:全面基于NeRF的自动驾驶仿真框架,无需分割