自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5460)
  • 资源 (35)
  • 收藏
  • 关注

转载 CVPR 2025 最佳论文候选 FoundationStereo | 英伟达开源双目深度估计大模型

Bowen Wen(温伯文)是英伟达研究院的高级科学家。他的研究领域包括机器人感知和计算机视觉。近期他专注于大型三维视觉感知和学习基础模型,以促进机器人技术或具身智能的发展。他主导的项目曾在计算机视觉和机器人两大领域的顶会(CVPR 2025, RSS 2022)都获得过最佳论文奖提名。在攻读博士期间,他曾在Google[X]、Meta Reality Labs、Amazon Lab 126和商汤科技担任研究实习生。扫码观看直播,或前往B站搜索3D视觉工坊观看直播。如果您有相关工作需要分享,欢迎联系我们。

2025-05-17 00:02:00 6

转载 2025年,热点3D视觉技术一览!

即可免费领取计算机视觉精品视频与慕尼黑工业大学、巴塞罗那自治大学沉淀多年的计算机视觉课件资料,包括相机标定、立体匹配、三维重建、SLAM、三维点云、缺陷检测、深度估计、四旋翼无人机等。包括3D视觉传感器、3D视觉系统集成设备、缺陷检测设备、SLAM产品、自动驾驶。「计算机视觉工坊」公众号,主要专注3D视觉、计算机视觉算法、SLAM、三维点云处理、三维重建、自动驾驶、图像处理等领域技术干货分享。「3D视觉工坊」公众号,由多位985硕博士共同运营,主要专注3D视觉,包括工业3D视觉、自动驾驶、SLAM算法。

2025-05-16 09:01:32 10

转载 盘点!港大今年开源了哪些SLAM算法?

实时估算曝光时间,适应剧烈光照变化;图片来源:《FAST-LIVO2: Fast, Direct LiDAR-Inertial-Visual Odometry》, IEEE T-RO,2024.图片来源:《FAST-LIVO2: Fast, Direct LiDAR-Inertial-Visual Odometry》, IEEE T-RO,2024.图片来源:《FAST-LIVO2: Fast, Direct LiDAR-Inertial-Visual Odometry》, IEEE T-RO,2024.

2025-05-15 07:08:06 447

转载 深入解析PID控制算法:从理论到实践的完整指南

spike 的英文含义是尖刺,这里指的是当系统运行过程中,突然改变 setpoint 时, PID 的微分部分会因 setpoint 的突然切换而生成一个极大的导数,导致算法输出值 output 将产生一次急剧变化,这就是 spike。PID 是目前最常见的应用于闭环反馈控制系统的算法,三个部分可以只用一个(P,I,D),也可以只用两个(PI,PD),也可以三个一起用(PID),非常灵活。如果提到 ouput,指的是 PID 算法输出,相当于上节中的系统输入 input(t),即加热功率。

2025-05-15 07:08:06 18

转载 是什么魔法?高反射物体三维重建达微米级!

通过对相机拍摄的变形的条纹进行解调,就可以恢复镜面的三维形貌。因此,即使是肉眼无法察觉的微小缺陷,如划痕、凸起、裂纹、凹陷和气泡,都可以被准确检测和定位。而在实际应用层面,将通过实际项目的操作,手把手教授学员复现相位测量偏折术的一整套流程,并指导如何将这些技能应用于个人项目中。这样的课程将为学习者提供全面的学术指导,从理论到实践,让他们能够掌握相位测量偏折术的原理,并在学术界和实际应用中展现出所学的深度和广度。本课程答疑主要在本课程对应的鹅圈子中答疑,学员学习过程中,有任何问题,可以随时在鹅圈子中提问。

2025-05-13 07:03:27 212

转载 TRO‘25 开源 | 无需中间模块!最新端到端的机器人导航方案NeuPAN!任意复杂场景下都能用!

研究方向为机器人自主导航规划。研究聚焦于自主导航系统在复杂场景下的运动控制。担任TRO, RA-L, IROS, ICRA等学术期刊及会议审稿人。扫码观看直播,或前往B站搜索3D视觉工坊观看直播。NeuPAN-planner在实物机器人上的部署。如果您有相关工作需要分享,欢迎文末联系我们。NeuPAN-planner在复杂场景下的表现。NeuPAN-planner的架构与优势。:本次分享我们邀请到了香港大学博士。本次分享我们邀请到了香港大学博士。当前机器人导航方案的挑战。3D视觉工坊哔哩哔哩。

2025-05-13 07:03:27 20

原创 windows下安装python软件

Python安装完毕后,不但可以在Windows命令行(cmd) 使用交互模式,还可以使用安装程序自带的交互式开发工具IDLE。至此,Python最新版安装程序就安装完毕了。使用Windows终端(cmd)或者IDLE开发工具,都可以启动。以上,由此可验证Python已经成功安装在windows电脑上。点击左下角搜索栏Type here to search,输入。, 选择命令行提示符,并点击“IDLE交互式开发模式。

2025-05-11 16:12:40 70

转载 ICRA 2025开源 | 大语言模型LLM助力,Hier-SLAM推动高效三维语义理解新突破

尤其重要的是,Hier-SLAM 首次展现了在超过 500 类语义场景中仍能高效运行的能力,充分体现了其强大的扩展性。本文提出了 Hier-SLAM,这是一种基于语义的三维高斯溅射 SLAM 方法,具备全新的层级类别表示方式,能够实现精准的全局三维语义建图、良好的扩展性,以及三维世界中显式的语义标签预测。为构建任意类别的语义树结构,本工作同时考虑语义信息的功能属性与几何属性,借助大语言模型(LLMs)自动构建结构合理的语义树,有效压缩信息表示,减少内存开销与训练时间,同时保持语义结构的物理意义。

2025-05-11 00:04:59 109

转载 CVPR 2025 | 自动驾驶论文总结

题目:GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving。题目:GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving。

2025-05-11 00:04:59 118

转载 如何一直follow前沿的顶会动态?

多模态融合 SLAM 的门槛较高,在需要视觉 SLAM 与激光 SLAM 的基础之外,还会遇到不同模态测量的融合,不同传感器的时间同步,多传感器的外参标定,多传感器异常检测等问题,使得各位同学做这块的时候遇到诸多障碍。具身智能、大模型、扩散模型、相机标定、结构光、3DGS等三维重建、三维点云、缺陷检测、机械臂抓取、激光/视觉/多模态SLAM、自动驾驶、深度估计、模型部署、Transformer、3D目标检测、深度学习、视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流。

2025-05-10 00:01:38 40

转载 盘一下!ICLR 2025现场那些有趣的poster及paper(具身智能方向)

(regret),具体操作包括:(1)在任务状态空间中系统性地屏蔽感知输入(2)测量不同屏蔽时长(duration)和时机(timing)对任务成功率的影响(3)建立感知价值与任务状态、策略架构的关联模型。(MoSAT)实现关节间的消息传递,并引入拓扑位置编码(TopoPE)来高效表示动态演化的形态结构,从而支持轻量级模型(仅1.4M参数)下的复杂任务处理。首先,它通过文本提示(如“高踢腿”或“坐下”)直接控制动作风格,结合目标位置实现精确的任务描述,突破了传统控制器对预定义动作的依赖。

2025-05-10 00:01:38 54

转载 SLAM中的数学:轻松理解李群与李代数(中)

它的李括号定义稍微复杂一些,但本质上反映了两个元素的“差异”或者说“不可交换性”。比如,两次旋转操作的顺序通常是不能交换的,李括号就刻画了这种性质。其实它就是我们上一讲提到的旋转向量 (Rotation Vector),它的方向是旋转轴,它的模长是旋转的角度。粗略地说,李代数描述了李群在单位元附近的“正切空间”(Tangent Space),也就是它局部的“导数”信息。李代数不仅仅是一个向量空间,它还定义了一种特殊的二元运算,叫做李括号 (Lie Bracket),它的李括号可以由向量的叉乘定义。

2025-05-10 00:01:38 43

转载 CVPR‘25开源 | ETH重磅One2Any:任意物体的 6D 位姿估计

在多个基准数据集上的实验表明,我们的模型可以很好地推广到新的对象,实现了最先进的准确性和鲁棒性,甚至可以与需要多视图或CAD输入的方法相媲美,而计算量却很小。受标准化物体坐标空间(Normalized Object Coordinate Space, NOCS)的启发(该空间使用规范物体姿态定义类别级物体的2D-3D对应关系),我们通过定义参考物体坐标系(Reference Object Coordinate, ROC)放宽了规范坐标系要求,该坐标系在参考相机坐标系中呈现归一化的物体坐标。

2025-05-10 00:01:38 67

转载 CVPR‘25开源 | ETH重磅One2Any:任意物体的 6D 位姿估计

在多个基准数据集上的实验表明,我们的模型可以很好地推广到新的对象,实现了最先进的准确性和鲁棒性,甚至可以与需要多视图或CAD输入的方法相媲美,而计算量却很小。受标准化物体坐标空间(Normalized Object Coordinate Space, NOCS)的启发(该空间使用规范物体姿态定义类别级物体的2D-3D对应关系),我们通过定义参考物体坐标系(Reference Object Coordinate, ROC)放宽了规范坐标系要求,该坐标系在参考相机坐标系中呈现归一化的物体坐标。

2025-05-10 00:01:38 76

转载 CVPR‘25开源 | ETH重磅One2Any:任意物体的 6D 位姿估计

在多个基准数据集上的实验表明,我们的模型可以很好地推广到新的对象,实现了最先进的准确性和鲁棒性,甚至可以与需要多视图或CAD输入的方法相媲美,而计算量却很小。受标准化物体坐标空间(Normalized Object Coordinate Space, NOCS)的启发(该空间使用规范物体姿态定义类别级物体的2D-3D对应关系),我们通过定义参考物体坐标系(Reference Object Coordinate, ROC)放宽了规范坐标系要求,该坐标系在参考相机坐标系中呈现归一化的物体坐标。

2025-05-10 00:01:38 66

转载 CVPR‘25开源 | ETH重磅One2Any:任意物体的 6D 位姿估计

在多个基准数据集上的实验表明,我们的模型可以很好地推广到新的对象,实现了最先进的准确性和鲁棒性,甚至可以与需要多视图或CAD输入的方法相媲美,而计算量却很小。受标准化物体坐标空间(Normalized Object Coordinate Space, NOCS)的启发(该空间使用规范物体姿态定义类别级物体的2D-3D对应关系),我们通过定义参考物体坐标系(Reference Object Coordinate, ROC)放宽了规范坐标系要求,该坐标系在参考相机坐标系中呈现归一化的物体坐标。

2025-05-10 00:01:38 14

转载 南京大学三维视觉实验室招生!涉及三维重建、数字人建模、可微渲染、三维生成、具身智能、三维基础模型等

南京大学智能科学与技术学院准聘副教授,南京大学紫金学者,国家级青年人才。主要研究方向为三维视觉与空间智能,聚焦空间智能技术在自动驾驶、机器人等场景的应用,近年来在CVPR/T-PAMI等会议期刊发表一作与通讯论文20余篇,谷歌学术引用2700余次。,南京大学智能科学与技术学院助理教授,姑苏青年教授,博导。实验室聚焦三维计算机视觉方向研究,包括三维重建、数字人建模、可微渲染、三维生成、具身智能、三维基础模型等课题。,已主动推荐同学至苹果、腾讯、微软、阿里、蔚来、地平线、华为及领域内创业公司实习与工作。

2025-05-09 07:02:30 509

转载 ICRA‘25 | GNSS失效也能飞?无人机10秒完成温室作物监测,计数精度高达94.4%

在采摘通道的数据集中,该系统在13.2米、耗时10.5秒的飞行过程中,实现了94.4%的计数准确率和87.5%的重量估算准确率。作者设计了基于RGB-D图像和无人机6D位姿的3D多目标追踪(3D MOT)算法,并构建了一个简单的番茄尺寸到重量的估算模型。在13.2米的收获行飞行中,仅用时10.5秒,系统实现了94.4%的计数准确率和87.5%的重量估计准确率。所有成熟的圣女果都在飞行后收获。:在前视相机的实验中,计数精度为94.4%,但由于误判和重复检测,一些未成熟的水果被误识别为番茄,导致了计数的偏差。

2025-05-09 07:02:30 51

转载 DetAny3D:任意单目图也能“万物3D”!

上海交通大学 x 上海 AILab 联培博士生,研究方向为 3D 视觉,世界模型,自动驾驶。真实场景 Demo:点、框、文本 Prompt + 任意单目图像出 3D 框。:本次分享我们邀请到了上海交通大学x上海 AILab 联培博士生。本次分享我们邀请到了上海交通大学x上海 AILab 联培博士生。长尾目标难标注、相机形态多样 → 传统3D检测频繁失效。扫码观看直播,或前往B站搜索3D视觉工坊观看直播。DetAny3D:任意单目图也能“万物3D”!如果您有相关工作需要分享,欢迎联系我们。

2025-05-09 07:02:30 25

转载 ICRA‘25 | GNSS失效也能飞?无人机10秒完成温室作物监测,计数精度高达94.4%

在采摘通道的数据集中,该系统在13.2米、耗时10.5秒的飞行过程中,实现了94.4%的计数准确率和87.5%的重量估算准确率。作者设计了基于RGB-D图像和无人机6D位姿的3D多目标追踪(3D MOT)算法,并构建了一个简单的番茄尺寸到重量的估算模型。在13.2米的收获行飞行中,仅用时10.5秒,系统实现了94.4%的计数准确率和87.5%的重量估计准确率。所有成熟的圣女果都在飞行后收获。:在前视相机的实验中,计数精度为94.4%,但由于误判和重复检测,一些未成熟的水果被误识别为番茄,导致了计数的偏差。

2025-05-09 07:02:30 48

转载 ICRA‘25 | GNSS失效也能飞?无人机10秒完成温室作物监测,计数精度高达94.4%

在采摘通道的数据集中,该系统在13.2米、耗时10.5秒的飞行过程中,实现了94.4%的计数准确率和87.5%的重量估算准确率。作者设计了基于RGB-D图像和无人机6D位姿的3D多目标追踪(3D MOT)算法,并构建了一个简单的番茄尺寸到重量的估算模型。在13.2米的收获行飞行中,仅用时10.5秒,系统实现了94.4%的计数准确率和87.5%的重量估计准确率。所有成熟的圣女果都在飞行后收获。:在前视相机的实验中,计数精度为94.4%,但由于误判和重复检测,一些未成熟的水果被误识别为番茄,导致了计数的偏差。

2025-05-09 07:02:30 32

转载 ICRA‘25 | GNSS失效也能飞?无人机10秒完成温室作物监测,计数精度高达94.4%

在采摘通道的数据集中,该系统在13.2米、耗时10.5秒的飞行过程中,实现了94.4%的计数准确率和87.5%的重量估算准确率。作者设计了基于RGB-D图像和无人机6D位姿的3D多目标追踪(3D MOT)算法,并构建了一个简单的番茄尺寸到重量的估算模型。在13.2米的收获行飞行中,仅用时10.5秒,系统实现了94.4%的计数准确率和87.5%的重量估计准确率。所有成熟的圣女果都在飞行后收获。:在前视相机的实验中,计数精度为94.4%,但由于误判和重复检测,一些未成熟的水果被误识别为番茄,导致了计数的偏差。

2025-05-09 07:02:30 24

转载 ICRA‘25 | GNSS失效也能飞?无人机10秒完成温室作物监测,计数精度高达94.4%

在采摘通道的数据集中,该系统在13.2米、耗时10.5秒的飞行过程中,实现了94.4%的计数准确率和87.5%的重量估算准确率。作者设计了基于RGB-D图像和无人机6D位姿的3D多目标追踪(3D MOT)算法,并构建了一个简单的番茄尺寸到重量的估算模型。在13.2米的收获行飞行中,仅用时10.5秒,系统实现了94.4%的计数准确率和87.5%的重量估计准确率。所有成熟的圣女果都在飞行后收获。:在前视相机的实验中,计数精度为94.4%,但由于误判和重复检测,一些未成熟的水果被误识别为番茄,导致了计数的偏差。

2025-05-09 07:02:30 11

转载 这家新势力完成C+轮融资,冲击 “3D视觉感知机器人” 第一股!

威迈尔VMR则集成迈尔微视MRDVS的3D视觉+AI算法,研发包括人形机器人在内的3D视觉感知移动机器人、核心控制模组、机器人集群调度系统等软硬件产品,面向集成商、终端企业、研究机构、高等院校提供智能移动机器人产品。新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘。新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘。IPO提上公司日程,冲击国内“3D视觉感知机器人第一股”,拭目以待。

2025-05-08 07:07:11 93

转载 CVPR‘25开源 | TUM重磅新作SparSplat:多视图重建加速100倍!精度SOTA!

本研究探索了来自DINOv2的丰富二维语义特征,以及来自MASt3R的密集成对特征图(编码输入图像间的密集成对对应关系)在预测二维高斯溅射参数中的作用,并在稀疏视图设置下,在三维重建和新视角合成任务中均取得了最先进结果。体积渲染技术的进展通过直接优化多视图图像的场景几何与辐射度,实现了更平滑精细的重建。我们在DTU数据集上也取得了最先进的成果,包括新颖视图合成和3D重建中,对BlendedMVs数据集具有强大的泛化能力,并在更具挑战性的TanksandTemples数据集上取得了有希望的结果。

2025-05-08 07:07:11 53

转载 CVPR‘25开源 | TUM重磅新作SparSplat:多视图重建加速100倍!精度SOTA!

本研究探索了来自DINOv2的丰富二维语义特征,以及来自MASt3R的密集成对特征图(编码输入图像间的密集成对对应关系)在预测二维高斯溅射参数中的作用,并在稀疏视图设置下,在三维重建和新视角合成任务中均取得了最先进结果。体积渲染技术的进展通过直接优化多视图图像的场景几何与辐射度,实现了更平滑精细的重建。我们在DTU数据集上也取得了最先进的成果,包括新颖视图合成和3D重建中,对BlendedMVs数据集具有强大的泛化能力,并在更具挑战性的TanksandTemples数据集上取得了有希望的结果。

2025-05-08 07:07:11 34

转载 CVPR‘25开源 | TUM重磅新作SparSplat:多视图重建加速100倍!精度SOTA!

本研究探索了来自DINOv2的丰富二维语义特征,以及来自MASt3R的密集成对特征图(编码输入图像间的密集成对对应关系)在预测二维高斯溅射参数中的作用,并在稀疏视图设置下,在三维重建和新视角合成任务中均取得了最先进结果。体积渲染技术的进展通过直接优化多视图图像的场景几何与辐射度,实现了更平滑精细的重建。我们在DTU数据集上也取得了最先进的成果,包括新颖视图合成和3D重建中,对BlendedMVs数据集具有强大的泛化能力,并在更具挑战性的TanksandTemples数据集上取得了有希望的结果。

2025-05-08 07:07:11 26

转载 CVPR‘25开源 | TUM重磅新作SparSplat:多视图重建加速100倍!精度SOTA!

本研究探索了来自DINOv2的丰富二维语义特征,以及来自MASt3R的密集成对特征图(编码输入图像间的密集成对对应关系)在预测二维高斯溅射参数中的作用,并在稀疏视图设置下,在三维重建和新视角合成任务中均取得了最先进结果。体积渲染技术的进展通过直接优化多视图图像的场景几何与辐射度,实现了更平滑精细的重建。我们在DTU数据集上也取得了最先进的成果,包括新颖视图合成和3D重建中,对BlendedMVs数据集具有强大的泛化能力,并在更具挑战性的TanksandTemples数据集上取得了有希望的结果。

2025-05-08 07:07:11 50

转载 面结构光3D相机!无惧高反、黑色物体!测距0.1m~3.5m!

KW系列3D相机采用主动结构光技术,拍摄速度快、成像精细、方案成熟稳定,针对不同应用场景物体可输出高质量点云数据图,精度高、速度快、环境自适应性强,适用于工件上下料、拆码垛、机器人视觉引导等多种应用场景。除以上,本产品提供的SDK和使用教程较为完善,使用起来非常方便。KW-Lumos-W!KW-Lumos-W!四 KW系列3D相机重建效果展示。2.5m远重建黑色箱子。三 KW系列3D相机参数汇总。

2025-05-07 07:07:10 45

转载 清华大学!DemoGen:面向机器人操作的合成数据生成

以扩散策略为代表的端到端控制策略在机器人操作领域展示出了强大的能力;在这次讲座中,我们将指出,造成这种数据需求的很大的一个原因在于端到端策略缺乏足够的空间泛化能力。研究方向为具身智能,主要聚焦于机器人操作任务和模仿学习方法,研究目标是打造更加高效、更具泛化能力的机器人操作算法和系统。,一种低成本的、面向机器人操作的合成数据生成方法。实验表明,仅需采集一条人类数据,加上DemoGen生成的合成数据,我们就能训练出具有良好泛化能力的端到端控制策略。扫码观看直播,或前往B站搜索3D视觉工坊观看直播。

2025-05-07 07:07:10 44

转载 AAAI‘25开源 | 单目深度结合MVS,突破弱纹理区域3D重建!

接着,采用跨视角深度重投影技术进行后验证。具体来说,假设某个像素在参考图像中不可见,我们将该像素的深度信息投影到源图像上,找出该像素的对应像素,并将其深度反投影回参考图像,比较重投影像素与原像素的位置差异。对于每个像素,方法根据其在不同视角中的可见性,计算与该像素相对应的多个源视角中的法线,并通过法线的聚合来限制法线的变化范围,从而增强几何一致性。对于基于补丁形变的MVS方法,我们引入了深度-边缘先验,通过腐蚀-膨胀策略对粗略的深度和边缘信息进行对齐,生成细粒度的均匀边界,以保证形变过程的稳定性。

2025-05-07 07:07:10 32

转载 AAAI‘25开源 | 单目深度结合MVS,突破弱纹理区域3D重建!

接着,采用跨视角深度重投影技术进行后验证。具体来说,假设某个像素在参考图像中不可见,我们将该像素的深度信息投影到源图像上,找出该像素的对应像素,并将其深度反投影回参考图像,比较重投影像素与原像素的位置差异。对于每个像素,方法根据其在不同视角中的可见性,计算与该像素相对应的多个源视角中的法线,并通过法线的聚合来限制法线的变化范围,从而增强几何一致性。对于基于补丁形变的MVS方法,我们引入了深度-边缘先验,通过腐蚀-膨胀策略对粗略的深度和边缘信息进行对齐,生成细粒度的均匀边界,以保证形变过程的稳定性。

2025-05-07 07:07:10 68

转载 AAAI‘25开源 | 单目深度结合MVS,突破弱纹理区域3D重建!

接着,采用跨视角深度重投影技术进行后验证。具体来说,假设某个像素在参考图像中不可见,我们将该像素的深度信息投影到源图像上,找出该像素的对应像素,并将其深度反投影回参考图像,比较重投影像素与原像素的位置差异。对于每个像素,方法根据其在不同视角中的可见性,计算与该像素相对应的多个源视角中的法线,并通过法线的聚合来限制法线的变化范围,从而增强几何一致性。对于基于补丁形变的MVS方法,我们引入了深度-边缘先验,通过腐蚀-膨胀策略对粗略的深度和边缘信息进行对齐,生成细粒度的均匀边界,以保证形变过程的稳定性。

2025-05-07 07:07:10 20

转载 AAAI‘25开源 | 单目深度结合MVS,突破弱纹理区域3D重建!

接着,采用跨视角深度重投影技术进行后验证。具体来说,假设某个像素在参考图像中不可见,我们将该像素的深度信息投影到源图像上,找出该像素的对应像素,并将其深度反投影回参考图像,比较重投影像素与原像素的位置差异。对于每个像素,方法根据其在不同视角中的可见性,计算与该像素相对应的多个源视角中的法线,并通过法线的聚合来限制法线的变化范围,从而增强几何一致性。对于基于补丁形变的MVS方法,我们引入了深度-边缘先验,通过腐蚀-膨胀策略对粗略的深度和边缘信息进行对齐,生成细粒度的均匀边界,以保证形变过程的稳定性。

2025-05-07 07:07:10 46

转载 各类结构光方案缺点总结

点结构光技术只是对点状光斑进行处理,算法简单,计算复杂度小,但是需要引入扫描移动设备,以保证点光斑的遍历扫描,使得系统效率低下,难以满足实时性要求。而使用双目结构光的方式,其标定与激光器无关,替换起来就比较简单。相移法是属于一种优点和缺点都极为显著的方法,优点是,通过相移解相位的方法,牺牲了时间(多幅条纹投影),以粗的条纹获得了细的分辨率,缺点是正弦条纹极易被干扰,这就导致了相位图失真,测量过程需要一维扫描,增加了装置复杂性,成本增加,另外,扫描过程使成像的时间大大增加,因此,该方法效率较低。

2025-05-06 07:04:02 159

转载 CVPR‘25开源 | 细节直逼亚毫米级!港科广分层建模突破3D Mesh重建

三个层级模块并非孤立运作,而是形成从宏观姿态到微观特征的递进式优化链条:骨架增强模块建立的准确骨骼框架为关节定位提供基础,关节增强策略稳定的关节预测又为皱纹细化创造了低噪声的几何环境。:骨架增强模块通过将3D傅里叶特征投影到输入图像一致的2D空间,使高斯重建模型能够充分融合先验的人体形态知识,从而精准捕捉人体姿态特征。模型的关节参数进行扰动。基于单目图像的三维人体重建存在固有深度歧义性,现有方法通常依赖SMPL-X等人体轮廓的预训练模板提供几何先验,但依然难以捕捉细节特征和特定解剖学结构。

2025-05-06 07:04:02 43

转载 工业3D视觉,如何选择一款适配的高精度3D相机?

KW系列3D相机采用主动结构光技术,拍摄速度快、成像精细、方案成熟稳定,针对不同应用场景物体可输出高质量点云数据图,精度高、速度快、环境自适应性强,适用于工件上下料、拆码垛、机器人视觉引导等多种应用场景。除以上,本产品提供的SDK和使用教程较为完善,使用起来非常方便。KW-Lumos-W!KW-Lumos-W!四 KW系列3D相机重建效果展示。2.5m远重建黑色箱子。三 KW系列3D相机参数汇总。

2025-05-06 07:04:02 15

转载 CVPR‘25开源 | 细节直逼亚毫米级!港科广分层建模突破3D Mesh重建

三个层级模块并非孤立运作,而是形成从宏观姿态到微观特征的递进式优化链条:骨架增强模块建立的准确骨骼框架为关节定位提供基础,关节增强策略稳定的关节预测又为皱纹细化创造了低噪声的几何环境。:骨架增强模块通过将3D傅里叶特征投影到输入图像一致的2D空间,使高斯重建模型能够充分融合先验的人体形态知识,从而精准捕捉人体姿态特征。模型的关节参数进行扰动。基于单目图像的三维人体重建存在固有深度歧义性,现有方法通常依赖SMPL-X等人体轮廓的预训练模板提供几何先验,但依然难以捕捉细节特征和特定解剖学结构。

2025-05-06 07:04:02 15

转载 CVPR‘25开源 | 细节直逼亚毫米级!港科广分层建模突破3D Mesh重建

三个层级模块并非孤立运作,而是形成从宏观姿态到微观特征的递进式优化链条:骨架增强模块建立的准确骨骼框架为关节定位提供基础,关节增强策略稳定的关节预测又为皱纹细化创造了低噪声的几何环境。:骨架增强模块通过将3D傅里叶特征投影到输入图像一致的2D空间,使高斯重建模型能够充分融合先验的人体形态知识,从而精准捕捉人体姿态特征。模型的关节参数进行扰动。基于单目图像的三维人体重建存在固有深度歧义性,现有方法通常依赖SMPL-X等人体轮廓的预训练模板提供几何先验,但依然难以捕捉细节特征和特定解剖学结构。

2025-05-06 07:04:02 5

转载 CVPR‘25开源 | 细节直逼亚毫米级!港科广分层建模突破3D Mesh重建

三个层级模块并非孤立运作,而是形成从宏观姿态到微观特征的递进式优化链条:骨架增强模块建立的准确骨骼框架为关节定位提供基础,关节增强策略稳定的关节预测又为皱纹细化创造了低噪声的几何环境。:骨架增强模块通过将3D傅里叶特征投影到输入图像一致的2D空间,使高斯重建模型能够充分融合先验的人体形态知识,从而精准捕捉人体姿态特征。模型的关节参数进行扰动。基于单目图像的三维人体重建存在固有深度歧义性,现有方法通常依赖SMPL-X等人体轮廓的预训练模板提供几何先验,但依然难以捕捉细节特征和特定解剖学结构。

2025-05-06 07:04:02 13

支持linux下像素级查看图片

支持linux下像素级查看图片

2023-01-29

Ymodem串口升级界面及源码(linux下也可使用)

Ymodem串口升级界面及源码(QT)

2022-07-20

如何在Linux下使用“linuxdeployqt”源码打包发布Qt程序

使用教程请参考博客:https://yongqi.blog.csdn.net/article/details/125841736

2022-07-18

ubuntu下基于Clion+QT编写的界面demo,适合入门

ubuntu下基于Clion+QT编写的界面demo,适合入门, 博客请参考:https://yongqi.blog.csdn.net/article/details/125698957

2022-07-11

针孔、鱼眼相机标定,包括单目和双目标定demo

针孔、鱼眼相机标定,包括单目和双目标定demo, 基于OpenCV和C++。

2022-07-01

OpenCV3.3.1安装包

用法请参考:https://mp.csdn.net/mp_blog/creation/success/125555489

2022-07-01

linux下TCP通讯助手

里面为deb文件,直接双击即可安装。或者通过指令: sudo dpkg -i **.deb 如果安装后点击软件无反应,则需要在终端执行: sudo apt-get install libqtgui4:amd64

2022-06-30

本demo主要实现ubuntu下实现与PLC以及机械臂之间的TCP网络通讯,并将C++代码编译成可以供C函数直接调用的C库。

本demo主要实现ubuntu下实现与PLC以及机械臂之间的TCP网络通讯,并将C++代码编译成可以供C函数直接调用的C库。

2022-06-22

Windows下TCP通讯实战demo及TCP助手

内容概要: Windows下TCP通讯实战demo,可以直接适用于与EPSON或者三菱等机械臂通讯,包括发送与接收字符串,位姿坐标等,以及两个好用的TCP助手。 适用人群:需要进行网络通讯的场景。

2022-06-03

Linux下的TCP通讯实战demo以及通讯助手下载

内容概要: Linux下的TCP通讯实战demo,以及通讯助手小工具 适用人群: 需要进行TCP网络通讯的问题。 主要适用场景。 通过网线或者wifi进行数据通讯的场景 //注意:在使用tcp/ip通讯时,请将服务器与客户端的ip设为同一个网段。 //本次演示的demo中, //服务器的ip为:192.168.3.8 端口号为8080 //客户端的ip为:192.168.3.48 端口号为36214(可以通过串口助手查看端口号) //以上同一个网段,如何判断两个ip地址是否为同一个网段,可以参考博客:https://baijiahao.baidu.com/s?id=1687382131051003813&wfr=spider&for=pc

2022-06-03

particle_filter_demo.zip

主要封装了粒子滤波(Particle Filter)对于非线性系统、非高斯噪声系统的跟踪效果,附有数据与图形展示过程,直观易懂。

2020-12-03

UKF(无迹卡尔曼滤波)

主要封装了UKF(无迹卡尔曼滤波)的跟踪demo,并配有直观的图形展示,简单易用。 UKF,是KF、EKF的变种与扩展,对于非线性跟踪效果要明显好于KF。

2020-12-03

Visual Assistant 2015破解版安装包

详细的安装教程请参见:https://mp.weixin.qq.com/s/_JvR9pWiIvDI7uOQvr1IGA

2018-09-12

精确绘制椭圆

该文件封装好的函数为:1、利用OpenCV函数绘制椭圆;2、利用面积法精确绘制椭圆。替换掉OpenCV属性表,即可成功运行。

2018-05-22

Github安装包

Github安装包。点击下载,解压即可轻松安装。便于项目工程管理。

2018-05-12

VS2013+OpenCV3.1.0配置教程

该文档为OpenCV3.1.0在VS2013中详细的配置教程,包括相关安装包的下载链接。

2018-05-08

QT在VS2013中的配置

该文档为QT5.7.1在VS2013中详细的配置教程,文章中对于配置过程中必要的软件安装包下载链接皆已提供。

2018-05-08

PCL1.8.0+VS2013+Win10 x64的配置教程

本篇文章主要介绍一下PCL库的配置过程,适合PCL入门。 一配置环境 1.win10 X64 2.Visual Studio 2013

2018-05-08

粒子滤波在图像领域的跟踪

粒子滤波在非高斯、非线性状况下,运动情况由于卡尔曼滤波。这是我在研究粒子滤波时,封装好的测试程序。下载之后,只需要将opencv属性表添加进来,便可以观看到运行效果图。

2018-04-25

卡尔曼滤波示例程序

这是我在研究卡尔曼滤波以及粒子滤波时,封装好的卡尔曼滤波跟踪二维点的程序。程序中已经有测试好的点击,配置好opencv属性表,便可以直接运行。

2018-04-25

xml读写项目总结

里面包括:1、封装好的XML文件的读和写工程;2、tinyxml库;3、xmlPPT讲解。

2018-01-26

XML头文件与cpp函数

此为XML文件读写的函数头文件与cpp文件,在项目中添加进来即可。

2018-01-26

socket通信界面程序

1、发送端为利用PointGrey相机追踪编码点并将其坐标值传输给接收端; 2、接收端为使用Qt Data Visualizaiton库编写的三维点显示界面。

2018-01-24

socket通信技术

1、 程序:socket_Send为发送端; 程序:socket_Receive为接收端; 2、 此程序可以用来接收和发送txt,jpg.avi等各种文件和char类型的数据; 如果对于结构体,可以先将其转化成char,再发送,接收之后,再转化成结构体。 可以参考我知乎提供的方法。

2018-01-23

QGraphicsView类的简单用法

QT 控件QGraphicsView的简单用法,包含头文件和cpp,函数调用参考README.txt

2018-01-18

GBK.h QT中显示中文

只要包含该头文件在QT工程中, QString imgPath = QFileDialog::getExistingDirectory(this, GBK::ToUnicode("设置图像 打开路径"), "D:/ImgFiles/", QFileDialog::Option::ShowDirsOnly); 如这条语句中用法,便可显示中文。

2018-01-18

配置VS2013+Qt5开发环境续:安装和设置以及QT工程创建

该资源为VS2013+QT5开发环境的安装配置以及Qt的工程创建。

2018-01-08

socket通信

socket通信实现代码,已经成功测试。可以运用于QT以及MFC。

2018-01-08

相机拍照程序(PointGrey相机)

资源中是我经常使用的PointGrey相机的拍照程序,实现了可以使用软触发和硬触发拍照。

2017-12-21

串口自动识别

Com端自动识别函数的封装,经过测试,亲测有效,可以自动识别串口号。

2017-12-21

相机最佳曝光时间的确定

由于每次使用相机时,需要调试相机的曝光时间,比较耽误时间,因而封装了一个函数,可以用来确定相机最佳的曝光时间。

2017-12-21

XML文件读写程序C++

XML文件读写封装好的程序,可以加入到工程中直接使用。

2017-12-21

qt data visualization 5.7.1 源码

这是我在QT官网上下载的qt data viualization的源码,可以使用Cmake成功编译。

2017-12-19

Particle滤波 粒子滤波跟踪算法

粒子滤波跟踪算法,我已成功运用于光笔的动态跟踪,现上传,希望可以帮助到大家。

2017-08-22

串口程序 可以自动识别串口号

可以用来自动识别串口号,方便快捷,成功应用于ZigBee板子中。

2017-05-13

利用PointGrey相机连续拍照

此程序可以用来给PointGrey通过程序拍照,并且拍完的照片可以连续保存到指定的文件夹下。

2017-05-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除
OSZAR »