基于光场EPI图像栈的6D位姿估计方法

Li Yang,Zhang Xudong, Sun Rui,Fan Zhiguo

Journal of Electronic Measurement and Instrumentation(2023)

引用 0|浏览2
暂无评分
摘要
光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标 6D位姿估计领域具有独特优势.针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一种基于光场图像的端到端卷积神经网络目标位姿估计方法.该方法首先利用双路EPI编码模块实现高维光场数据的处理,通过重构出光场EPI图像栈和引入水平和垂直EPI卷积算子,提高对光场空间角度信息关联的建模能力,并由双分支孪生网络进行光场图像的浅层特征提取.其次,设计了带跳跃连接的特征聚合模块,对串联后的水平和垂直方向光场EPI浅层特征进行全局上下文聚合,使网络在逐像素关键点位置预测时有效结合全局和局部特征线索.针对光场数据不足问题,本文使用Lytro Illum光场相机采集真实场景,构建了一个丰富且场景复杂的光场位姿数据集——LF-6Dpose.在光场位姿数据集LF-6Dpose上的实验结果表明,该方法在ADD-S和 2D Projection指标下平均位姿检测精度分别为 57.61%和 91.97%,超越了其他基于RGB的先进方法,能够更好地解决复杂场景下的目标 6D位姿估计问题.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要