行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211037460.2 (22)申请日 2022.08.29 (71)申请人 东南大学 地址 210096 江苏省南京市玄武区四牌楼 2 号 (72)发明人 程向红 刘丰宇  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 许小莉 (51)Int.Cl. G06T 7/246(2017.01) G06T 7/269(2017.01) G06T 7/73(2017.01) G06T 5/00(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于目标检测和特征点速度约束的动态视 觉SLAM方法 (57)摘要 本发明公开一种基于目标检测与特征点速 度约束的动态视觉SLA M方法, 属于计算机视觉和 深度学习技术领域。 该方法首先通过VOC数据集 和真实数据集对YOL O_v5s模型进行训练; 接着将 RGB‑D相机采集到的图像输入到训练好的YOLO_ v5s模型中得到潜在动态目标的检测框; 然后通 过ORB‑LK光流金字塔算法计算先验动态目标特 征点的相对运动速度; 根据目标在场景中的运动 状态判断目标的真实动态性并剔除动态特征点; 在后端优化中利用剩余静态特征点进行匹配与 位姿估计, 最终得到相机的最优运动轨 迹。 权利要求书3页 说明书8页 附图6页 CN 115115672 A 2022.09.27 CN 115115672 A 1.一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 该方法包 括如下步骤: (1) 利用PASCAL  VOC 2012数据集和所拍摄的真实场景数据集对YOLO_v5s模型进行训 练, 得到训练好的YOLO_v5s模型; (2) 通过RGB ‑D相机采集彩色和深度图像序列, 将当前时刻包含彩色和 深度图像的当前 帧输入到步骤 (1) 得到的训练好的YOLO_v5s模型中, 获得潜在动态目标的先验识别框; (3) 从步骤 (2) 当前帧获得的潜在动态目标的先验识别框中提取ORB特征点, 当采集到 包含彩色和深度图像的下一帧之后, 通过LK光 流算法追踪两帧之间的特 征点; (4) 引入特征金字塔, 从图像多尺度改进LK光流算法, 并计算两帧之间特征点的相对运 动速度; (5) 通过步骤 (4) 中的特征点相对运动 速度判断潜在动态目标的真实动态性, 根据潜在 动态目标在场景中的真实动态性剔除图像中的动态特 征点; (6) 剔除步骤 (5) 中的动态特征点后, 利用剩余的静态特征点进行特征匹配与相机位姿 估计, 最终得到相机的最优运动轨 迹。 2.根据权利要求1所述的一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 步骤 (1) 的具体方法是: 首先选择PASCAL  VOC 2012数据集中对YOLO_v5系列中网络深度最小的YOLO_v5s模型 进行第一次训练, 该数据集由现实世界中的对 象类组成; 然后采用所拍摄的真实场景数据 集对第一次训练后的模型进行第二次训练, 目标类别设定为数据集中潜在的动态对象。 3.根据权利要求1所述的一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 步骤 (2) 的具体方法是: 首先将RGB ‑D相机采集的包含彩色和深度图像的当前帧输入到步骤 (1) 里训练好的 YOLO_v5s模型中; 然后YOLO_v5s模型通过Focus结构对图片进行切片操作, 并经过CBL模块 进行卷积操作; 在Backbone中, 使用带残差结构的CSP1_X, 在Neck中使用CSP2_X; 接着将 Neck中输出的特征图输入到预测层部分, 采用CIOU_LossBounding  box损失函数最小化预 测框和目标框之间的归一化距离; 然后采用加权非极大值抑制的方式对多目标框进行筛 选; 最终得到潜在动态目标的先验识别框的位置以及顶点 坐标。 4.根据权利要求1所述的一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 步骤 (3) 的具体方法是: 先通过ORB算法提取经过畸变矫正、 去噪处理的图像 中的特征点; 然后利用帧间像素的 相似性, 通过LK光流求解位移向量以实现特征点附近一个矩形窗口的匹配与跟踪; 最后通 过最小化窗口内的像素 灰度差平方和来 求解像素点 光流d=[dx, dy]T, 如下式所示: 其中,x, y为特征邻域内的像素点, dx, dy分别表示 x和y方向上的光流, [ ·]T表示转 置,  表示最小化 dx,dy的函数,ux, uy分别表示像素点的横纵坐标, mx, my为以像素 点中心的矩形窗口长宽, Ii(x,y)表示第i帧像素点的灰度值, Ii+1(x+dx,y+dy)表示第i+1帧 像素点的灰度值。权 利 要 求 书 1/3 页 2 CN 115115672 A 25.根据权利要求4所述的一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 步骤 (3) 中所述ORB特征提取的具体方法是, 提取潜在动态目标检测框内的 FAST特征点, 定义图像矩为: 其中,a,b为矩的阶次, mab为a+b阶矩, 利用图像矩计算质心坐标 C, 并定义方向因子为图 像块中心到质心的方向角度 θ: 其中m10为a=1,b=0时的图像矩, m01为a=0,b=1时的图像矩, m00为a=0,b=0时的图像矩, arctan表示计算反正切; 然后引入旋转因子提取BRIEF描述子, 其核心思想是在特征点周围选取 n个点对, 并把 这n个点对的比较结果组合 起来作为描述子, 最终得到有旋转 不变性的ORB特 征点。 6.根据权利要求1所述的一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 步骤 (4) 的具体方法是: 引入特征金字塔模型, 从图像多尺度改进LK光流算法, 最终求解光流 d, 确保两帧间的 特征点在不同分辨率下均构成匹配点对; 将前一时刻的彩色图像和当前时刻的彩色图像进 行金字塔分层, 第 s层图像的光流分为猜测光流 gs=[gx, gy]T与剩余光流 rs=[rx, ry]T(s= 1,…,L‑1,L) , 其中,gx, gy分别表示 x和y方向上的猜测光流, rx, ry分别表示 x和y方向上的 剩余光流, s表示第s层金字塔, L表示最上层金字塔; 定义猜测光流为上一层传递至下一层 的光流, 剩余光流为除猜测光流的剩余光流, 根据猜测光流定义, 第 L层, 即最上层猜测光流 gL为: 计算最上层剩余光流 rL, 根据图像金字塔相邻两层间缩放倍数为2的关系, 将第 L层剩余 光流与猜测光 流之和作为第 ( L‑1) 层猜测光 流gL‑1, 即: 计算第 (L‑1) 层剩余光流 rL‑1, 逐层递推至第0层, 计算第0层的猜测光流 g0和剩余光流 r0, 获得最终光 流值d为: 从图像多尺度求 解光流, 最终解 算得到特 征点的相对运动速度。 7.根据权利要求1所述的一种基于目标检测和特征点速度约束的动态视觉SLAM方法, 其特征在于, 步骤 (5) 的具体方法是: 在真实场景中, 由于存在处于准静态的目标在一段时间内是运动的, 处于动态的目标 在一段时间内却是静止的这两种情况, 对于真实场景中的目标需判断其真实动态性, 通过 步骤 (3) 中计算的特 征点相对运动速度判断目标的真实动态性, 如下式所示: 权 利 要 求 书 2/3 页 3 CN 115115672 A 3

.PDF文档 专利 基于目标检测和特征点速度约束的动态视觉SLAM方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于目标检测和特征点速度约束的动态视觉SLAM方法 第 1 页 专利 基于目标检测和特征点速度约束的动态视觉SLAM方法 第 2 页 专利 基于目标检测和特征点速度约束的动态视觉SLAM方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:06:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。