行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210473939.4 (22)申请日 2022.04.29 (71)申请人 哈尔滨工程大 学 地址 150001 黑龙江省哈尔滨市南岗区南 通大街145号哈尔滨工程大学科技处 知识产权办公室 (72)发明人 徐硕 高靖萱 马腾 凌宇  姜言清 刘善昌 丁硕硕 孙祥仁  田恩农 张文君 李晔  (51)Int.Cl. G06V 20/20(2022.01) G06V 10/75(2022.01) G06V 20/40(2022.01) G06V 10/44(2022.01) G06V 10/62(2022.01) G06F 17/16(2006.01) (54)发明名称 一种基于双目视 觉的物体表达方法 (57)摘要 本发明属于机器人导航技术领域, 具体涉及 一种基于双目视觉的物体表达方法。 本发明通过 机器人搭载的双目相机获取关于场景的当前帧 图像; 从当前帧左右图像中检测场景里的物体; 对得到的左右图像中的物体进行匹配, 完成相同 物体的配对; 利用卡尔曼滤波与匈牙利匹配对双 目帧间的物体进行跟踪, 一旦检测到相同物体, 利用两帧中的四张图像完成对物体的语义信息 提取, 包括物体的大小, 位置和姿态。 本发明提出 了一种可靠性好、 适用性广的物体表达方法, 保 证场景中任意形状的物体都能提取出有价值的 语义信息, 从而促进视觉同步定位与建图的精度 和语义性。 权利要求书3页 说明书8页 附图4页 CN 115049949 A 2022.09.13 CN 115049949 A 1.一种基于双目视 觉的物体表达方法, 其特 征在于, 包括以下步骤: 步骤1: 利用机器人 搭载的双目相机, 采集场景中的当前帧图像对; 步骤2: 物体单帧识别与匹配: 对左右图像分别进行物体识别, 将得到的物体矩形框利 用像素重 叠度判别是否为同一物体, 完成匹配并进入步骤3; 步骤3: 物体帧间跟踪: 通过步骤2得到物体集合后, 对每个物体判断是否在历史帧中出 现, 对已出现的物体进 行归类, 对未出现的物体进 行跟踪初始 化, 对跟踪失败的物体进行剔 除, 进入步骤4; 步骤4: 物体语义信息提取: 将步骤3已跟踪超过两帧的物体进行语义信息的提取, 进入 步骤5; 步骤5: 输出场景物体的语义信息, 结束。 2.根据权利要求1所述的一种基于双目视觉的物体表达方法, 其特征在于: 所述的步骤 2具体为: 步骤2.1: 物体信息提取; 定义图像中物体的信息为: B=(w,h,b, σ,c) 其中, w和h表示物体矩形框的像素长度和宽度; b=(u,v)表示矩形框的中心像素位置; σ 和c分别表示矩形框的置信度和物体 类别; 对左右图像进行物体识别, 得到图像中所有的物体: OL={BLi=(wLi,hLi,bLi, σLi,cLi)|cLi∈C, σLi∈[0,1],i =1,2,...,k} OR={BRi=(wRi,hRi,bRi, σRi,cRi)|cRi∈C, σRi∈[0,1],i =1,2,...,m} 其中, OL和OR表示当前帧左右图像中的所有物体集合; k和m表示当前帧左右图像中的所 有物体数量; C表示先设置的物体 类别集合; 步骤2.2: 单帧物体匹配; 定义物体之间的像素重 叠度为: 其中, S(·)=w·h表示矩形框的面积; A,B表示图像上的两个物体; 将双目单帧左图上的物体依次计算与右图上物体的像素重叠度, 选出重叠度最大的作 为其候选匹配对, 形成候选匹配对集 合: Mcan={(BLcan,BRcan)|BLcan∈OL,BRcan∈OR}; 步骤2.3: 误匹配判别: 对候选匹配对集合Mcan中的任意一个匹配对(BLcan_i,BRcan_i), 首 先利用双目特性约束判别矩形框中心b=(u,v)的相对位置, 若不满足uLcan<uRcan和|vLcan‑ vRcan|<10, 则剔除该候选匹配对, 进入步骤2.4; 步骤2.4: 重 复性检验; 在完成所有候选 匹配对的相对位置判别后, 若集合Mcan中存在两 个或多个候选匹配对中有同一物体信息B, 则将这些候选匹配对全部剔除, 保证每个物体信 息至多出现在一个候选匹配对中, 进入步骤2.5; 步骤2.5: 最终得到双目单帧左右图像的匹配对集合, 即每个匹配对表示同一物体在左 右图像上的成像信息: M={(BLM,BRM)|BLM∈OL,BRM∈OR}。 3.根据权利要求1所述的一种基于双目视觉的物体表达方法, 其特征在于: 所述的步骤权 利 要 求 书 1/3 页 2 CN 115049949 A 23具体为: 步骤3.1: 判断当前关键帧是否为初始关键帧, 即i=0, 若当前关键帧是初始关键帧, 则 执行步骤3.2; 否则, 执 行步骤3.3; 步骤3.2: 初始化跟踪系统, 设置卡尔曼滤波的跟踪子变量为 和 表 示矩形框中心 位置像素坐标的速度大小; 设置过程协方差矩阵P、 测量协方差矩阵Q、 测量矩 阵R中变量的的噪声, 设置转换矩阵H、 卡尔曼增益矩阵K、 状态转移矩阵F; 根据初始关键帧 配对集合M0中的左图结果 初始化跟踪变量 X0中跟踪的物体个数与 一致, 所有的 和 均初始化 为0, 进入步骤3.3; 步骤3.3: 物体运动预测: 对上一关键帧的跟踪变量Xi‑1进行预测, 得到当前关键帧中物 体的先验状态 以及先验的过程协方差矩阵 步骤3.4: 物体匹配: 计算物体先验信息 中每个矩形框与物体测量信息 中所有 矩形框的像素重 叠度, 并将其数值取负, 形成匹配的代价矩阵, 进 而得到匹配结果; 步骤3.5: 更新物体运动状态: 根据匹配结果从Xi‑1中筛选出跟踪成功的物体集合 并更新其状态: 其中, I为单位阵; Ki为卡尔曼增益; Zi为测量值, 根据匹配结果从 中得出; 步骤3.6: 更新跟踪系统: 对 中未匹配上的物体进行卡尔曼滤波初始化, 初始化参数 与步骤3.2中一致, 并添加到跟踪成功的物体集合 中, 最终形成当前关键帧的跟踪变量 Xi。 4.根据权利要求1所述的一种基于双目视觉的物体表达方法, 其特征在于: 所述的步骤 4具体为: 步骤4.1: 物 体条件判别: 从当前关键帧的跟踪物 体Xi中筛选出跟踪次数大于2且没有 提 取语义信息的物体, 组成集 合Oi={o1,o2,...,ol}, 进入步骤4.2; 步骤4.2: 物体 语义信息恢复: 对集合Oi中的任一物体oi, 从历史跟踪过程中得到双目两帧上的检测矩形框, 即4个矩 形框, 根据矩形顶点坐标转换成16条直线集合 每条直线用三个参数表示, 即l=(a,b,c,1); 空间平面与相机平面相交是一条直线: π =PTL 其中, π=( π1, π2, π3, π4)表示空间中的某一平面, 由四个参数表示; P=K[R|t]表示相机权 利 要 求 书 2/3 页 3 CN 115049949 A 3

PDF文档 专利 一种基于双目视觉的物体表达方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于双目视觉的物体表达方法 第 1 页 专利 一种基于双目视觉的物体表达方法 第 2 页 专利 一种基于双目视觉的物体表达方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。