行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111604280.3 (22)申请日 2021.12.24 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 张珂 罗钧峰 苏金明 范铭源  魏晓明 魏晓林  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 代理人 刘冬亮 (51)Int.Cl. G06V 10/774(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 目标对象的预测方法、 装置、 电子设备和存 储介质 (57)摘要 本发明实施例提供了一种目标对象的预测 方法和装置, 其中, 所述方法包括: 将原始图像输 入至第一检测模 型, 输出目标对象的第一位置信 息和粗略类别信息; 对原始图像进行裁剪得到多 个目标对象区域图像, 将多个目标对象区域图像 输入至第二检测模型, 输出每个目标对象的多个 第二位置信息和多个精细类别信息; 若存在目标 类别对象则选择出目标预测对象; 根据第一位置 信息和第二位置信息生成位置预测结果, 将精细 类别信息作为类别预测结果。 本发 明实施例增加 了目标对象的上下文信息, 从而提高从第二检测 模型输出的精细类别信息的准确率。 针对目标类 别对象选 择出目标预测对象, 避免了非目标预测 对象的干扰, 进一步提升目标对象预测的准确 率。 权利要求书2页 说明书11页 附图5页 CN 114419390 A 2022.04.29 CN 114419390 A 1.一种目标对象的预测方法, 其特 征在于, 所述方法包括: 获取待处 理的原始图像, 所述原 始图像包 含至少一个目标对象; 将所述原始图像输入至训练完毕的第 一检测模型, 输出至少一个所述目标对象的第 一 位置信息和粗略类别 信息; 针对每个所述目标对象, 根据 所述第一位置信 息对所述原始图像进行裁剪得到多个目 标对象区域图像, 将多个所述 目标对象区域图像输入至训练完毕的第二检测模型, 输出每 个所述目标对象的多个第二 位置信息和多个精细类别 信息; 针对每个所述目标对象, 根据 所述粗略类别信 息、 所述第 一位置信 息、 多个所述第二位 置信息和预设交并比阈值, 判断每 个所述目标对象是否属于预设类别的目标类别对象; 若至少一个所述目标对象中存在所述目标类别对象, 则计算所述目标类别对象的置信 度, 并根据所述置信度从所述目标类别对象中选择 出目标预测对象; 根据所述目标预测对象的所述第一位置信息和所述第二位置信息生成所述目标预测 对象的位置预测结果, 并将所述目标预测对象对应的所述精细类别信息作为类别预测结 果。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述粗略类别信息、 所述第一位 置信息、 多个所述第二位置信息和预设交并比阈值, 判断每个所述 目标对象是否属于预设 类别的目标类别对象, 包括: 当所述粗略类别信息属于所述预设类别时, 根据所述第一位置信息、 多个所述第二位 置信息和预设交并比阈值, 判断所述目标对象是否位于多个所述目标对象区域图像的中心 区域; 将位于至少一个所述目标对象区域图像的中心区域的所述目标对象确定为所述目标 类别对象。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述第一位置信息、 多个所述第 二位置信息和预设交并比阈值, 判断所述目标对象是否位于多个所述目标对象区域图像的 中心区域, 包括: 根据所述第一位置信息和多个所述第二位置信息计算所述目标对象的多个交并比参 数; 若存在至少一个大于或等于所述预设交并比阈值的交并比参数, 则确 认所述目标对象 位于至少一个所述目标对象区域图像的中心区域。 4.根据权利要求2或3所述的方法, 其特征在于, 所述计算所述目标类别对象的置信度, 包括: 统计所述目标类别对象位于所述中心区域的数量, 根据 所述数量和包含所述目标类别 对象的所述目标对象区域图像的数量计算所述置信度。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述置信度从所述目标类别对象 中选择出目标预测对象, 包括: 从所述目标类别对象中选择 所述置信度满足预设条件的所述目标 预测对象。 6.根据权利要求1所述的方法, 其特征在于, 所述根据所述目标预测对象的所述第 一位 置信息和所述第二 位置信息生成所述目标 预测对象的位置预测结果, 包括: 计算所述第 一位置信 息和所述第 二位置信 息的平均值, 将所述平均值作为所述位置预权 利 要 求 书 1/2 页 2 CN 114419390 A 2测结果。 7.根据权利要求1所述的方法, 其特征在于, 所述第一检测模型包含Two ‑stage网络模 型, 所述第二检测模型包 含One‑stage网络模型。 8.一种目标对象的预测装置, 其特 征在于, 所述装置包括: 图像获取模块, 用于获取待处 理的原始图像, 所述原 始图像包 含至少一个目标对象; 第一检测模块, 用于将所述原始图像输入至训练完毕的第一检测模型, 输出至少一个 所述目标对象的第一 位置信息和粗略类别 信息; 第二检测模块, 用于针对每个所述目标对象, 根据所述第一位置信息对所述原始图像 进行裁剪得到多个目标对象区域图像, 将多个所述目标对象区域图像输入至训练完 毕的第 二检测模型, 输出每 个所述目标对象的多个第二 位置信息和多个精细类别 信息; 对象判断模块, 用于针对每个所述目标对象, 根据 所述粗略类别信 息、 所述第 一位置信 息、 多个所述第二位置信息和预设交并比阈值, 判断每个所述 目标对象是否属于预设类别 的目标类别对象; 对象选择模块, 用于若至少一个所述目标对象中存在所述目标类别对象, 则计算所述 目标类别对象的置信度, 并根据所述置信度从所述目标类别对象中选择 出目标预测对象; 结果确定模块, 用于根据所述目标预测对象的所述第 一位置信 息和所述第 二位置信 息 生成所述目标预测对象的位置预测结果, 并将所述目标预测对象对应的所述精细类别信息 作为类别预测结果。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在处理器上运行的 计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任意一 项所述的目标对象的预测方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现权利要求1至7中任意 一项所述的目标对象的预测方法。权 利 要 求 书 2/2 页 3 CN 114419390 A 3

.PDF文档 专利 目标对象的预测方法、装置、电子设备和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标对象的预测方法、装置、电子设备和存储介质 第 1 页 专利 目标对象的预测方法、装置、电子设备和存储介质 第 2 页 专利 目标对象的预测方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:18:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。