行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210659118.X (22)申请日 2022.06.10 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 付琰 许顺楠 陈亮辉 范斌  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 庄锦军 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 样本图像数据生 成方法、 模 型的训练方法和 装置 (57)摘要 本公开提供了一种样本图像数据生成方法 和装置、 一种深度学习模型的训练方法和装置、 一种目标对象检测方法和装置、 电子设备、 存储 介质和计算机程序产品, 涉及人工智 能领域, 尤 其涉及目标识别和深度学习技术领域, 可用于智 慧城市、 智 能安防和智 能云场景等。 具体实现方 案为: 根据多个原始图像, 得到多个原始图像中 的多个面部图像、 多个全身图像以及多个面部图 像和多个全身图像 之间的对应关系; 对多个面部 图像的特征向量进行聚类, 得到多个面部类别 簇; 以及根据多个全身 图像、 对应关系以及多个 面部类别簇, 得到多个全身图像各自的标签信 息。 权利要求书2页 说明书10页 附图5页 CN 114926713 A 2022.08.19 CN 114926713 A 1.一种样本图像数据生成方法, 包括: 根据多个原始图像, 得到所述多个原始图像中的多个面部 图像、 多个全身图像以及多 个面部图像和多个全身图像之间的对应关系; 对所述多个面部图像的特 征向量进行聚类, 得到多个面部类别簇; 以及 根据所述多个全身图像、 所述对应关系以及所述多个面部类别簇, 得到所述多个全身 图像各自的标签信息 。 2.根据权利要求1所述的方法, 其中, 每个所述面部类别簇包括同一对象的N个面部 图 像, N为大于等于1的整 数; 所述根据所述多个全身图像、 所述对应关系以及所述多个面部类 别簇, 得到所述多个全身图像各自的标签信息包括: 针对每 个所述面部类别簇, 根据所述对应关系, 确定所述 面部类别簇中N个面部图像所对应的N个全身图像; 根据所述N个全身图像的第一特征向量从所述多个全身图像中确定与所述N个全身图 像相匹配的M个全身图像; M为大于等于1的整数; 以及 对所述N个全身图像与所述M个全身图像添加标签信息 。 3.根据权利要求2所述的方法, 其中, 所述根据所述N个全身图像的第一特征向量从所 述多个全身图像中确定与所述 N个全身图像相匹配的M个全身图像包括: 分别确定所述N个全身图像的第 一特征向量与 所述多个全身图像的第 二特征向量之间 的相似度; 以及 在所述相似度大于等于预定阈值的情况下, 根据所述相似度的大小顺序, 执行从所述 多个全身图像中确定与所述 N个全身图像相匹配的M个全身图像的操作。 4.根据权利要求2所述的方法, 还 包括: 在对所述N个全身图像与所述M个全身图像添加标签信息之前, 响应于检测到所述N个 全身图像与所述M个全身图像中存在重复的全身图像, 对所述N个全身图像与所述M个全身 图像执行去重处 理。 5.一种深度学习模型的训练方法, 包括: 获取样本图像数据; 将所述样本 图像数据输入所述深度学习模型, 得到所述样本 图像数据的检测结果; 以 及 根据所述检测结果与 所述样本图像数据的标签信 息之间的差异值, 对所述深度 学习模 型进行训练; 其中, 所述样本图像数据是利用权利要求1~4中任一项所述的方法生成的。 6.一种目标对象检测方法, 包括: 将待处理图像输入深度学习模型, 得到所述待处 理图像中目标对象的检测结果; 其中, 所述深度学习模型 是利用权利要求5所述的方法训练得到的。 7.一种样本图像数据生成装置, 包括: 第一获取模块, 用于根据多个原始图像, 得到所述多个原始图像中的多个面部图像、 多 个全身图像以及多个面部图像和多个全身图像之间的对应关系; 聚类模块, 用于对所述多个面部图像的特 征向量进行聚类, 得到多个面部类别簇; 以及 标注模块, 用于根据 所述多个全身图像、 所述对应关系以及所述多个面部类别簇, 得到 所述多个全身图像各自的标签信息 。权 利 要 求 书 1/2 页 2 CN 114926713 A 28.根据权利要求7所述的装置, 其中, 每个所述面部类别簇包括同一对象的N个面部 图 像, N为大于等于1的整数; 所述标注模块包括: 确定单元, 用于根据所述对应关系, 确定所述面部类别簇中N个面部图像所对应的N个 全身图像; 匹配单元, 用于根据所述N个全身图像的第一特征向量从所述多个全身图像中确定与 所述N个全身图像相匹配的M个全身图像; M为大于等于1的整数; 以及 添加单元, 用于对所述 N个全身图像与所述M个全身图像添加标签信息 。 9.根据权利要求8所述的装置, 其中, 所述匹配单 元包括: 计算子单元, 用于分别确定所述N个全身图像的第一特征向量与所述多个全身图像的 第二特征向量之间的相似度; 以及 确定子单元, 用于在所述相似度大于等于预定阈值的情况下, 根据所述相似度的大小 顺序, 执行从所述多个全身图像中确定与所述 N个全身图像相匹配的M个全身图像的操作。 10.根据权利要求8所述的装置, 所述装置还 包括: 去除模块, 用于在对所述N个全身图像与所述M个全身图像添加标签信息之前, 响应于 检测到所述N个全身图像与所述M个全身图像中存在重复的全身图像, 对所述N个全身图像 与所述M个全身图像执 行去重处 理。 11.一种深度学习模型的训练装置, 包括: 第二获取模块, 用于获取样本图像数据; 检测模块, 用于将所述样本 图像数据输入所述深度学习模型, 得到所述样本 图像数据 的检测结果; 以及 训练模块, 用于根据所述检测结果与所述样本 图像数据的标签信息之间的差异值, 对 所述深度学习模型进行训练; 其中, 所述样本图像数据是利用权利要求7~10中任一项所述的装置生成的。 12.一种目标对象检测装置, 包括: 目标检测模块, 用于将待处理图像输入深度学习模型, 得到所述待处理图像中目标对 象的检测结果; 其中, 所述深度学习模型 是利用权利要求1 1所述的装置训练得到的。 13.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1~6中任一项所述的方法。 14.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1~6中任一项所述的方法。 15.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1~6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114926713 A 3

.PDF文档 专利 样本图像数据生成方法、模型的训练方法和装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 样本图像数据生成方法、模型的训练方法和装置 第 1 页 专利 样本图像数据生成方法、模型的训练方法和装置 第 2 页 专利 样本图像数据生成方法、模型的训练方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。