行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210716242.5 (22)申请日 2022.06.22 (71)申请人 商汤集团有限公司 地址 中国香港新界沙田香港科 学园科技大 道西一号核心大楼第二座2楼226-230 室 (72)发明人 于博文 刘思诚 张伟 旷章辉  冯俐铜 王新江 李治中  (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 专利代理师 王花丽 徐川 (51)Int.Cl. G06V 20/40(2022.01) G06V 40/10(2022.01) G06V 40/16(2022.01)G06V 10/56(2022.01) G06V 10/54(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) (54)发明名称 视频服饰 检测方法、 装置及设备 (57)摘要 本公开实施例公开了一种视频服饰检测方 法、 装置及设备, 其中, 所述方法包括: 对待处理 视频的多个视频帧进行分区, 确定每一所述视频 帧对应的分区信息; 对每一所述视频帧进行检 测, 得到每一所述视频帧中目标人物对应的检测 结果; 所述检测结果包括所述视频帧中所述目标 人物的人物信息和所述目标人物对应的服饰信 息; 基于每一所述视频帧对应的分区信息, 对相 同分区内的视频帧的检测结果进行校正, 得到每 一所述视频帧对应的目标检测结果; 其中, 相同 分区内的视频帧对应的目标检测结果针对目标 人物的检测结果相同。 权利要求书5页 说明书26页 附图9页 CN 115049962 A 2022.09.13 CN 115049962 A 1.一种视频服饰 检测方法, 其特 征在于, 所述方法包括: 对待处理视频的多个视频帧进行分区, 确定每一所述视频帧对应的分区信息; 对每一所述视频帧进行检测, 得到每一所述视频帧中目标人物对应的检测结果; 所述 检测结果包括所述视频帧中所述目标 人物的人物信息和所述目标 人物对应的服饰信息; 基于每一所述视频帧对应的分区信息, 对相同分区内的视频帧的检测结果进行校正, 得到每一所述视频帧对应的目标检测结果; 其中, 相同分区内的视频帧对应的目标检测结 果针对目标 人物的检测结果相同。 2.根据权利要求1所述的方法, 其特征在于, 所述对待处理视频的多个视频帧进行分 区, 确定每一所述视频帧对应的分区信息, 包括: 获取所述待处 理视频对应的多个视频帧; 基于每一所述视频帧对应的相邻视频帧集合, 确定每一所述视频帧对应的变化类别; 所述变化类别用于表征 所述视频帧相对于对应的相邻视频帧的变化 程度; 基于每一所述视频帧对应的变化类别, 对所述多个视频帧进行划分, 得到每一视频帧 对应的分区信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述基于每一所述视频帧对应的相邻 视频 帧集合, 确定每一所述视频帧对应的变化类别, 包括: 针对每一所述视频帧, 将与所述视频 帧相邻的至少一个视频帧作为所述视频帧对应的相邻视频帧集合; 将所述视频帧对应的相 邻视频帧集 合输入训练后的视频分割网络, 得到所述视频帧对应的变化类别; 和/或, 所述变化类别包括表征第 一变化程度的第 一类别和表征第 二变化程度的第 二类别; 所 述第二变化程度高于所述第一变化程度; 所述基于每一所述视频帧对应的变化类别, 对所 述多个视频帧进行划分, 得到每一视频帧对应的分区信息, 包括: 基于所述多个视频帧对应 的时序关系, 对每一所述变化类别对应的视频帧进 行聚类, 得到至少一个视频帧集合; 所述 视频帧集合中包括一个视频帧或连续的至少两个视频帧, 且所述连续的至少两个视频帧具 有相同的变化类别; 将位于目标视频帧集合的中心的视频帧作为划分基准, 对所述多个视 频帧进行划分, 得到每一所述视频帧对应的分区信息; 所述 目标视频帧集合为所述第二类 别的视频帧集 合。 4.根据权利要求1至3任一项所述的方法, 其特征在于, 所述对每一所述视频帧进行检 测, 得到每一所述视频帧中目标 人物对应的检测结果, 包括: 针对每一所述视频帧, 对所述视频帧进行人物检测, 确定所述视频帧中所述目标人物 对应的人物信息; 对所述视频帧进行服饰 检测, 确定所述目标 人物对应的服饰的服饰信息 。 5.根据权利要求4所述的方法, 其特征在于, 所述对所述视频帧进行人物检测, 确定所 述视频帧中所述目标 人物对应的人物信息, 包括: 对所述视频帧进行 人脸探测, 确定所述视频帧中人脸对应的人脸图像; 对所述人脸图像进行 人脸特征提取, 得到所述人脸对应的待匹配人脸特 征; 获取预设的人脸特征库, 所述人脸特征库包括至少一个预设人物和每一所述预设人物 对应的人物信息和多个人脸特 征; 基于所述待匹配人脸特征与每一所述预设人物对应的多个人脸特征之间的特征距离,权 利 要 求 书 1/5 页 2 CN 115049962 A 2在所述多个预设人物中确定所述人脸对应的目标预设人物, 将所述目标预设人物对应的人 物信息确定为所述目标 人物对应的人物信息 。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述待匹配人脸特征与每一所述 预设人物对应的多个人脸特征之间的特征距离, 在所述多个预设人物中确定所述人脸对应 的目标预设人物, 包括: 针对每一所述预设人物, 分别确定所述待 匹配人脸特征和所述预设人物对应的每一所 述人脸特 征之间的特 征距离; 比对每一所述人脸特征的特征距离和预设的距离 阈值, 确定每一所述人脸特征对应的 相似结果; 所述相似结果用于表征 所述人脸是否对应所述人脸特 征对应的预设人物; 基于每一所述人脸特征对应的相似结果, 在所述多个预设人物中确定所述人脸对应的 目标预设人物。 7.根据权利要求6所述的方法, 其特征在于, 所述基于每一所述人脸特征对应的相似结 果, 在所述多个预设人物中确定所述人脸对应的目标 预设人物, 包括: 在第一相似结果均对应一个已匹配预设人物的情况下, 将所述已匹配预设人物确定为 所述目标 预设人物; 所述第一相似结果表征 所述人脸对应所述人脸特 征对应的预设人物; 在第一相似结果对应至少两个已匹配预设人物的情况下, 基于所述待 匹配人脸特征与 每一所述已匹配预设人物对应的多个人脸特征的特征距离和, 在所述至少两个已匹配预设 人物中确定所述目标 预设人物。 8.根据权利要求4至7任一项所述的方法, 其特征在于, 所述服饰信息包括服饰的服饰 类别, 所述对所述视频帧进行服饰 检测, 确定所述目标 人物对应的服饰的服饰信息, 包括: 提取所述视频帧对应的服饰特 征图; 基于所述 服饰特征图, 确定所述视频帧中服饰对应的检测框信息; 基于所述 服饰对应的检测框信息, 确定所述 服饰对应的服饰特 征; 基于所述 服饰对应的服饰特 征, 确定所述 服饰的服饰 类别。 9.根据权利要求8所述的方法, 其特征在于, 所述基于所述服饰对应的检测框信息, 确 定所述服饰对应的服饰特征, 包括: 基于所述服饰对应的检测框信息, 从所述视频帧中截取 所述服饰对应的服饰图片; 对所述 服饰图片进行 特征提取, 得到所述 服饰对应的服饰特 征; 和/或, 所述服饰特征包括多个服饰子特征; 所述基于所述服饰对应的检测框信息, 确定所述 服饰对应的服饰特征, 包括: 基于所述服饰对应的检测框信息, 从所述视频帧中截取所述服 饰对应的服饰图片; 对所述服饰图片进行数据增强处理, 得到所述服饰对应的至少一个相 似服饰图片; 对所述服饰图片和所述至少一个相似服饰图片进行特征提取, 得到所述服饰 对应的多个服饰子特 征; 和/或, 所述服饰信息包括所述服饰的数据信息; 所述对所述视频帧进行服饰检测, 确定所述 目标人物对应的服饰的服饰信息, 还包括: 基于预设服饰库的数据量在第一检索策略和第 二检索策略中确定目标检索策略; 所述第一检索策略对应的数据量高于所述第二检索策略 对应的数据量; 所述预设服饰库包括多个预设服饰和每一所述预设服饰对应的数据信息; 利用所述目标检索策略, 在所述多个预设服饰中确定与所述服饰匹配的至少一个预设服权 利 要 求 书 2/5 页 3 CN 115049962 A 3

.PDF文档 专利 视频服饰检测方法、装置及设备

文档预览
中文文档 41 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共41页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频服饰检测方法、装置及设备 第 1 页 专利 视频服饰检测方法、装置及设备 第 2 页 专利 视频服饰检测方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。