行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210593234.6 (22)申请日 2022.05.27 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 朱雄威 孙逸鹏 姚锟  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 金爱静 武晨燕 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 物体识别模型的训练方法、 装置、 设备以及 存储介质 (57)摘要 本公开提供了物体识别模型的训练方法、 装 置、 设备以及存储介质, 涉及人工智能技术领域, 具体为深度学习、 图像处理、 计算机视觉技术领 域, 可应用于OCR、 物体检测等场景。 具体实现方 案为: 根据各图像组对应的采样概率, 对各该图 像组中的物体图像进行采样得到训练样本集合, 其中, 该图像组是根据图像尺寸确定的, 该图像 组的采样概率是根据该图像组内的图像数量确 定的; 以及采用该训练样本集合, 对待训练的物 体识别模型进行训练, 得到训练后的物体识别模 型。 本公开实施例中, 图像组是按照图像尺寸划 分的, 并且图像组具有对应的采样概率, 这样采 样得到训练样本集合中的样本更加均衡, 能够提 高训练得到物体识别模型的识别准确性。 权利要求书3页 说明书10页 附图6页 CN 114926688 A 2022.08.19 CN 114926688 A 1.一种物体识别模型的训练方法, 包括: 根据各图像组对应的采样概率, 对各所述图像组中的物体图像进行采样得到训练样本 集合, 其中, 所述图像组是根据图像尺寸确定的, 所述图像组的采样概率是根据所述图像组 内的图像数量确定的; 以及 采用所述训练样本集合, 对待训练的物体识别模型进行训练, 得到训练后的物体识别 模型。 2.根据权利要求1所述的方法, 还 包括: 将待处理样本图像输入目标检测模型进行识别, 得到所述待处理样本图像的检测框和 所述待处 理样本图像的类别 信息; 以及 利用所述检测框从所述待处 理样本图像中提取物体图像; 其中, 不同尺寸的检测框提取 出的物体图像的尺寸 不同。 3.根据权利要求1或2所述的方法, 其中, 所述物体图像的尺寸包括所述物体图像的宽 和高, 所述方法还 包括: 根据第一类别 中待分组物体图像的宽高比, 计算所述待分组物体图像的分组标识; 以 及 在所述分组标识属于第 一分组标识范围的情况下, 将所述待分组物体图像加入第 一图 像组。 4.根据权利要求3所述的方法, 还 包括: 根据所述第一图像组内的物体图像的第一数量和所述第一类别包括的物体图像的总 量, 确定所述第一图像组对应的第一采样概 率。 5.根据权利要求4所述的方法, 其中, 所述第 一采样概率等于所述总量与所述第 一数量 的差值除以所述总量。 6.根据权利要求1至5中任一项所述的方法, 采用所述训练样本集合, 对待训练的物体 识别模型进行训练, 包括: 将所述训练样本集 合中的物体图像调整为统一尺寸; 将调整后的物体图像, 输入所述待训练的物体识别模型进行训练, 得到所述训练后的 物体识别模型。 7.一种物体识别方法, 包括: 将待识别物体图像输入物体识别模型进行识别, 得到物体识别结果; 其中, 所述物体识别模型是采用权利要求1至6中任一项所述的物体识别模型的训练方 法得到的训练后的物体识别模型。 8.根据权利要求7 所述的方法, 还 包括: 将待识别图像输入目标检测模型进行识别, 得到所述待识别图像的检测框和类别信 息; 以及 利用所述检测框从所述待识别图像中提取待识别物体图像。 9.根据权利要求8所述的方法, 还 包括: 将所述待识别物体图像调整为统一尺寸。 10.一种物体识别模型的训练装置, 包括: 采样模块, 用于根据各图像组对应的采样概率, 对各所述图像组中的物体图像进行采权 利 要 求 书 1/3 页 2 CN 114926688 A 2样得到训练样本集合, 其中, 所述图像组是根据图像尺寸确定的, 所述图像组的采样概率是 根据所述图像组内的图像数量确定的; 以及 训练模块, 用于采用所述训练样本集合, 对待训练的物体识别模型进行训练, 得到训练 后的物体识别模型。 11.根据权利要求10所述的装置, 还 包括: 第一识别模块, 用于将待处理样本 图像输入目标检测模型进行识别, 得到所述待处理 样本图像的检测框和所述待处 理样本图像的类别 信息; 以及 第一提取模块, 用于利用所述检测框从所述待处 理样本图像中提取物体图像; 其中, 不同尺寸的检测框提取 出的物体图像的尺寸 不同。 12.根据权利要求10或11所述的装置, 其中, 所述物体图像的尺寸包括所述物体图像的 宽和高, 所述装置还 包括: 计算模块, 用于根据第一类别 中待分组物体图像的宽高比, 计算所述待分组物体图像 的分组标识; 以及 分组模块, 用于在所述分组标识属于第一分组标识范围的情况下, 将所述待分组物体 图像加入第一图像组。 13.根据权利要求12所述的装置, 还 包括: 确定模块, 用于根据 所述第一图像组内的物体图像的第 一数量和所述第 一类别包括的 物体图像的总量, 确定所述第一图像组对应的第一采样概 率。 14.根据权利要求13所述的装置, 其中, 所述第 一采样概率等于所述总量与 所述第一数 量的差值除以所述总量。 15.根据权利要求10 至14中任一项所述的装置, 所述训练模, 包括: 调整子模块, 用于将所述训练样本集 合中的物体图像调整为统一尺寸; 训练子模块, 用于将调整后的物体图像, 输入所述待训练的物体识别模型进行训练, 得 到所述训练后的物体识别模型。 16.一种物体识别装置, 包括: 第二识别模, 用于将待识别物体图像输入物体识别模型进行识别, 得到物体识别结果; 其中, 所述物体识别模型是采用权利要求10至15中任一项所述的物体识别模型的训练 装置得到的训练后的物体识别模型。 17.根据权利要求16所述的装置, 还 包括: 输入模块, 用于将待识别图像输入目标检测模型进行识别, 得到所述待识别图像的检 测框和类别 信息; 以及 第二提取模块, 用于利用所述检测框从所述待识别图像中提取待识别物体图像。 18.根据权利要求17 所述的装置, 还 包括: 调整模块, 用于将所述待识别物体图像调整为统一尺寸。 19.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/3 页 3 CN 114926688 A 3

.PDF文档 专利 物体识别模型的训练方法、装置、设备以及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 物体识别模型的训练方法、装置、设备以及存储介质 第 1 页 专利 物体识别模型的训练方法、装置、设备以及存储介质 第 2 页 专利 物体识别模型的训练方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。