行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211043065.5 (22)申请日 2022.08.29 (71)申请人 阿里巴巴达摩院 (杭州) 科技有限公 司 地址 310000 浙江省杭州市余杭区五常街 道文一西路969号3幢5层516室 (72)发明人 何天宇 金鑫 沈旭 黄建强  余文杰  (74)专利代理 机构 广州铸智知识产权代理有限 公司 44886 专利代理师 徐瑞红 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01)G06V 10/40(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 对象识别模型的训练方法、 对象识别的方 法、 电子设备 (57)摘要 本申请提供了一种对象识别模型的训练方 法、 对象识别的方法、 图像识别方法、 电子设备及 存储介质, 对象识别模型的训练方法是利用经过 伪标签标注后的第一图像样本集合对初始模型 进行第一阶段训练, 得到初步训练后的模型; 伪 标签是利用未标注的第一图像样 本集合确定的; 利用经过软标签标注后的第二图像样本集合对 初步训练后的模 型进行第二阶段训练, 获得对象 识别模型; 软标签是利用未标注的第一图像样本 集合和未标注的第二图像样本集合确定的。 本申 请实施例提供的图像识别方法把对于对象识别 模型的训练过程拆 分为两个阶段。 在第二阶段可 以直接利用第一阶段的伪标签得到软标签。 第二 阶段无需再进行聚类计算, 从而节省聚类计算导 致的计算 开销。 权利要求书2页 说明书13页 附图5页 CN 115393673 A 2022.11.25 CN 115393673 A 1.一种对象识别的方法, 其特 征在于, 包括: 获取候选图像; 将包含目标对象的参照图像和所述候选图像输入至预先训练好的对象识别模型, 识别 出包含所述目标对象的候选图像。 2.根据权利要求1所述的方法, 其特 征在于, 还 包括: 利用所述包含所述目标对象的候选 图像, 确定所述目标对象的相关信息; 所述相关信 息包括所述目标对象的标识信息和所述目标对象的位置信息中的至少一种。 3.一种对象识别模型的训练方法, 其特 征在于, 包括: 利用经过伪标签标注后的第 一图像样本集合对初始模型进行第 一阶段训练, 得到初步 训练后的模型; 所述伪标签是利用未 标注的第一图像样本集 合确定的; 利用经过软标签标注后的第二图像样本集合对所述初步训练后的模型进行第二阶段 训练, 获得对 象识别模型; 所述软标签是利用所述未标注的第一图像样本集合和未标注的 第二图像样本集 合确定的。 4.根据权利要求3所述的方法, 其特 征在于, 所述伪标签的确定方式, 包括: 利用所述初始模型提取所述未标注的第 一图像样本集合的特征, 得到第 一特征提取结 果; 将所述第一特征提取结果进行聚类处理, 得到至少一个特征簇; 所述特征簇用于表征 候选对象的特征, 所述候选对象是出现在所述未标注的第一图像样本集合的各图像样本中 的对象; 根据所述特 征簇确定伪标签。 5.根据权利要求3所述的方法, 其特 征在于, 所述软 标签的确定方式, 包括: 利用所述初步训练后的模型对所述未标注的第 二图像样本集合进行特征提取, 得到第 二特征提取结果; 利用所述第二特征提取结果与类中心 的相似性, 确定软标签; 所述类中心是利用所述 未标注的第一图像样本集 合确定的, 所述类中心用于表征 特征。 6.根据权利要求5所述的方法, 其特 征在于, 所述类中心的确定方式, 包括: 利用所述初始模型提取所述未标注的第 一图像样本集合的特征, 得到第 一特征提取结 果; 将所述第一特征提取结果进行聚类处理, 得到至少一个特征簇; 所述特征簇用于表征 候选对象的特征, 所述候选对象是出现在所述未标注的第一图像样本集合的各图像样本中 的对象; 分别对每 个所述特 征簇进行类中心计算, 得到对应的类中心计算结果。 7.根据权利要求5或6所述的方法, 其特 征在于, 还 包括对所述类中心进行 更新的步骤: 所述对所述类中心进行 更新的步骤, 包括: 利用所述初步训练后的模型对所述经过伪标签标注后的第一图像样本集合进行特征 提取, 得到第三特 征提取结果; 利用所述第三特 征提取结果对所述类中心进行 更新。 8.根据权利要求3所述的方法, 其特征在于, 在所述第二阶段训练的过程中, 满足指定 条件的情况 下, 获得对象识别模型;权 利 要 求 书 1/2 页 2 CN 115393673 A 2所述指定条件是根据指定类型的损失函数的收敛情况确定的; 所述损失函数 是在所述第二阶段训练过程中的模型计算得到的; 所述指定类型的损失函数包括加权三元损失函数和一 致性损失函数中的至少一种。 9.根据权利要求3所述的方法, 其特征在于, 所述第 二图像样本集合中的样本数量是所 述第一图像样本集 合中的样本数量的n 倍; 所述n>1。 10.一种图像识别的方法, 应用于增强现实设备和/或虚拟现实设备, 其特征在于, 包 括: 获取候选图像; 将包含目标对象的参照图像和所述候选图像输入至预先训练好的对象识别模型, 识别 出包含所述目标对象的候选图像; 将所述包含所述目标对象的候选图像渲染至所述增强现实设备和/或虚拟现实设备的 显示器上。 11.一种对象识别的装置, 其特 征在于, 包括: 获取模块, 用于获取候选图像; 识别模块, 用于将包含目标对象的参照图像和所述候选图像输入至预先训练好的对象 识别模型, 识别出包 含所述目标对象的候选图像。 12.一种对象识别模型的训练装置, 其特 征在于, 包括: 第一阶段训练模块, 用于利用经过伪标签标注后的第 一图像样本集合对初始模型进行 第一阶段训练, 得到初步训练后的模型; 所述伪标签是利用未标注的第一图像样本集合确 定的; 第二阶段训练模块, 用于利用经过软标签标注后的第 二图像样本集合对所述初步训练 后的模型进行第二阶段训练, 获得对 象识别模型; 所述软标签是利用所述未标注的第一图 像样本集 合和未标注的第二图像样本集 合确定的。 13.一种电子设备, 包括存储器、 处理器及存储在存储器上的计算机程序, 所述处理器 在执行所述计算机程序时实现权利要求1至9中任一项所述的方法。 14.一种计算机可读存储介质, 所述计算机可读存储介质内存储有计算机程序, 所述计 算机程序被处 理器执行时实现权利要求1至9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115393673 A 3

.PDF文档 专利 对象识别模型的训练方法、对象识别的方法、电子设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对象识别模型的训练方法、对象识别的方法、电子设备 第 1 页 专利 对象识别模型的训练方法、对象识别的方法、电子设备 第 2 页 专利 对象识别模型的训练方法、对象识别的方法、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。