行业标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210595785.6 (22)申请日 2022.05.30 (65)同一申请的已公布的文献号 申请公布号 CN 114677568 A (43)申请公布日 2022.06.28 (73)专利权人 山东极视角科技有限公司 地址 266000 山东省青岛市黄岛区庐山路 57号经控大厦3层 (72)发明人 何超 邓富城  (74)专利代理 机构 深圳腾文知识产权代理有限 公司 44680 专利代理师 杨彩兰 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/762(2022.01)G06V 10/82(2022.01) G06V 10/42(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (56)对比文件 CN 114445482 A,202 2.05.06 CN 112861744 A,2021.0 5.28 审查员 崔蓝芳 (54)发明名称 一种基于神经网络的线性目标检测方法、 模 块及系统 (57)摘要 本申请公开了一种基于神经网络的线性目 标检测方法、 模块及系统, 用于提高线性目标的 检测精度。 本申请方法包括: 获取待检测图像; 将 待检测图像输入线性目标检测模 型, 所述线性目 标检测模型通过提取线性目标图像样本的线性 特征, 并根据线性特征所包含的角度、 长度确定 锚点后, 基于所述锚点和所述线性特征所包含的 角度、 长度、 中心以及类型训练得到, 所述线 性特 征为线性目标图像样本中包含的线性目标的特 征, 所述角度为所述线性目标与水平方向的夹 角, 所述长度为所述线性目标的长度, 所述中心 为所述线性目标的中点; 通过所述线性目标检测 模型确定 所述待检测图像的线性特征预测值; 根 据所述线性特征预测值确定所述待检测图像的 线性目标检测结果。 权利要求书4页 说明书16页 附图4页 CN 114677568 B 2022.08.23 CN 114677568 B 1.一种基于神经网络的线性目标检测方法, 其特 征在于, 所述线性目标检测方法包括: 构建线性目标图像集, 所述线性目标图像集包括若干张线性目标图像样本, 且每张线 性目标图像样本标注有其线性目标 所对应的中心、 角度、 长度以及类型; 分别对所述长度和所述角度进行聚类, 确定m个长度聚类中心和n个角度聚类中心; 将所述m个长度聚类中心和n个角度聚类中心作为锚点构建基于神经网络的线性目标 检测模型; 将所述线性目标图像样本输入线性特征提取骨干网络进行线性特征提取并转换为特 征图, 所述特征图的宽*高为S*S, 所述线性目标检测模型包括所述线性特征提取骨干网络 和线性目标检测网络; 根据所述线性特征确定所述特征图中包含的线性目标的标注目标, 所述标注目标的各 项数值为(gcx,gcy,glength,gtheta,gc), 其中, (gcx,gcy) 为目标中心点坐标、 glength为目标长度、 gtheta为目标角度、 gc为目标类别 信息; 根据所述目标中心点 坐标 (gcx,gcy) 确定其左上角的整数坐标(gcxi,gcyj); 基于所述整数坐标将所述标注目标的目标角度与n个锚点角度(T1,T2,…,Tn)进行匹 配, 确定与所述目标角度最接近的锚点角度Ti; 将所述标注目标的目标长度与m个锚点长度 (L1,L2,…,Lm)进行匹配, 确定与所述目标长度最接 近的锚点长度Lj; 根据所述锚点角度Ti与所述锚点长度Lj确定目标锚点(Ti,Lj); 基于所述目标锚点(Ti,Lj)利用所述线性目标检测网络对所述标注目标进行训练; 根据训练结果在尺寸为(m*n)*S*S*C的目标特征图上, 根据位置(i*m+n,gcyj,gcxi)处的 C维向量确定所述标注目标的目标预测值(px,py,plength,ptheta,pobj,pc1,…,pck), 其中, (px, py) 为中心点坐标的预测值, plength为长度预测值, ptheta为角度预测值, pobj用于预测是否存 在线性目标; pc1,…,pck为类别预测值, 所述C为通道数, 所述C的值为5+K, 所述K代表所述线 性目标的类别数; 根据标注坐标、 所述左上角的整数坐标以及所述目标 预测值计算损失函数; 根据所述损失函数利用反 向传播算法对所述线性目标检测网络进行优化更新, 并循环 迭代输入所述线性目标图像集中的线性目标图像样本进行训练, 直到所述损失函数的值达 到最小化, 得到训练后的线性目标检测模型, 所述损失函数通过中心预测损失、 长度预测损 失、 角度预测损失、 目标损失以及类别预测损失构成; 获取待检测图像; 将所述待检测图像输入线性目标检测模型, 所述线性目标检测模型通过提取线性目标 图像样本的线性特征, 并根据所述线性特征所包含的角度、 长度确定锚点后, 基于所述锚点 和所述线性特征所包含的角度、 长度、 中心以及类型训练得到, 所述线性特征为所述线性目 标图像样本中包含的线性 目标的特征, 所述角度为所述线性 目标与水平方向的夹角, 所述 长度为所述线性目标的长度, 所述中心为所述线性目标的中点; 通过所述线性目标检测模型确定所述待检测图像的线性特 征预测值; 根据所述线性特 征预测值确定所述待检测图像的线性目标检测结果。 2.根据权利要求1所述的线性目标检测方法, 其特征在于, 所述构建线性目标图像集包 括: 获取若干张包 含线性目标的线性目标图像样本; 对所述线性目标图像样本进行线性目标的端点 坐标及类型 标注;权 利 要 求 书 1/4 页 2 CN 114677568 B 2根据所述端点 坐标和目标转换公式确定所述线性目标的中心、 角度及长度; 根据标注后的线性目标图像样本构建线性目标图像集; 所述目标转换公式为: 其中, L为长度, (Cx,Cy)为中心, T为角度, (x1, y1) 和 (x2, y2) 为线性目标的两端点 坐标。 3.根据权利要求1所述的线性目标检测方法, 其特征在于, 所述损失函数通过中心预测 损失、 长度预测损失、 角度预测损失、 目标损失以及类别预测损失构成; 所述目标损失包括是否存在目标的预测损失和 确定不存在目标的损失; 所述损失函数公式为: Ls=γ1 Lxy+γ2 Llength+ γ3 Ltheta+γ4 Lobj+ γ5 Lcls+ γ6 Lnobj, 其中, γi表示加权的权 重值; 中心预测损失为 Lxy=SMOOTHL1((px,py),(gcx‑gcxi,gcy‑gcyj)); 长度预测损失为 Llength=SMOOTHL1(plength,glength/Lj); 角度预测损失为 Ltheta=SMOOTHL1(ptheta,gtheta/Ti) 是否存在目标的预测损失为 Lobj=BCE(pobj,1); 确定不存在目标的损失为 Lnobj=BCE(pobj,0); 类别预测损失为 Lcls=BCE((pc1,…,pck),gc)。 4.根据权利要求1至3中任一项所述的线性目标检测方法, 其特征在于, 所述通过所述 线性目标检测模型确定所述待检测图像的线性特 征预测值包括: 通过所述线性目标检测模型确定所述待检测图像的待检测目标特征, 并获取目标特征 图; 根据所述待检测目标 特征遍历并匹配所述目标 特征图中包 含的全部锚点; 根据匹配结果确定匹配锚点, 并根据所述匹配锚点确定线性特 征预测值。 5.根据权利要求1至3中任一项所述的线性目标检测方法, 其特征在于, 所述根据所述 线性特征预测值确定所述待检测图像的线性目标检测结果包括: 根据所述线性特 征预测值判断是否存在线性目标; 若存在, 则根据 所述线性特征预测值和线性目标还原公式输出所述待检测图像的线性 目标检测结果, 所述线性目标检测结果包括角度、 长度、 中心及类型。 6.一种线性特征提取模块, 其特征在于, 所述模块用于权利要求1至5中任一项所述的 线性目标检测方法中的线性特 征提取, 所述模块包括: 输入端、 1*1卷积模块、 1*3卷积模块、 3*1卷积模块、 堆叠操作模块、 3*3卷积模块以及输 出端; 所述输入端与所述1*1卷积模块连接; 所述1*1卷积模块分别与所述1*3卷积模块、 所述3*1卷积模块连接, 所述1*3卷积模块 用于提取偏向竖直方向的线性梯度信息, 所述3*1卷积模块用于提取偏向水平方向的线性权 利 要 求 书 2/4 页 3 CN 114677568 B 3

.PDF文档 专利 一种基于神经网络的线性目标检测方法、模块及系统

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于神经网络的线性目标检测方法、模块及系统 第 1 页 专利 一种基于神经网络的线性目标检测方法、模块及系统 第 2 页 专利 一种基于神经网络的线性目标检测方法、模块及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:55:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。