行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210751621.8 (22)申请日 2022.06.28 (71)申请人 成都信息工程大学 地址 610225 四川省成 都市双流区航空港 经济开发区学府路一段24 号 (72)发明人 马忠丽 曾钥涵 吴丽丽 万毅  李嘉迪 张锦宇  (74)专利代理 机构 北京卓胜佰达知识产权代理 有限公司 16 026 专利代理师 杨洋 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/42(2022.01) (54)发明名称 水面多尺度目标检测方法、 装置及系统和存 储介质 (57)摘要 本发明公开一种水面多尺度目标检测方法、 装置及系统和存储介质, 建立了一个涵盖十类、 近一万两千张图片的水面目标数据集, 首先对数 据集中的目标框进行提取优化, 得到尺度分布更 广的预设目标框; 然后 在主干网络嵌入双重注意 力机制, 改善目标多尺度导致的大、 小目标检测 精度差异过大的问题; 同时使用改进的金字塔池 化模块, 增强模型分割不同尺度目标的感知能 力, 改善普通下采样方法导致分辨率下降、 局部 信息丢失的问题; 最后加入分类损失函数, 改善 由于数据样本类别不均衡导致的过拟合与准确 性差的问题。 结果表明该检测方法对 水面多尺度 目标的检测精度高, 漏检率低。 权利要求书2页 说明书7页 附图6页 CN 115115863 A 2022.09.27 CN 115115863 A 1.一种水面多尺度目标检测方法, 其特 征在于, 所述方法包括: 图像预处理: 获取若干张图片, 分别 对各张图片随机缩放、 随机裁剪、 随机排布, 并进行 图片和先验框的拼接; 预设目标框优化: 初始化聚类中心, 从输入的数据集中随机选取一个样本点作为第一 个中心点, 对每一个样本点分别计算到已选取 的中心点的距离, 按照轮盘法重新选择新的 聚类中心, 不断迭代重复, 直至所有样本点归属类别都没有发生变化时停止; 多尺度特征提取: 将预处理后的图像经过3 ×3的卷积操作之后得到低层全局特征图 FCONV1, 然后将所述全局特征图FCONV1经过归一化处理后, 再通过激活函数得到特征图FCONV2; 加入双重注意力 机制, 通过通道注意力模块和空间注意力模块, 使所述特征图FCONV2沿着通 道和空间两个独立的维度依次推断注意力图, 然后 将注意力图与输入特征图相乘以进 行自 适应特征; 将获得的特征图经过改进的金字塔池化模块, 统一采用3 ×3的最大池化的方式, 引入不同的膨胀率 来获取不同尺度的感受野, 提取多尺度的特 征信息; 多尺度特征融合: Neck层自顶向下传达强语义特征, 特征金字塔则自底向上传达强定 位特征, 从不同的主干层对不同的检测层进行多尺度特 征融合; 多尺度图像预测: 使用融合后的各种尺度的特 征图分别预测不同大小的物体; 损失计算: 采用分类损 失函数来计算, 以改善由于样本分类不均导致的过拟合与准确 度低的问题, 提升检测框的回归精度, 得到最终的目标检测网络 。 2.根据权利要求1所述的方法, 其特征在于, 所述方法的检测类别标签至少包括军舰、 邮轮、 货轮、 帆船、 游艇、 其 他船、 人、 鸟、 鱼。 3.根据权利要求1所述的方法, 其特 征在于, 所述预设目标框优化的计算公式为: 其中R(x)为计算初始聚类中心点到每一个数据样本xi的距离, P(x)为每个样本成为下 一个聚类中心的概 率。 4.根据权利要求1所述的方法, 其特征在于, 所述通道注意力模块和空间注意力模块的 关注过程如下公式所示: 其中A表示输入特征图, Nc为一维通道注意图, A'表示一维通道输出特征图, Ns为二维空 间注意图, 表示逐元素相乘; 在乘法过程中, 注意值会相应地广播: 频道注意值是沿空间 维度广播的, 反 之亦然; A ”是最终的改进后的输出。 5.根据权利要求1所述的方法, 其特征在于, 所述改进的金字塔池化模块以不同的膨化 率采样特征图片, 对于给定的输入以不同膨化率的空洞卷积并行采样, 将得到的结果在通 道层面合并在一 起, 扩大通道数, 接着再通过1 ×1的卷积将通道数降低到预期的数值。 6.根据权利要求1所述的方法, 其特 征在于, 所述分类损失函数为: 其中s表示真实样本的标签; t表示经过so ftmax函数的预测输出值; 为平衡因子, η是 在二分类交叉熵的基础上加入的因子, 若η>0, 代表易分类样本损失会降低, 网络对困难样权 利 要 求 书 1/2 页 2 CN 115115863 A 2本且易错分的样本给予更多关注, 以降低易分类样本在网络训练时产生的影响。 7.一种水面多尺度目标检测装置, 其特 征在于, 所述装置包括: 图像预处理模块, 被配置为获取若干张图片, 分别对各张图片随机缩放、 随机裁剪、 随 机排布, 并进行图片和先验框的拼接; 预设目标框优化模块, 被配置为初始化聚类中心, 从输入的数据集中随机选取一个样 本点作为第一个中心点, 对每一个样本点分别计算到已选取 的中心点的距离, 按照轮盘法 重新选择新的聚类中心, 不断迭代重复, 直至所有样本点归属类别都没有发生变化时停止; 多尺度特征提取模块, 被配置为将预处理后的图像经过3 ×3的卷积操作之后得到低层 全局特征图FCONV1, 然后将所述全局特征图FCONV1经过归一化处理后, 再通过激活函数得到特 征图FCONV2; 加入双重注意力机制, 通过通道注意力模块和空间注意力模块, 使所述特征图 FCONV2沿着通道和空间两个独 立的维度依次推断注意力图, 然后将 注意力图与输入特征图相 乘以进行自适应特征; 将获得的特征图经过改进的金字塔池化模块, 统一采用3 ×3的最大 池化的方式, 引入不同的膨胀率 来获取不同尺度的感受野, 提取多尺度的特 征信息; 多尺度特征融合模块, 被配置为Neck层自顶向下传达强语义特征, 特征金字塔则自底 向上传达强定位特 征, 从不同的主干层对不同的检测层进行多尺度特 征融合; 多尺度图像预测模块, 被配置为使用融合后的各种尺度的特征图分别预测不同大小的 物体; 损失计算模块, 被配置为采用分类损 失函数来计算, 以改善由于样本分类不均导致的 过拟合与准确度低的问题, 提升检测框的回归精度, 得到最终的目标检测网络 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述分类损失函数为: 其中s表示真实样本的标签; t表示经过so ftmax函数的预测输出值; 为平衡因子, η是 在二分类交叉熵的基础上加入的因子, 若η>0, 代表易分类样本损失会降低, 网络对困难样 本且易错分的样本给予更多关注, 以降低易分类样本在网络训练时产生的影响。 9.一种水面多尺度目标检测系统, 其特 征在于: 所述系统包括: 存储器, 用于存 储计算机程序; 处理器, 用于执 行所述计算机程序以实现如权利要求1至 6中任一项所述的方法。 10.一种存储有指令的非暂时性计算机可读存储介质, 当所述指令由处理器执行时, 执 行根据权利要求1至 6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115115863 A 3

.PDF文档 专利 水面多尺度目标检测方法、装置及系统和存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 水面多尺度目标检测方法、装置及系统和存储介质 第 1 页 专利 水面多尺度目标检测方法、装置及系统和存储介质 第 2 页 专利 水面多尺度目标检测方法、装置及系统和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。