行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211190261.5 (22)申请日 2022.09.28 (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 罗俊海 陈瑜  (74)专利代理 机构 成都虹盛汇泉专利代理有限 公司 51268 专利代理师 王伟 (51)Int.Cl. G06V 20/05(2022.01) G06V 10/44(2022.01) G06V 10/54(2022.01) G06V 10/52(2022.01) G06V 10/80(2022.01)G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于多尺度特征学习的水下目标检测 方法 (57)摘要 本发明公开了一种基于多尺度特征学习的 水下目标检测方法, 首先通过双骨干网络进行了 特征的提取, 提取了深度特征, 纹理特征, 把深度 特征和纹理特征联合处理, 经过坐标注意力机 制, 让位置信息得到了更好的关注, 以更准确的 检测目标。 本发明的方法将预测头增加到了4个, 能更好的检测小目标, 减少了网络模 型的资源占 用, 使该模型适用于硬件条件有限的嵌入式设 备, 与其他先进的目标检测器相比, 进一步提高 了水下目标的检测精度, 可以对目标进行有效的 检测, 并且具有良好的检测精度和实时性。 权利要求书2页 说明书6页 附图5页 CN 115527105 A 2022.12.27 CN 115527105 A 1.一种基于多尺度特 征学习的水 下目标检测方法, 具体步骤如下: 步骤一、 图像预处 理, 针对水下目标的检测, 采用与数据无关的增强方法, 即Mixup方法, 构建虚拟样本, 增加 样本鲁棒性, 对图像进行增强处理, 在训练过程中, 采用Mosaic方法对数据集处理, 通过 随 机读取四张图像进行放缩、 翻转、 裁剪等操作, 拼接到一张图上作为训练数据, 增加数据多 样性、 丰富检测物体背景; 步骤二、 深度特 征提取, 对CSPDarknet53网络的结构进行改进, 将特征提取网络替换为ESNet, 采用双骨干网络 来提取更加丰富的特 征, 在ES block中添加SE模块; 通道置换为ShuffleNetV2中的通道, 提供信息交换, 当stride=2时, 添加depthwise逐 深度卷积与pointwise逐点卷积对不同通道信息进行融合, 当stride=1时, 在ES  block中 引入Ghost模块以提升其 性能; ESNet中的ES  block采用深度可分离卷积, 把卷积分为depthwise( DW)和pointwise (PW)两个部分, 用来 提取特征图, stride为1的ES  block运用Ghost  block; 步骤三、 纹 理特征提取, 针对目标提取纹理信息, 使用灰度共生矩阵GLCM描述局部区域相邻像素点之间相关程 度, 反映图像灰度方向、 间隔和变化幅度的综合信息; 将RGB图像进行3 ×3的网格划分, 针对每个网格区域将多通道的图像转换为灰度图像, 采用直方图均衡化的方式进行对比度调整, 然后对调整结果灰度级进行压缩, 使用由CLCM 演化计算的统计量参数, 进一步分析特定灰度级结构重复出现导致的纹理分类特征, 选用 对比度、 能量和逆方差来表达纹 理特征; 对比度表达式如下: 其中, i表示灰度矩阵的第i行, j表示灰度矩阵的第j列, P(i,j)表示灰度以i为起始点, 出现灰度级j的概 率, Con表示所求对比度; 角二阶矩(能量)表达式如下: 其中, P(i,j)表示灰度以i 为起始点, 出现灰度级j的概 率, Asm表示所求角二阶矩; 逆方差表达式如下: 其中, d表示空间距离, θ表示方向, H表示所求逆方差,P(i,j∣ d, θ )表示即在 给定空间距 离d和方向θ 时, 灰度以i 为起始点, 出现灰度级j的概 率, N表示灰度矩阵的最大 行数(列数); 在水平、 竖直以及对角线四种方向考察不同的纹理规律, 即灰度共生矩阵的方向分别 取0°、 45°、 90°、 135°四个方向, 在每个方 向的灰度共生矩阵的基础上, 提取对比度、 二阶矩权 利 要 求 书 1/2 页 2 CN 115527105 A 2以及逆方差三类丰富的纹 理特征参数, 计算所有图像特 征均值并将其归一 化: 其中, x为待计算的特征值, xmax为矩阵中最大的特征值, xmin为矩阵中最小的特征值, x* 为归一化后的特 征值; 分类器在 关注局部网格纹理特征的同时, 对网格区域之间的纹理特征进行对比, 最终, 输出1×108特征表示图像纹 理特征; 步骤四、 把深度特 征和纹理特征联合处理, 把提取的纹理特征和深度特征相融合, 在特征提取后采用坐标注意力机制, 在特征提 取网络的最后一层添加一个新的坐标注意块, 使用坐标注意力(Coordinate  Attention, CA)将位置信息嵌入到通道注意力中, 坐标注意力块将通道注意分解为两个一维特征编码 过程, 这些过程聚集了不同方向的特征, 然后, 对生成的特征图进行单独编码, 形成一对方 向感知和位置敏感的特 征图; 步骤五、 对特 征图预测得到结果, 预测模块将特征信 息通过上采样的方式进行传递融合成特征图, 得到特征图后进行预 测, 然后得到最终的结果, 预测 模块包含4个YOLO头部, 下层的YOLO头部应用了上层YOLO头 部的特征信息, 将其上采样后再进行 特征图拼接, 得到这 一层的特 征图以进行 预测。权 利 要 求 书 2/2 页 3 CN 115527105 A 3

PDF文档 专利 一种基于多尺度特征学习的水下目标检测方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多尺度特征学习的水下目标检测方法 第 1 页 专利 一种基于多尺度特征学习的水下目标检测方法 第 2 页 专利 一种基于多尺度特征学习的水下目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。