行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210152576.4 (22)申请日 2022.02.18 (71)申请人 桂林电子科技大 学 地址 541004 广西壮 族自治区桂林市七 星 区金鸡路1号 (72)发明人 陈小毛 张健 王立成 赵金润  黄莹 何超  (74)专利代理 机构 桂林文必达专利代理事务所 (特殊普通 合伙) 45134 专利代理师 白洪 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06V 20/05(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06T 3/40(2006.01) (54)发明名称 基于改进Faster RCN N的水下目标检测方法 (57)摘要 本发明涉及计算机视觉技术领域, 尤其涉及 一种基于改进Faster  RCNN的水下目标检测方 法, 由残差网络Resnet50和改进的FPN组成的特 征提取网络, 通过改进的FPN在原始FPN的基础上 去除了最大池化和选取了适合检测小物体的第 一、 二层融合特征图, 节省时间成本同时还保证 目标检测的准确性, 在区域建议网络以及后续目 标回归定位中使用了软非极大值抑制算滤除了 重叠的候选框, 保证重叠在一起的小目标也能够 识别到, 最后通过 RoiAlign在操作中保留其浮点 数, 使用双线性插值的方法得到固定大小的特征 图, 解决了现有的水下卷积神经网络目标检测模 型的检测小目标准确率较低的技 术问题。 权利要求书1页 说明书6页 附图5页 CN 114708423 A 2022.07.05 CN 114708423 A 1.一种基于改进Faster  RCNN的水下目标检测方法, 其特 征在于, 包括下列步骤: 图像数据输入特 征提取网络, 获得多尺度特 征图; 将所述多尺度特 征图输入区域建议网络处 理后获得最终候选 框; 所述多尺度特 征图进行Ro iAlign池化操作获得固定尺寸特 征图; 将固定尺寸特 征图用于后续目标分类和边框回归。 2.如权利要求1所述的基于改进FasterRCN N的水下目标检测方法, 其特 征在于, 所述特征提取网络由残差网络Resnet50和改进的FPN组成, 残差网络Resnet50通过四 个残差块会得到四个不同层级的特征图, 通过FPN中的自顶向下上采样和横向连接将浅层 特征与深层特 征进行融合得到多尺度特 征图。 3.如权利要求2所述的基于改进FasterRCN N的水下目标检测方法, 其特 征在于, 残差网络Resnet50的四个残差块RESB LOCK的数量分别为3.4.6.3, 改进的FPN不选取残 差网络Resnet5 0得到的第三、 四层特 征融合后的特 征图。 4.如权利要求1所述的基于改进FasterRCN N的水下目标检测方法, 其特 征在于, 所述多尺度特征图输入区域建议网络后, 设置6种不同尺寸大小的锚框, 通过去除越过 边界的锚框, 对剩下的锚框利用卷积 操作得到的边框回归参数调整为 候选框。 5.如权利要求 4所述的基于改进FasterRCN N的水下目标检测方法, 其特 征在于, 最终候选 框通过软非极大值抑制方法滤除目标重 叠的候选 框后获得。 6.如权利要求1所述的基于改进FasterRCN N的水下目标检测方法, 其特 征在于, 在所述多尺度特征图进行RoiAli gn池化操作获得固定尺寸特征图的过程中, 首先将候 选框映射到特征图上, 再将特征图尺寸固定为统一规格, 并在两次量化取整操作中保留浮 点数。权 利 要 求 书 1/1 页 2 CN 114708423 A 2基于改进Fa ster RCNN的水下目标 检测方法 技术领域 [0001]本发明涉及计算机视觉技术领域, 尤其涉及一种基于改进Faster  RCNN的水下目 标检测方法。 背景技术 [0002]海洋的面积占据了地球表面积的71%, 其中蕴含着丰富的资源, 例如, 海参、 海胆、 扇贝、 海星等一些水下生物。 为了能够充分的利用这些海洋资源, 需要 水下机器人来代替水 下作业, 在使用水下机器人进行水下工作时, 准确的水下生物目标检测能力可以有效提高 水下机器人在水 下作业的效率。 [0003]现有基于深度学习的卷积神经网络目标检测模型中, 检测精度较高的是基于 Faster RCNN的双阶段目标检测方法, 但Faster  RCNN模型特征提取网络得到的深层特征图 的感受野较大, 特征较明显, 适合检测 较大的目标。 水下生物目标检测时大多数为小目标, Faster RCNN目标检测的准确率 就会降低。 发明内容 [0004]本发明的目的在于提供一种基于改进Faster  RCNN的水下目标检测方法, 旨在解 决现有的水 下卷积神经网络目标检测模型的检测小目标准确率较低的技 术问题。 [0005]为实现上述目的, 本 发明提供了一种基于改进Fast er RCNN的水下目标检测方法, 包括下列步骤: [0006]图像数据输入特 征提取网络, 获得多尺度特 征图; [0007]将所述多尺度特 征图输入区域建议网络处 理后获得最终候选 框; [0008]所述多尺度特 征图进行Ro iAlign池化操作获得固定尺寸特 征图; [0009]将固定尺寸特 征图用于后续目标分类和边框回归。 [0010]其中, 所述特征提取网络由残差网络Resnet50和改进的FPN组成, 残差网络 Resnet50通过四个残差块会得到四个不同层级的特征图, 通过FPN中的自顶向下上采样和 横向连接将浅层特 征与深层特 征进行融合得到多尺度特 征图。 [0011]其中, 残差网络Resnet50的四个残差块RESBLOCK的数量分别为3.4.6.3, 改进的 FPN不选取残差网络Resnet5 0得到的第三、 四层特 征融合后的特 征图。 [0012]其中, 所述多尺度特征图输入区域建议网络后, 设置6种不 同尺寸大小的锚框, 通 过去除越过边界的锚框, 对剩下的锚框利用卷积 操作得到的边框回归参数调整为 候选框。 [0013]其中, 最终候选 框通过软非极大值抑制方法滤除目标重 叠的候选 框后获得。 [0014]其中, 在所述多尺度特征图进行RoiAlign池化操作获得固定尺寸特征图的过程 中, 首先将候选框映射到特征图上, 再将特征图尺寸固定为统一规格, 并在两次量化取整操 作中保留浮 点数。 [0015]其中, 所述固定尺寸特 征图为7*7 大小特征图, 用于后续的目标分类与边框回归。 [0016]本发明提供了一种基于改进Faster  RCNN的水下目标检测方法, 由残差网络说 明 书 1/6 页 3 CN 114708423 A 3

.PDF文档 专利 基于改进Faster RCNN的水下目标检测方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于改进Faster RCNN的水下目标检测方法 第 1 页 专利 基于改进Faster RCNN的水下目标检测方法 第 2 页 专利 基于改进Faster RCNN的水下目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:21:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。