(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211209625.X
(22)申请日 2022.09.30
(65)同一申请的已公布的文献号
申请公布号 CN 115272648 A
(43)申请公布日 2022.11.01
(73)专利权人 华东交通大 学
地址 330000 江西省南昌市经济技 术开发
区双港东大街808号
(72)发明人 阙越 甘梦晗 刘志伟 张月园
熊汉卿
(74)专利代理 机构 北京中济纬天专利代理有限
公司 11429
专利代理师 黄攀
(51)Int.Cl.
G06V 10/20(2022.01)
G06V 10/766(2022.01)
G06V 10/80(2022.01)(56)对比文件
CN 110321923 A,2019.10.1 1
CN 10828 8075 A,2018.07.17
CN 114998696 A,202 2.09.02
CN 212062695 U,2020.12.01
CN 111767792 A,2020.10.13
WO 2021185379 A1,2021.09.23
US 20212 24581 A1,2021.07.2 2
杨建秀.基 于有效感受野的目标检测算法.
《山西大同大 学学报(自然科 学版)》 .2020,(第04
期),全文.
王凯等.基 于改进Faster R- CNN图像小目标
检测. 《电视技 术》 .2019,(第20期),全 文.
Jiaqi Chen等.Two Dimensi onal
Frequency-angle Domai n Interpolation
Method for Electroma gnetic Scat tering
Analysis of Precipitati on Particles.
《IEEE》 .2016,全 文.
审查员 李敏
(54)发明名称
用于小目标检测的多层级感受野扩展方法
与系统
(57)摘要
本发明提出一种用于小目标检测的多层级
感受野扩展方法与系统, 引入Swin Transformer
作为模型的主干网络, 利用其层次性、 局部性与
平移不变性对小目标进行特征提取; 根据主干网
络各阶段输出特征的不同, 设计了多级感受野扩
展网络, 进一步处理主干网络的输出特征, 以避
免小目标信息丢失问题; 此外, 所提出的感受野
放大模块能有效地扩展感受野。 根据任务需求,
灵活调整各层感受野放大模块的结构, 以匹配不
同尺度目标所需感受野, 并获取丰富的上下文信
息; 另一方面, 所提出的GIOU loss与BIOU loss
的联合损失用于增强目标的定位性能; 经对比试
验验证, 本发明在小目标检测方面有很好的表
现。
权利要求书3页 说明书8页 附图2页
CN 115272648 B
2022.12.20
CN 115272648 B
1.一种用于小目标检测的多层级感受野扩展方法, 其特征在于, 所述方法包括如下步
骤:
步骤一、 对COCO数据集中的输入图像进行小目标检测适用的预处 理;
步骤二、 引入Swin Transformer作为主干网络, 利用Swin Transformer的分层结构对
所述输入图像进行 特征提取, 以得到多层特 征, 其中每层特 征对应有一特 征层;
步骤三、 构建多层级感受野特征融合网络, 通过多层级感受野特征融合网络中的感受
野特征放大模块匹配Swin Transformer中各特征层的所需感受野并补 充浅层预测特征, 其
中, 进行匹配后, 每 个特征层对应有 多个感受野特 征放大模块;
步骤四、 将GIOU loss与BIOU loss的线性组合作为边界框回归损失, 根据对应的边界
框回归损失函数以加强目标定位效果;
步骤五、 将输入图像中的不同尺度目标分配在具有不同感受野的特征层上, 利用检测
模型中的浅层预测特 征层获得对小目标进行定位与识别, 以得到小目标的定位识别结果;
在所述步骤一中, 所述预处 理包括如下步骤:
设计数据增强策略, 其中所述数据增强策略为: 将输入图像的图像尺寸进行缩放, 使用
多尺度训练以增强样本尺度多样性;
对COCO数据集中的输入图像采用随机水平翻转作数据增广, 以增强模型的泛化能力;
Swin Transformer对应有四层 结构, 对应提取出 四个不同尺度与不同深度的提取特征
, 其中,
, 经
卷积调整通道数后得到特 征
, 其中,
;
多层级感受野特 征融合网络用于 输出四个不同尺度的输出 特征
, 其中,
;
多层级感受野特征融合网络中四个特征层上的感受野特征放大模块表示为
, 其
中,
;
对应关系如下:
其中,
分别表示第2层输出特征、 第3层输出特征、 第4层输出特征以及第5
层输出特征,
分别表示第2层特征、 第3层特征、 第4层特征以及第5层特征,
分别表示第2个特征层、 第3个特征层、 第4个特征层以及第5个
特征层上的感受野特征放大模块,
表示单个特征层中感受野特征放大模块的个数,
表
示采用两倍的邻近取样插值法上采样;
感受野特征放大模块包括多个基础单元, 在第4个特征层中, 作为主干网络的Swin
Transformer的第4层 特征
经感受野特征放大模块的第1个基础单元
得到第一基础 单
元输出特征
, 再通过第2个基础单元
得到第二基础单元输出特征
, 最后经第3个基
础单元
, 通过残差连接 融合主干网络的第 4层特征
得到第4层特征的第 三基础单元输权 利 要 求 书 1/3 页
2
CN 115272648 B
2出特征
;
对应的表达式为:
其中, 第三基础单元输出特征
为第4个特征层的第 一个感受野特征放大模块的输出
特征;
第一基础单 元输出特征
的计算公式表示 为:
其中,
表示
卷积,
表示卷积核为
的空洞卷积,
表示空洞卷
积的扩展率,
表示批归一 化,
表示激活函数,
表示包含批归一化和激活函数的
卷积,
表示包
含批归一 化和激活函数的
空洞卷积;
所述边界框回归损失函数表示 为:
其中,
表示边界框回归损失函数,
表示GIOU loss损失函数,
表
示BIOU loss损失函数,
表示预测边界框,
表示标注框,
表示边界框的位置,
,
表示边界框中心点的坐标,
分别表示边界框的宽与高,
表示预
测边界框与标注框的最小包围框面积,
表示Smooth L1损失,
表示重合度计算;
在所述步骤五中, 在进行识别任务中, 使用Focal loss 函数解决正负样本不平衡问
题, 对应的Focal loss函数表示 为:
其中,
表示Focal loss函数,
表示预测分数,
表示真实标签,
表示平衡
正负样本数,
表示调节因子;
在所述步骤五中, 检测模型进行定位与识别对应的总损失函数表示 为:
其中,
表示检测模型进行定位与识别对应的总损失函数,
均表示超参数。
2.一种用于小目标检测的多层级感受野扩展系统, 其特征在于, 所述系统应用 如上述
权利要求1所述的一种用于小目标检测的多层级感受野 扩展方法, 所述系统包括:
预处理模块, 用于:
对COCO数据集中的输入图像进行小目标检测适用的预处 理;
特征提取模块, 用于:
引入Swin Transformer作为主干网络, 利用Swin Transformer的分层结构对所述输入权 利 要 求 书 2/3 页
3
CN 115272648 B
3
专利 用于小目标检测的多层级感受野扩展方法与系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:58:18上传分享