行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210364931.4 (22)申请日 2022.04.07 (71)申请人 安徽理工大 学 地址 232000 安徽省淮南市山 南新区泰丰 大街168号 (72)发明人 王龙兴 刘为国  (51)Int.Cl. G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 20/52(2022.01) G06N 3/04(2006.01) (54)发明名称 基于改进的YOLOv5火灾检测算法 (57)摘要 本发明公开一种基于改进的YOLOv5火灾检 测算法, 涉及火灾检测领域; 本发明在YOLOv5算 法的基础上,在编码和解码部分加入了CBA M注意 力机制, 将Neck层的FPN和PAN结构替换为BIPFN 架构与修改解码部分的定位损失函数。 针对模型 对小尺度特征信息容易出现丢失的问题, 提出在 模型添加注 意力机制, 有效的提高了模型对小尺 度信息的提取能力; 针对模型计算量大于处理时 间长的问题, 更换BIPFN为Neck层 架构, 减少模型 计算量, 提高运算效率; 针对模型预测精度低的 问题, 通过修改定位损失函数, 来提高模型预测 精度。 权利要求书1页 说明书3页 附图2页 CN 114821266 A 2022.07.29 CN 114821266 A 1.基于改进的YOLOv5火灾检测算法, 其特征在于, 所述的改进的YOLOv5火灾检测算法 由编码部分和 解码部分两部分组成; 编码部分输出三种不同尺度大小的特征图, 解码部分 对编码部分的三种不同尺度的特 征图进行判别。 2.基于权利要求1所述的编码部分, 其特征在于, 所述的编码部分由主干网络 CSPDarknet53、 CBAM注意力机制、 Neck层构成; 到主干网络后输出的特征图通过Neck层 进行 特征融合操作, 来对不同大小的特 征图进行拼接, 最后得到三种大小的特 征图。 3.基于权利要求2所述的主干网络CSPDarknet53 ,其特征在于, 在主干网络 CSPDarknet53 中加入CBAM注意力 机制, CBAM的输入的特征图为xh×w×c, 其中h、 w、 c分别为特 征图的高、 宽、 通道数。 CBAM注意力机制由空间注意力部分和通道 注意力机制两 部分组成。 4.基于权利要求3所述的通道注意力 部分, 其特征在于, 将特征图输入到通道注意力 部 分, 对特征图分别进行一个全局空间最大池化和平均池化, 得到两个1 ×1×c的向量, 分别 将它们送入两个共享权重的神经网络中, 得到两个1 ×1×c的向量, 并对其进行堆叠和 sigmoid激活操作, 最终输出权 重系数Mc。 最后那M c与原特征图相乘得到新的特 征图F1。 5.基于权利要求3所述的空间注意力部分, 其特征在于, 将新得到的特征图F1输入到空 间注意力部分, 将特征图F1先经过通道平均池化和最大池化将输入的所有通道的每个特征 点取最大值与平均值输出两个h ×w×1的特征层, 并按通道拼接获得h ×w×2的特征向量, 最后通过卷积和sigmoid激活函数得到权重系数Ms,。 最后拿Ms与F1相乘, 得到输出CBAM注 意力机制结果yh×w×c。 6.基于权利要求3所述的CBAM注意力机制, 其特征在于, 输入xh×w×c先后通过通道注意 力部分与空间注意力部分输出CBAM注意力机制结果yh×w×c。 7.基于权利要求2所述的Neck层, 其特征在于, 将CBAM注意力机制 结果输入到Neck层, 将原Neck层的FPN +PAN结构替换为BIPFN架构。 低尺度的特征图输出传入到高尺度的特征图 输入, 并将低尺度的特征图通过级联结构继续传输到下层高尺度的卷积层, 从而实现对不 同尺度的特 征融合。 8.基于权利要求1所述的解码部分, 其特征在于, 修改解码部分的定位损 失函数, 在原 定位损失函数的基础上增 加幂为3的运 算, 输出更精确的数值。 9.基于权利要求1所述的解码部分, 其特征在于, 解码部分对编码部分输出的三个不同 尺度的特 征图通过设定的锚框和修改后的损失函数, 来对特 征图进行判断, 得到预测结果。权 利 要 求 书 1/1 页 2 CN 114821266 A 2基于改进的Y OLOv5火灾检测算法 技术领域 [0001]本发明涉及火灾检测领域, 具体是一种基于改进的YOLOv5火灾检测算法。 背景技术 [0002]随着社会的不断发展, 社会财富日渐增加,火灾成为了最经常、 最普遍危害公众安 全和社会发展的主要灾害之一。 当发生火灾时, 人们通常通过发生火灾时的环境变化来判 断是否发生火灾以及火灾状况。 其结果 直接影响到 了能否快速进行火灾扑救, 减少 损失。 [0003]目前, 对于火灾的检测主要是通过传感器对氧气浓度、 二氧化碳含量和烟雾浓度 等进行判断是否发生火灾, 存在检测时间长, 检测效率低和容易出现误报等问题。 随着深度 学习的发展, 具有检测效率高、 检测准确 率高的基于深度学习的火灾检测成为了火灾图像 处理热门方向。 发明内容 [0004]本发明的目的是提供一种基于改进的YOLOv5的火灾检测算法; 本 发明由火灾图像 输入到解码部分, 图像输入到主干网络CSPDarknet53中, 输出特征图, 特征图通过Neck层进 行参数融合, 解码部分依据损失函数和锚框 机制来对拼接后的特 征图进行 预测。 [0005]本发明提供基于改进的YOLOv5火灾检测算法, 包括 步骤: [0006]1、 火灾图像输入解码部 分由主干网络CSPDarknet53、 CBAM注意力机制、 Neck  层构 成; 到主干网络后输出的特征图通过Neck层进行特征融合操作, 来对不同大小的特征图进 行拼接, 最后得到三种大小的特 征图。 [0007]2、 在主干网络CSPDarknet53中加入CBAM注意力机制, CBAM的输入的特征图为 xh×w×c, 其中h、 w、 c分别为特 征图的高、 宽、 通道数。 [0008]3、 将特征图输入到通道注意力部分, 对特征图分别进行一个全局空间最大池化和 平均池化, 得到两个1 ×1×c的向量, 分别将它们送入两个共享权重的神经网络中, 得到两 个1×1×c的向量, 并对其进 行堆叠和sigmoid激活操作, 最终输出权重系数Mc。 最后那Mc与 原特征图相乘得到新的特 征图F1。 [0009]4、 将新得到的特征图F1输入到空间注意力部分, 将特征图F1先经过通道平均池化 和最大池化将输入的所有通道的每个特征点取最大值与平均值输出两个h ×w×1的特征 层, 并按通道 拼接获得h ×w×2的特征向量, 最后通过卷积和sigmoid  激活函数得到权重系 数Ms,。 最后拿Ms与F1相乘, 得到 输出CBAM注意力机制结果yh×w×c。 [0010]5、 将CBAM注意力机制结果输入到Neck层, 将原 Neck层的FPN+PA N结构替换为BIPFN 架构。 低尺度的特征图输出传入到高尺度的特征图输入, 并将低尺度的特征图通过级联结 构继续传输 到下层高尺度的卷积层, 从而实现对不同尺度的特 征融合。 [0011]6、 修改解码部分的定位损失函数, 在原定位损失函数的基础上增加幂为3  的运 算, 输出更精确的数值。 [0012]7、 解码部分对编码部分输出的三个不同尺度的特征 图通过设定的锚框和修改后说 明 书 1/3 页 3 CN 114821266 A 3

.PDF文档 专利 基于改进的YOLOv5火灾检测算法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于改进的YOLOv5火灾检测算法 第 1 页 专利 基于改进的YOLOv5火灾检测算法 第 2 页 专利 基于改进的YOLOv5火灾检测算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:02:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。