行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210236171.9 (22)申请日 2022.03.11 (71)申请人 安徽大学 地址 230601 安徽省合肥市经开区九龙路 111号 (72)发明人 涂铮铮 王洪顺 刘夫武 张瑞欣  陈弘悦 王欣悦 钮洁 李成龙  (74)专利代理 机构 南京华恒专利代理事务所 (普通合伙) 32335 专利代理师 宋方园 (51)Int.Cl. G06T 7/00(2017.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06V 10/40(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) (54)发明名称 基于模态独有和共有特征提取的图像显著 目标检测方法 (57)摘要 本发明公开一种基于模态独有和共有特征 提取的图像显著目标检测方法, 通过模态共有特 征提取模块SFA来建模两种模态之间的强相关 性, 特征擦 除模块(FEB)来建模不同模态之间的 差异性; 本发 明充分利用多模态之间的相关性和 差异性, 从而使网络获得更强大的模态融合与信 息选择的能力; 通过特征解码实现各种信息的有 利交互, 本发 明的显著图的置信度高于其他先进 的方法。 权利要求书3页 说明书9页 附图4页 CN 114663371 A 2022.06.24 CN 114663371 A 1.一种基于模态独有和共有特征提取的图像显著目标检测方法, 其特征在于: 包括以 下步骤: 步骤S1、 使用双流特征编码器编码获得可见光图像和热红外图像的多级特征, 并将可 见光的骨干特 征标记为r1~r4, 热红外的骨干特 征标记为t1~t4; 步骤S2、 将 最深层特征r4和t4经过金字塔池化PPM处理得到具有全局感受野的全局特征 G, G=PPM(r4,t4); 步骤S3、 使用模态共有特征提取模 块SFA对r1~r4和t1~t4进行模态关联处理, 并基于注 意力将高层的语义信息传递到低层特征中, 从而得到具有多模态共有信息的共有区域特征 F, F包括F1~F4; 步骤S4、 使用特征擦除模 块FEB分别对r1~r4和t1~t4进行模态 差异性处理, 从而得到具 有各自模态独有信息的特 征R和T, R包括R1~R4和T包括T1~T4; 步骤S5、 在多模态解码器中, 先聚合差异性特征, 得到多模态下的差异性特征 然后使用注意力机制引导独有信息和共有信息进行相互优化 和融合, 得到 显著图S, S包括S1~S4, S4为最终显著图; 步骤S6、 通过损失函数监 督训练网络得到最终预测图。 2.根据权利要求1所述的基于模态独有和共有特征提取的图像显著目标检测方法: 其 特征在于: 所述步骤S1中的双流特征编码器采用Swin ‑Transformer结构, 特征图开始输入 到两层transformer中, 这两层transformer的核心一个是普通的window  attention, 另一 个是shift  window attention, 然后在 stage与stage之间使用pooling来降低要处理的数 据的尺寸, 每一个sta ge输出的通道数分别为128、 25 6、 512和1024。 3.根据权利要求1所述的基于模态独有和共有特征提取的图像显著目标检测方法: 其 特征在于: 所述 步骤S3中 高层的语义信息传递的具体方法为: 首先, 将两个模态的骨干特征分别均等化分成四份, 利用Si gmoid将高层 特征生成注意 力掩码, 分别作用于 两种模态的四份特 征, 如下: 其中Split()为Pytorch框架集成的函数, ConvBlock()是卷积、 归一化和Relu激活函 数集成的卷积块, σ 代 表激活函数, 代表高层特 征, Mask代 表由高层信息产生的权 重掩码; 然后, 根据c hannel‑wise乘法将Mask分别作用于fr和ft; 最后, 将f ′r和f′t进行通道合并, 并通过卷积核大小为3 ×3卷积块将对其特征上下文进 行细化, 最后得到融合有层级信息和上 下文信息的Fr和Ft; 其中, [*]是通道连接操作; 使用Fr、 Ft和G提炼共有区域特 征, 具体方法为,权 利 要 求 书 1/3 页 2 CN 114663371 A 2在Fr、 Ft上应用两个通道 注意力对每 个通道的权 重进行划分; F′r=CA(Fr)=Fr×σ(AvgPool(Fr)+MaxPool(Fr)) F′t=CA(Ft)=Ft×σ(AvgPool(Ft)+MaxPool(Ft)) 其中, CA()为通道注意力 函数, AvgPooling和Maxpooling分别表示平均池化和最大池 化; 然后利用输出通道为128的卷积块对G进行处理, 最后 与F′r和F′t进行融合实现共有区域 特征的提取; F=F′r+F′t+ConvBlock(G) 最终得到四个层级的共有区域特 征Fk, 其中k=1,2,3,4。 4.根据权利要求1所述的基于模态独有和共有特征提取的图像显著目标检测方法: 其 特征在于: 所述 步骤S4模态擦除模块的具体操作为: 首先, 使用余弦相似度在每一层计算各自的共有特 征和骨干特 征的相关性图; M(i,j)=(F(i,j))T(wT×f),1≤i≤ H,1≤j≤W 其中(i,j)代表每个像素点的位置, f代表了骨干特征r或者骨干特征t, w反映f到F的空 间映射参数, H是 特征F(i,j)的长的像素 数, W是特征F(i,j)的宽的像素 数; 然后, 在相关性图M上采用滑动窗口的方式生成一个二进制掩码用于擦除操作, 将其定 义为 最后, 利用二进制掩码 对共有特征F进行擦除, 得到具有模态独有信息的特 征R和T; 5.根据权利要求1所述的基于模态独有和共有特征提取的图像显著目标检测方法: 其 特征在于: 所述 步骤S5聚合差异性特 征的具体操作为: 将模态独有信息R和T进行通道合并, 并使用输出通道为128的卷积块对聚合后的特有 信息进行细化, 得到多模态下差异性特 征, 6.根据权利要求1所述的基于模态独有和共有特征提取的图像显著目标检测方法: 其 特征在于: 所述 步骤S5中使用注意力机制的具体方法为: 对于高层特征 首先将低分辨率的高层特征上采样成与该层特征尺寸相同的大小, 然 后使用输出通道为128的卷积块将差异性特征 共有特征F和高层特征 修改成相同通道 数, 随后使用注意力机制自动获取聚合后特 征的每个通道数的重要性; 由于有四层特征, 得到四层预测的特征, 分别经过一个单通道的卷积层, 再利用 Sigmoid函数将分值约束到 0~1之间, 分别记为S1~S4, S4为最终显著图。 7.根据权利要求1所述的基于模态独有和共有特征提取的图像显著目标检测方法: 其 特征在于: 所述 步骤S6的详细内容 为: 给定显著图S={S(i)|i={1, ..., N}和真实数据 Y={Y(i)|i={1, ..., N}, 其中, N是显 著图的总像素 数; 二元交叉熵BC E损失函数为:权 利 要 求 书 2/3 页 3 CN 114663371 A 3

.PDF文档 专利 基于模态独有和共有特征提取的图像显著目标检测方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于模态独有和共有特征提取的图像显著目标检测方法 第 1 页 专利 基于模态独有和共有特征提取的图像显著目标检测方法 第 2 页 专利 基于模态独有和共有特征提取的图像显著目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:21:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。