行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210464104.2 (22)申请日 2022.04.29 (71)申请人 中南大学 地址 410083 湖南省长 沙市岳麓区麓山 南 路932号 (72)发明人 赵于前 肖晓阳 张帆 阳春华  桂卫华  (51)Int.Cl. G06V 20/70(2022.01) G06V 10/20(2022.01) G06V 10/44(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种边界引导上下文聚合的交通场景语义 分割方法 (57)摘要 本发明公开了一种边界引导上下文聚合的 交通场景语义分割方法, 其实施方案为: 1)获取 数据集与分割标签; 2)数据处理; 3)构建分割模 型; 4)构建损失函数; 5)训练分割模型; 6)交通场 景图像分割。 本发明构建的具有边界细化模块的 交通场景分割模 型, 在去除低 层次的轮廓纹理信 息的同时保留了高级的语义边界信息, 能够有效 检测对象的边界, 并沿着目标边界聚合上下文信 息, 增强同类像素的一致性, 从而有效利用边界 信息对交通场景图像进行语义分割。 本发明方法 能够捕获边界区域像素与对象内部像素之间的 依赖关系, 有效提高分割准确性和鲁棒 性。 权利要求书3页 说明书7页 附图3页 CN 114782949 A 2022.07.22 CN 114782949 A 1.一种边界引导上 下文聚合的交通场景语义分割方法, 其特 征在于包括以下步骤: (1)获取数据集与分割标签: 获取交通场景公开数据集与对应的分割标签; (2)数据处 理, 具体包括以下步骤: (2‑a)对步骤(1)获取的数据集中的图像与对应的分割标签同步水平翻转; (2‑b)将步骤(2 ‑a)获得的图像及对应的分割标签都缩 放至m1×m2像素大小, 其中m1和m2 分别为缩放后图像的宽和高, m1、 m2都为正整数; (2‑c)将步骤(2 ‑b)缩放得到的图像及对应的分割标签进行归一化操作, 组成处理后的 样本数据集; (3)构建分割模型, 具体包括以下步骤: (3‑a)构建语义分割模块, 该模块一共包括五组下采样层和一个空洞空间卷积池化金 字塔模块, 即ASPP模块; 输入图像依次经过这五组下采样层, 分别得到特征图F1、 F2、 F3、 F4和 F5, F5经过ASPP模块后, 得到特征图Ff; 第一组下采样层由一个残差卷积块与一个池化层组 成, 第二、 三、 四、 五组下采样层都由一个残差卷积块组成; (3‑b)构建边界细化模块, 将步骤(3 ‑a)得到的特征图F2、 F3、 F4和F5分别经过一个 卷积核 大小为1×1的卷积层后得到相应的特征图F2′、 F3′、 F4′和F5′; 利用边缘检测 算子对输入图 像进行边缘检测得到特征图B1, 将B1经过一个卷积核大小为1 ×1的卷积层后得到特征图 B11, B11与F2′共同输入到第一个注意力门控模块AG1, 得到特征图B2; 将B11经过一个卷积核大 小为1×1的卷积层后得到特征图B12, B12与F3′共同输入到第二个注意力门控模块AG2后得到 特征图B3; 将B12经过一个卷积核大小为1 ×1的卷积层后得到特征图B13, B13与F4′共同输入 到 第三个注意力门控模块AG3后得到特征图B4; 将B13经过一个卷积核大小为1 ×1的卷积层后 得到特征图B14, B14与F5′共同输入到第四个注意力门控模块AG4后得到特征图B5; 最后将特 征图B2、 B3、 B4和B5拼接后得到特征图Bs, Bs经过一个卷积核大小为1 ×1的卷积层降维后得到 特征图Bf; (3‑c)将步骤(3 ‑a)得到的特征图Ff与步骤(3 ‑b)得到的特征图Bf共同输入到上下文聚 合模块, 即CAM模块, 得到特征图Fp, Fp经过一个卷积核大小为3 ×3的卷积层后得到特征图 F′p, 将F′p上采样至原始图像大小, 得到交通场景语 义分割结果; 将步骤(3 ‑b)得到的特征图 Bf经过一个卷积核大小为3 ×3的卷积层后得到特征图Bp, 将Bp上采样至原始图像大小, 得到 交通场景边界的二 值分割结果; (4)构建损失函数: 构建以下 联合损失函数: L= λ1Lbody+λ2Lboun+λ3Laux 其中, Lbody表示语义分割的交叉熵损失, Lboun表示边界分割的二项式交叉熵损失, Laux表权 利 要 求 书 1/3 页 2 CN 114782949 A 2示辅助的交叉熵损失, 表示像素i为第k类标签 的真值, yi∈[0,1]表示像素i为边 界的真值, λ1, λ2, λ3为超参数, 其中λ1∈(0,1], λ2∈(0,1], λ3∈(0,20], I代表输入图像, k取 正整数且k∈[1,K], K为分割结果的类别数, 取正整数且K∈[2,160], 表示像素i为 第k类的预测结果, pi∈(0,1)表示像素i 为边界的预测结果, l og为自然对数; (5)训练分割模型: 利用步骤(2)得到的样本数据集训练步骤(3)构建完成的分割模型, 根据步骤(4)构建 的损失函数得到损失值, 并使用随机梯度下降法更新模型内的参数, 直至损失值不再下降, 得到训练好的分割模型; (6)交通场景图像分割: 获取待分割的交通场景图像, 按照步骤(2)对它们进行数据处理后, 输入步骤(5)得到 的训练好的分割模型中, 得到最终分割结果。 2.如权利要求1所述的一种边界引 导上下文聚合的交通场景语义分割方法, 其特征在 于, 所述步骤(3 ‑a)中的空洞空间卷积池化金字塔模块ASPP, 该模块并行包含四个不同的卷 积层和一个池化层: 一个卷积核 大小为1×1的卷积层, 一个卷积核 大小为3×3、 填充率为6、 采样率为6的卷积层, 一个卷积核大小为3 ×3、 填充率为12、 采样率为12的卷积层, 一个卷积 核大小为3×3、 填充率为18、 采样率为18的卷积层, 以及一个由最大池化和上采样构成的池 化层; 该模块以步骤(3 ‑a)得到的特征图F5作为输入, 分别经过上述 并行的四个不同的卷积 层和一个池化层后, 得到5个不同的特征图, 将这 些特征图拼接后得到特征图Af, Af经过一个 卷积核大小为1 ×1的卷积层后得到特 征图Ff。 3.如权利要求1所述的一种边界引 导上下文聚合的交通场景语义分割方法, 其特征在 于, 所述步骤(3 ‑b)的注意力门控模块AGi, 该模块以步骤(3 ‑b)得到的特征图B1i与F′i+1作为 输入, i=1,2,3,4; 特征图B1i和F′i+1分别经过一个卷积核大小为1 ×1的卷积层后, 将它们得 到的结果逐像素相加, 再经过ReLu激活函数后得到中间特征图Matt, Matt依次经过一个卷积 核大小为1 ×1的卷积层和一个Sigmoid激活函数后再与B1i进行矩阵相乘, 得到AG模块的输 出特征图Bi+1, 该过程可表示 为: Matt=σ1(wbB1i+wfF′i+1) 其中, wb、 wf和watt分别代表与特征图B1i、 F′i+1和Matt进行卷积运算 时所对应卷积核的线 性变换系数, 表示矩阵相乘, σ1(·)和σ2(·)分别代表ReLu与Sigmoid激 活函数。 4.如权利要求1所述的一种边界引 导上下文聚合的交通场景语义分割方法, 其特征在 于, 所述步骤(3 ‑c)中的上下文聚合模块CAM, 该模块以步骤(3 ‑a)得到的特征图Ff和步骤 (3‑b)得到的特征图Bf作为输入; Ff经过一个卷积核大小为1 ×1的卷积层后得到特征图Q, Ff 经过另外一个卷积核大小为1 ×1的卷积层后得到特征图K, Bf经过一个卷积核大小为1 ×1 的卷积层后得到特征图V; 特征图K经Softmax函数后与特征图Q矩阵相乘, 得到中间特征图 G, G经过一个卷积核大小为1 ×1的卷积层后的结果再与特征图V经过Softmax函数后的结果 进行矩阵相乘, 得到的结果再与特征图Ff逐像素相加, 得到上下文聚合模块CAM的输出特征 图Fp, 它们的计算过程 为:权 利 要 求 书 2/3 页 3 CN 114782949 A 3

PDF文档 专利 一种边界引导上下文聚合的交通场景语义分割方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种边界引导上下文聚合的交通场景语义分割方法 第 1 页 专利 一种边界引导上下文聚合的交通场景语义分割方法 第 2 页 专利 一种边界引导上下文聚合的交通场景语义分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。