专利一种基于数据增强的细粒度图像分类方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211195834.3 (22)申请日 2022.09.29 (71)申请人江西理工大学地址 341000 江西省赣州市章贡区红旗大道86号 (72)发明人黄君洪　李伟　蒋海浪　 (74)专利代理机构南昌金轩知识产权代理有限公司 36129 专利代理师黄亮亮 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/20(2022.01) G06V 10/32(2022.01) G06V 10/40(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于数据增强的细粒度图像分类方法 (57)摘要本发明提供一种基于数据增强的细粒度图像识别方法，属于计算机视觉技术领域。本发明首先在训练阶段首先通过特征图定位对象最具有判别力的细微部件作为增强的部件图像，然后擦除对象最具有判别力的细微部件作为增强的互补图像。通过输入部件图像可以使模型学习对象最具有判别力的细微部件，通过输入互补图像可以迫使网络发现对象其他具有判别力的细微部件。本文所提出的方法先定位对象最具有判别力的部件作为增强的部件图像再进行擦除，提升了最具有判别力的部件在图像中的占比，在部件掩码的指导下进行擦除，避免了擦除时引入过多噪声，保证了擦除的准确性；模型可以学到对象的多个具有判别力的部件，提升细粒度图像分类效果。权利要求书3页说明书6页附图2页 CN 115546540 A 2022.12.30 CN 115546540 A 1.一种基于数据增强的细粒度图像分类方法，其特征在于，包括： S1数据预处理：对原始图像进行图像预处理得到训练图像； S2模型训练： S21将所述训练图像输入到骨干网络中得到特征图一，所述特征图一经过全连接层分类后计算分类的原始损失； S22根据所述特征图一对所述训练图像进行特征定位得到定位对象图； S23将所述定位对象图输入到骨干网络中得到特征图二，所述特征图二经过全连接层分类后计算分类的定位损失； S24根据所述特征图二对所述定位对象图进行数据增强处理得到部件图像和互补图像； S25依次将所述部件图像和所述互补图像输入到骨干网络和全连接层，并计算分类的部件损失和互补损失； S26将所述原始损失、定位损失、部件损失和互补损失之和作为模型的整体损失，通过反向传播更新模型参数； S27重复步骤S2，直到模型收敛或者达到指定的迭代次数； S3图像分类： S31将经过图像预处理的待分类图像输入到骨干网络中得到特征图三； S32根据所述特征图三对所述待分类图像进行特征定位得到定位对象图像； S33将所述定位对象图像输入到骨干网络和全连接层得到所述待分类图像对应的标签类别；所述骨干网络是以图像分类为训练任务的预训练模型；所述步骤S21、 S23、 S25中的骨干网络、全连接层是共享参数的。 2.如权利要求1所述的一种基于数据增强的细粒度图像分类方法，其特征在于，所述图像预处理包括：图像缩放、随机水平翻转、颜色抖动和归一化处理；所述图像缩放是将所述原始图像缩放到统一的尺寸。 3.如权利要求2所述的一种基于数据增强的细粒度图像分类方法，其特征在于，所述根据所述特征图一对所述训练图像进行特征定位得到定位对象图，包括：对所述特征图一在通道方向上进行求和得到激活图一A；计算所述激活图一的均值作为第一阈值 λ；根据第一阈值和激活图一计算对象掩码Mobj，计算公式如下：；对所述对象掩码进行双线性插值缩放到所述训练图像的大小，再与所述训练图像逐元素相乘得到定位对象图；所述对所述特征图一在通道方向上进行求和的计算公式为；其中， A(x,y)是激活图一在(x,y)位置处的数值； F∈RC x H x W表示骨干网络最后一层卷积层输出的特征图， Fi表示第i个通道的图像； C为特征图的通道数；权　利　要　求　书 1/3 页 2 CN 115546540 A 2W、 H分别是激活图一的像素宽度、像素高度。 4.如权利要求3所述的一种基于数据增强的细粒度图像分类方法，其特征在于，所述根据所述特征图二对所述定位对象图进行数据增强处理得到部件图像和互补图像，包括：对所述特征图二在通道方向上进行求和得到激活图二；取所述激活图二中的第H ×W×k大的值为第二阈值θ；根据所述第二阈值和激活图二计算部件掩码Mpart，计算公式如下：；对所述部件掩码进行双线性插值到所述训练图像的大小再求非零值的最小外接矩形得到边界框；根据所述边界框从所述定位对象图中裁剪出最具判别力的部件图像；根据所述部件掩码计算互补掩码，计算公式如下：；对所述互补掩码进行双线性插值放缩到所述训练图像的大小，再与所述训练图像逐元素相乘得到的互补图像；所述根据所述边界框从所述定位对象图中裁剪出最具判别力的部件图像，还包括将部件图像进行双线性插值到所述定位对象图的大小；其中， k为区间(0,1)的数； H、 W分别是激活图二的像素宽度、像素高度； B(x,y)是激活图二在(x,y)位置处的数值； Mpart(x,y)是部件掩码在(x,y)位置处的数值； Mcom(x,y)是互补掩码在(x,y)位置处的数值。 5.如权利要求4所述的一种基于数据增强的细粒度图像分类方法，其特征在于，所述根据所述特征图三对所述待分类图像进行特征定位得到定位对象图像，包括：对所述特征图三在通道方向上进行求和得到激活图三C；计算所述激活图三的均值作为第三阈值设置β；根据所述第三阈值和激活图三计算对象掩码，计算公式如下：；对所述对象掩码进行双线性插值缩放到所述待分类图像的大小，并与所述待分类图像逐元素相乘得到定位对象图；其中， C(x,y)是激活图三中(x,y)位置处的数值； Mnew(x,y)是对象掩码在(x,y)位置处的数值。 6.如权利要求1所述的一种基于数据增强的细粒度图像分类方法，其特征在于，所述计算分类的原始损失、计算分类的定位损失和计算分类的部件损失和互补损失，使用的损失函数都是交叉熵损失函数。权　利　要　求　书 2/3 页 3 CN 115546540 A 3

专利 一种基于数据增强的细粒度图像分类方法

专利一种基于数据增强的细粒度图像分类方法