专利 图像处理方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210062375.5 (22)申请日 2022.01.19 (71)申请人美的集团（上海）有限公司地址 201700 上海市青浦区双联路158号1 幢11层B区1152室申请人美的集团股份有限公司 (72)发明人车正平　汪浩文　徐志远　奉飞飞　唐剑　 (74)专利代理机构北京路浩知识产权代理有限公司 11002 专利代理师郑朝然 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/26(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01) (54)发明名称图像处理方法及装置 (57)摘要本发明涉及图像处理技术领域，提供一种图像处理方法及装置，该方法包括：对初始RGB图像进行语义分割得到语义特征图；基于语义特征图中包括的前景概率及语义特征对与初始RGB图像对应的初始深度图像进行深度特征提取，得到深度特征向量，深度特征向量用于确定局部置信图及局部深度图；将深度特征向量和初始RGB图像进行特征融合，获得融合置信图和融合深度图；基于局部置信图、局部深度图、融合置信图以及融合深度图，得到目标深度图。该方法通过提取初始RGB图像的语义信息，引导准确刻画图像局部深度信息，同时优化全局深度图信息，提高目标深度图的深度信息的稠密度和准确性，为后续计算机视觉任务的提供保障。权利要求书3页说明书18页附图5页 CN 114511778 A 2022.05.17 CN 114511778 A 1.一种图像处理方法，其特征在于，所述方法还包括：对初始RGB图像进行语义分割得到语义特征图；基于所述语义特征图中包括的前景概率及语义特征对与所述初始RGB图像对应的初始深度图像进行深度特征提取，得到深度特征向量，所述深度特征向量用于确定局部置信图及局部深度图；将所述深度特征向量和所述初始RGB图像进行特征融合，获得融合置信图和融合深度图；基于所述局部置信图、所述局部深度图、所述融合置信图以及所述融合深度图，得到目标深度图。 2.根据权利要求1所述的图像处理方法，其特征在于，所述对初始RGB图像进行语义分割得到语义特征图，包括：将所述初始RGB图像输入至深度补齐模型的局部指导模块进行语义分割，获得所述局部指导模块输出的所述语义特征图；所述基于所述语义特征图中包括的前景概率及语义特征对与所述初始RGB图像对应的初始深度图像进行深度特征提取，得到深度特征向量，包括：将所述语义特征图和所述初始深度图像输入至所述深度补齐模型的约束网络进行深度特征提取，得到所述深度特征向量；所述将所述深度特征向量和所述初始RGB图像进行特征融合，获得融合置信图和融合深度图，包括：将所述初始RGB图像和所述深度特征向量输入至所述深度补齐模型的对抗生成网络，获得所述对抗生成网络输出的所述融合深度图和所述融合置信图；所述基于所述局部置信图、所述局部深度图、所述融合置信图以及所述融合深度图，得到目标深度图，包括：将所述局部深度图、所述局部置信图、所述融合深度图和所述融合置信图输入至所述深度补齐模型的输出网络，获得所述输出网络输出的所述目标深度图；其中，所述深度补齐模型为基于样本训练集训练得到。 3.根据权利要求2所述的图像处理方法，其特征在于，所述将所述初始RGB图像和所述深度特征向量输入至所述深度补齐模型的对抗生成网络，获得所述对抗生成网络输出的所述融合深度图和所述融合置信图，包括：将所述深度特征向量和所述初始RGB图像输入至所述对抗生成网络的生成器，由所述生成器基于所述深度特征向量重建所述初始RGB图像的深度信息，获得所述生成器输出的所述融合深度图和所述融合置信图；所述生成器是基于样本RGB图像和样本密集深度图，联合所述对抗生成网络的判别器进行对抗训练得到。 4.根据权利要求2所述的图像处理方法，其特征在于，所述将所述语义特征图和所述初始深度图像输入至所述深度补齐模型的约束网络进行深度特征提取，得到所述深度特征向量，包括：将所述语义特征图和所述初始深度图像输入至所述约束网络的编码器进行下采样处理，得到第一深度特征向量；权　利　要　求　书 1/3 页 2 CN 114511778 A 2将所述第一深度特征向量输入至所述约束网络的解码器进行上采样处理，得到第二深度特征向量。 5.根据权利要求4所述的图像处理方法，其特征在于，所述将所述初始RGB图像和所述深度特征向量输入至所述深度补齐模型的对抗生成网络，获得所述对抗生成网络输出的所述融合深度图和所述融合置信图，包括：将所述初始RGB图像输入至所述对抗生成网络进行下采样处理，得到第一特征向量；通过所述深度补齐模型的实例归一化模块对所述第一特征向量和第一深度特征向量进行特征融合，得到目标融合特征向量；对所述目标融合特征向量进行上采样处理，得到第二特征向量；通过所述实例归一化模块对所述第二特征向量和第二深度特征向量进行特征融合，获得所述对抗生成网络输出的所述融合深度图和所述融合置信图。 6.根据权利要求2所述的图像处理方法，其特征在于，所述所述局部深度图和所述局部置信图通过如下步骤确定：通过跳转连接的方式将所述约束网络的编码器中的所述深度特征向量输入至所述约束网络的解码器中的对称位置，得到所述解码器输出的所述局部深度图和所述局部置信图。 7.根据权利要求1 ‑6任一项所述的图像处理方法，其特征在于，所述基于所述局部置信图、所述局部深度图、所述融合置信图以及所述融合深度图，得到目标深度图，包括：基于所述局部深度图、所述局部置信图、所述融合深度图和所述融合置信图，获得局部注意力权重和融合注意力权重；基于所述局部注意力权重和所述融合注意力权重对所述局部深度图和所述融合深度图进行加权处理，得到所述目标深度图。 8.根据权利要求2 ‑6任一项所述的图像处理方法，其特征在于，所述样本训练集包括多个样本RGB图像及其对应的拟真深度图像；所述拟真深度图像通过如下步骤确定：基于所述样本RGB图像对应样本深度图像进行高光区域掩模，得到第一拟真深度图；基于所述样本深度图像进行目标像素区域掩模，得到第二拟真深度图；基于所述样本深度图像进行噪声点掩模，得到第三拟真深度图；基于所述样本深度图像进行语义标签随机掩模，得到第四拟真深度图；基于所述样本训练集中所有样本深度图像进行语义分割训练，确定掩模矩阵，得到第五拟真深度图；基于所述样本深度图像和所述第一至第五拟真深度图中的至少一个的深度信息，确定所述拟真深度图像。 9.根据权利要求2 ‑6任一项所述的图像处理方法，其特征在于，所述深度补齐模型训练的目标损失函数基于如下步骤确定：获取所述对抗生成网络的生成器的第一损失函数以及判别器的第二损失函数；基于所述局部深度图和所述目标深度图，得到第三损失函数和第四损失函数；基于所述第一损失函数、所述第二损失函数、所述第三损失函数和所述第四损失函数，得到所述目标损失函数。权　利　要　求　书 2/3 页 3 CN 114511778 A 3

专利 图像处理方法及装置

专利图像处理方法及装置