专利一种识别表情的方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211149128.5 (22)申请日 2022.09.20 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人武文琦　 (74)专利代理机构北京晋德允升知识产权代理有限公司 1 1623 专利代理师王戈 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/80(2022.01) (54)发明名称一种识别表情的方法、装置、设备及介质 (57)摘要本说明书实施例公开了一种识别表情的方法，包括：获取包含人脸特征的待识别图像；基于局部二值模式算法，得到所述待识别图像对应的局部二值模式图像；获取所述待识别图像对应的第一图像特征和所述局部二值模式图像对应的第二图像特征；将所述第一图像特征和所述第二图像特征进行融合，得到融合后的图像特征；利用基于注意力机制搭建的表情识别模型，对所述融合后的图像特征进行处理，得到针对所述待识别图像的表情识别结果。权利要求书3页说明书11页附图3页 CN 115439912 A 2022.12.06 CN 115439912 A 1.一种识别表情的方法，包括：获取包含人脸特征的待识别图像；基于局部二值模式算法，得到所述待识别图像对应的局部二值模式图像；获取所述待识别图像对应的第一图像特征和所述局部二值模式图像对应的第二图像特征；将所述第一图像特征和所述第二图像特征进行融合，得到融合后的图像特征；利用基于注意力机制搭建的表情识别模型，对所述融合后的图像特征进行处理，得到针对所述待识别图像的表情识别结果。 2.根据权利要求1所述的方法，所述获取包含人脸图像的待识别图像之后，还包括：利用人脸对齐算法，对所述待识别图像进行人脸对齐处理。 3.根据权利要求1所述的方法，所述获取所述待识别图像对应的第一图像特征和所述局部二值模式图像对应的第二图像特征，具体包括：利用第一预设残差网络模型对所述待识别图像进行特征提取处理，得到所述待识别图像对应的第一图像特征；利用第二预设残差网络模型对所述局部二值模式图像进行特征提取处理，得到所述局部二值模式图像对应的第二图像特征。 4.根据权利要求3所述的方法，所述第一预设残差网络模型和/或所述第二预设残差网络模型包括ResNet模型。 5.根据权利要求1所述的方法，所述将所述第一图像特征和所述第二图像特征进行融合，得到融合后的图像特征，具体包括：基于第一特征融合算法，将所述第一图像特征和所述第二图像特征进行特征融合，得到融合后的图像特征；所述融合后的图像特征的特征维度与所述第一图像特征和所述第二图像特征的特征维度相同。 6.根据权利要求1所述的方法，所述将所述第一图像特征和所述第二图像特征进行融合，得到融合后的图像特征，具体包括：基于第一特征融合算法，将所述第一图像特征和所述第二图像特征进行特征融合，得到第一融合图像特征；所述第一融合图像特征的特征维度与所述第一图像特征和所述第二图像特征的特征维度相同；利用局部注意力机制提取所述第一融合图像特征的局部特征；利用全局注意力机制提取所述第一融合图像特征的全局特征；基于第二特征融合算法，将所述局部特征和所述全局特征进行特征融合，得到第二融合图像特征。 7.根据权利要求6所述的方法，所述基于第二特征融合算法，将所述局部特征和所述全局特征进行特征融合之前，还包括：对所述全局特征和所述局部特征进行非线性增强处理，得到处理后的全局特征和处理后的局部特征；所述将所述局部特征和所述全局特征进行特征融合，具体包括：将所述处理后的全局特征和所述处理后的局部特征进行特征融合。 8.根据权利要求1所述的方法，所述利用基于注意力机制搭建的表情识别模型，对所述权　利　要　求　书 1/3 页 2 CN 115439912 A 2融合后的图像特征进行处理，具体包括：将所述待识别图像划分为预设数量的子图像；获取各个子图像的图像特征；将所述融合后的图像特征与所述各个子图像的图像特征，按照预设排列顺序进行排列，得到特征输入队列；将所述特征输入队列输入所述利用基于注意力机制搭建的表情识别模型。 9.根据权利要求8所述的方法，所述表情识别模型包括位置编码器、 Transformer编码器以及表情分类器；所述将所述特征输入队列输入所述利用基于注意力机制搭建的表情识别模型，具体包括：利用所述位置编码器，对所述特征输入队列进行位置编码，得到特征序列；将所述特征序列输入所述Transformer编码器，得到编码特征；将所述编码特征输入所述表情分类器，得到表情识别结果。 10.根据权利要求8所述的方法，所述预设排列顺序是基于机器学习的方式确定的。 11.根据权利要求1所述的方法，所述待识别图像包括RGB图像、三维图像、近红外图像中至少一种。 12.根据权利要求1所述的方法，所述待识别图像为包括至少部分人脸面部特征的图像。 13.一种识别表情的装置，包括：图像获取模块，用于获取包含人脸特征的待识别图像；第一图像处理模块，用于基于局部二值模式算法，得到所述待识别图像对应的局部二值模式图像；特征提取模块，用于获取所述待识别图像对应的第一图像特征和所述局部二值模式图像对应的第二图像特征；特征融合模块，用于将所述第一图像特征和所述第二图像特征进行融合，得到融合后的图像特征；表情识别模块，用于利用基于注意力机制搭建的表情识别模型，对所述融合后的图像特征进行处理，得到针对所述待识别图像的表情识别结果。 14.一种识别表情的设备，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：获取包含人脸特征的待识别图像；基于局部二值模式算法，得到所述待识别图像对应的局部二值模式图像；获取所述待识别图像对应的第一图像特征和所述局部二值模式图像对应的第二图像特征；将所述第一图像特征和所述第二图像特征进行融合，得到融合后的图像特征；利用基于注意力机制搭建的表情识别模型，对所述融合后的图像特征进行处理，得到权　利　要　求　书 2/3 页 3 CN 115439912 A 3

专利 一种识别表情的方法、装置、设备及介质

专利一种识别表情的方法、装置、设备及介质