专利 文本识别方法、系统、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211218251.8 (22)申请日 2022.09.30 (71)申请人三一汽车起重机械有限公司地址 410600 湖南省长沙市宁乡县金州大道西168号 (72)发明人何理　唐熹微　钟燕　 (74)专利代理机构北京路浩知识产权代理有限公司 11002 专利代理师葛美华 (51)Int.Cl. G06V 30/414(2022.01) G06V 30/418(2022.01) G06V 10/80(2022.01) G06V 30/14(2022.01) G06V 30/146(2022.01)G06V 30/19(2022.01) (54)发明名称文本识别方法、系统、装置、设备及存储介质 (57)摘要本发明涉及图像识别技术领域，尤其涉及一种文本识别方法、系统、装置、设备及存储介质。文本识别方法，该方法包括：获取目标识别区域的至少两张待识别图像，其中，每两张待识别图像的图像采集时刻相同，且每两张待识别图像的图像采集方位不同；分别对每一张待识别图像进行文本识别，获得每一张待识别图像分别对应的子识别结果；融合每一个子识别结果，获得目标识别区域对应的文本识别结果。本发明用以解决现有技术中文本识别结果准确性较低的缺陷。权利要求书2页说明书11页附图5页 CN 115512380 A 2022.12.23 CN 115512380 A 1.一种文本识别方法，其特征在于，包括：获取目标识别区域的至少两张待识别图像，其中，每两张所述待识别图像的图像采集时刻相同，且每两张所述待识别图像的图像采集方位不同；分别对每一张所述待识别图像进行文本识别，获得每一张所述待识别图像分别对应的子识别结果；融合每一个所述子识别结果，获得所述目标识别区域对应的文本识别结果。 2.根据权利要求1所述的文本识别方法，其特征在于，所述分别对每一张所述待识别图像进行文本识别，获得每一张所述待识别图像分别对应的子识别结果，包括：对每一张所述待识别图像进行如下处理：检测所述待识别图像中的至少一个文本框，其中，所述文本框为文本所在的框图区域；分别对每一个所述文本框进行文字识别，获得每一个所述文本框分别对应的单元识别结果；基于所述单元识别结果，获取所述待识别图像对应的所述子识别结果。 3.根据权利要求2所述的文本识别方法，其特征在于，所述检测所述待识别图像中的至少一个文本框之后，还包括：获取每一个所述文本框基于所述目标识别区域的位置信息；所述融合每一个所述子识别结果，获得所述目标识别区域对应的文本识别结果，包括：对每两张所述待识别图像进行如下处理：根据所述位置信息，确定第一张所述待识别图像中每一个所述文本框，与第二张所述待识别图像中每一个所述文本框的重叠度；基于所述重叠度，确定第一张所述待识别图像和第二张所述待识别图像不重叠的所述单元识别结果，以及确定第一张所述待识别图像和第二张所述待识别图像重叠的所述单元识别结果；基于每两张所述待识别图像中不重叠的所述单元识别结果和重叠的所述单元识别结果，获得所述目标识别区域对应的所述文本识别结果。 4.根据权利要求3所述的文本识别方法，其特征在于，所述基于所述重叠度，确定第一张所述待识别图像和第二张所述待识别图像不重叠的所述单元识别结果，包括：确定第一张所述待识别图像中，所述重叠度小于或等于重叠阈值的第一文本框；确定第二张所述待识别图像中，所述重叠度小于或等于所述重叠阈值的第二文本框；确定所述第一文本框对应的所述单元识别结果，和所述第二文本框对应的所述单元识别结果，为不重叠的所述单元识别结果。 5.根据权利要求3所述的文本识别方法，其特征在于，所述确定第一张所述待识别图像和第二张所述待识别图像重叠的所述单元识别结果，包括：确定所述重叠度大于重叠阈值的至少一个文本框对，其中，所述文本框对包括一个第一张所述待识别图像中的所述文本框，和一个第二张所述待识别图像中的所述文本框；融合所述文本框对对应的所述单元识别结果，获得重叠的所述单元识别结果。 6.根据权利要求5所述的文本识别方法，其特征在于，所述分别对每一个所述文本框进行文字识别之后，还包括：获得每一个所述单元识别结果分别对应的识别准确度，其中，所述识别准确度与所述文本框一一对应；所述融合所述文本框对对应的所述单元识别结果，获得重叠的所述单元识别结果，包权　利　要　求　书 1/2 页 2 CN 115512380 A 2括：在所述第一张所述待识别图像中所述文本框的单元识别结果，与第二张所述待识别图像中所述文本框的单元识别结果相同的情况下，确定所述第一张所述待识别图像中所述文本框的单元识别结果为重叠的所述单元识别结果；在所述第一张所述待识别图像中所述文本框的单元识别结果，与第二张所述待识别图像中所述文本框的单元识别结果不同的情况下：基于所述文本框对，比较第一识别准确度和第二识别准确度，其中，所述第一识别准确度为第一张所述待识别图像中所述文本框对应的识别准确度，所述第二识别准确度为第二张所述待识别图像中所述文本框对应的识别准确度；当所述第一识别准确度大于或等于所述第二识别准确度时，确定所述第一张所述待识别图像中所述文本框的单元识别结果为重叠的所述单元识别结果；当所述第一识别准确度小于所述第二识别准确度时，确定所述第二张所述待识别图像中所述文本框的单元识别结果为重叠的所述单元识别结果。 7.一种文本识别系统，其特征在于，包括处理器和至少两个图像采集设备，其中，至少两个所述图像采集设备安装于目标识别区域的不同方位；所述图像采集设备，用于采集所述目标识别区域的待识别图像，并将所述待识别图像传输给所述处理器；所述处理器，用于获取目标识别区域的至少两张待识别图像，其中，每两张所述待识别图像的图像采集时刻相同，且每两张所述待识别图像的图像采集方位不同；分别对每一张所述待识别图像进行文本识别，获得每一张所述待识别图像分别对应的子识别结果；融合每一个所述子识别结果，获得所述目标识别区域对应的文本识别结果。 8.一种文本识别装置，其特征在于，包括：获取模块，用于获取目标识别区域的至少两张待识别图像，其中，每两张所述待识别图像的图像采集时刻相同，且每两张所述待识别图像的图像采集方位不同；识别模块，用于分别对每一张所述待识别图像进行文本识别，获得每一张所述待识别图像分别对应的子识别结果；融合模块，用于融合每一个所述子识别结果，获得所述目标识别区域对应的文本识别结果。 9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述的文本识别方法。 10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至 6任一项所述的文本识别方法。权　利　要　求　书 2/2 页 3 CN 115512380 A 3

专利 文本识别方法、系统、装置、设备及存储介质

专利文本识别方法、系统、装置、设备及存储介质