行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211218251.8 (22)申请日 2022.09.30 (71)申请人 三一汽车起重 机械有限公司 地址 410600 湖南省长 沙市宁乡县金州大 道西168号 (72)发明人 何理 唐熹微 钟燕  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 葛美华 (51)Int.Cl. G06V 30/414(2022.01) G06V 30/418(2022.01) G06V 10/80(2022.01) G06V 30/14(2022.01) G06V 30/146(2022.01)G06V 30/19(2022.01) (54)发明名称 文本识别方法、 系统、 装置、 设备及存 储介质 (57)摘要 本发明涉及图像识别技术领域, 尤其涉及一 种文本识别方法、 系统、 装置、 设备及存储介质。 文本识别方法, 该方法包括: 获取目标识别 区域 的至少两张待识别图像, 其中, 每两张待识别图 像的图像采集时刻相同, 且每两张待识别图像的 图像采集方位不同; 分别对每一张待识别图像进 行文本识别, 获得每一张待识别图像 分别对应的 子识别结果; 融合每一个子识别结果, 获得目标 识别区域对应的文本识别结果。 本发 明用以解决 现有技术中文本识别结果 准确性较低的缺陷。 权利要求书2页 说明书11页 附图5页 CN 115512380 A 2022.12.23 CN 115512380 A 1.一种文本识别方法, 其特 征在于, 包括: 获取目标识别区域的至少两张待识别图像, 其中, 每两张所述待识别图像的图像采集 时刻相同, 且每两张所述待识别图像的图像采集方位 不同; 分别对每一张所述待识别图像进行文本识别, 获得每一张所述待识别图像分别对应的 子识别结果; 融合每一个所述子识别结果, 获得 所述目标识别区域对应的文本识别结果。 2.根据权利要求1所述的文本识别方法, 其特征在于, 所述分别对每一张所述待识别图 像进行文本识别, 获得每一张所述待识别图像分别对应的子识别结果, 包括: 对每一张所述待识别图像进行如下处 理: 检测所述待识别图像中的至少一个文本框, 其中, 所述文本框为文本所在的框图区域; 分别对每一个所述文本框进行文字识别, 获得每一个所述文本框分别对应的单元识别结 果; 基于所述单 元识别结果, 获取 所述待识别图像对应的所述子识别结果。 3.根据权利要求2所述的文本识别方法, 其特征在于, 所述检测所述待识别图像中的至 少一个文本 框之后, 还 包括: 获取每一个所述文本 框基于所述目标识别区域的位置信息; 所述融合每一个所述子识别结果, 获得 所述目标识别区域对应的文本识别结果, 包括: 对每两张所述待识别图像进行如下处理: 根据所述位置信息, 确定第一张所述待识别 图像中每一个所述文本框, 与第二张所述待识别图像中每一个所述文本框的重叠度; 基于 所述重叠度, 确定第一张所述待识别图像和 第二张所述待识别图像不重叠的所述单元识别 结果, 以及确定第一张所述待识别图像和第二张所述待识别图像重叠的所述单元识别结 果; 基于每两张所述待识别图像中不重叠的所述单元识别结果和重叠的所述单元识别结 果, 获得所述目标识别区域对应的所述文本识别结果。 4.根据权利要求3所述的文本识别方法, 其特征在于, 所述基于所述重叠度, 确定第一 张所述待识别图像和第二张所述待识别图像不重 叠的所述单 元识别结果, 包括: 确定第一张所述待识别图像中, 所述重 叠度小于或等于 重叠阈值的第一文本 框; 确定第二张所述待识别图像中, 所述重 叠度小于或等于所述重 叠阈值的第二文本 框; 确定所述第 一文本框对应的所述单元识别结果, 和所述第 二文本框对应的所述单元识 别结果, 为 不重叠的所述单 元识别结果。 5.根据权利要求3所述的文本识别方法, 其特征在于, 所述确定第 一张所述待识别图像 和第二张所述待识别图像重 叠的所述单 元识别结果, 包括: 确定所述重叠度大于重叠阈值的至少一个文本框对, 其中, 所述文本框对包括一个第 一张所述待识别图像中的所述文本 框, 和一个第二张所述待识别图像中的所述文本 框; 融合所述文本 框对对应的所述单 元识别结果, 获得重 叠的所述单 元识别结果。 6.根据权利要求5所述的文本识别方法, 其特征在于, 所述分别对每一个所述文本框进 行文字识别之后, 还 包括: 获得每一个所述单元识别结果分别对应的识别准确度, 其中, 所述识别准确度与所述 文本框一一对应; 所述融合所述文本框对对应的所述单元识别结果, 获得重叠的所述单元识别结果, 包权 利 要 求 书 1/2 页 2 CN 115512380 A 2括: 在所述第一张所述待识别图像中所述文本框的单元识别结果, 与第 二张所述待识别图 像中所述文本框的单元识别结果相同的情况下, 确定所述第一张所述待识别图像中所述文 本框的单元识别结果 为重叠的所述单 元识别结果; 在所述第一张所述待识别图像中所述文本框的单元识别结果, 与第 二张所述待识别图 像中所述文本框的单元识别结果不同的情况下: 基于所述文本框对, 比较第一识别准确度 和第二识别准确度, 其中, 所述第一识别准确度为第一张所述待识别图像中所述文本框对 应的识别准确度, 所述第二识别准确度为第二张所述待识别图像中所述文本框对应的识别 准确度; 当所述第一识别准确度大于或等于所述第二识别准确度时, 确定所述第一张所述 待识别图像中所述文本框的单元识别结果为重叠的所述单元识别结果; 当所述第一识别准 确度小于所述第二识别准确度时, 确定所述第二张所述待识别图像中所述文本框的单元识 别结果为重叠的所述单 元识别结果。 7.一种文本识别系统, 其特征在于, 包括处理器和至少两个图像采集设备, 其中, 至少 两个所述图像采集设备安装于目标识别区域的不同方位; 所述图像采集设备, 用于采集所述目标识别区域的待识别图像, 并将所述待识别图像 传输给所述处理器; 所述处理器, 用于获取目标识别区域的至少两张待识别图像, 其中, 每两张所述待识别 图像的图像采集时刻相同, 且每两张所述待识别图像的图像采集方位不同; 分别对每一张 所述待识别图像进行文本识别, 获得每一张所述待识别图像分别对应的子识别结果; 融合 每一个所述子识别结果, 获得 所述目标识别区域对应的文本识别结果。 8.一种文本识别装置, 其特 征在于, 包括: 获取模块, 用于获取目标识别区域的至少两张待识别图像, 其中, 每两张所述待识别图 像的图像采集时刻相同, 且每两张所述待识别图像的图像采集方位 不同; 识别模块, 用于分别对每一张所述待识别图像进行文本识别, 获得每一张所述待识别 图像分别对应的子识别结果; 融合模块, 用于融合每一个所述子识别结果, 获得所述目标识别区域对应的文本识别 结果。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述的文本识别方法。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处 理器执行时实现如权利要求1至 6任一项所述的文本识别方法。权 利 要 求 书 2/2 页 3 CN 115512380 A 3

.PDF文档 专利 文本识别方法、系统、装置、设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本识别方法、系统、装置、设备及存储介质 第 1 页 专利 文本识别方法、系统、装置、设备及存储介质 第 2 页 专利 文本识别方法、系统、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:58:11上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。