行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211298321.5 (22)申请日 2022.10.23 (71)申请人 河钢数字技 术股份有限公司 地址 050000 河北省石家庄市高新区中山 东路856号科技创新 服务中心1号楼 (72)发明人 郑士良 次祎铭 安宝 黎荣华  刘威宪 杨秀丽 赵宇 刘培培  (74)专利代理 机构 石家庄知住优创知识产权代 理事务所(普通 合伙) 13131 专利代理师 王丽巧 (51)Int.Cl. G06V 30/146(2022.01) G06V 30/148(2022.01) G06F 16/22(2019.01) (54)发明名称 一种基于图像识别的数据采集方法及系统 (57)摘要 本发明公开了一种基于图像识别的数据采 集方法及系统, 方法包括以下步骤: 获取系统内 部或系统外部的图像数据; 对传输至系统中的 图 像数据进行监控; 对输入至系统中的图像数据进 行预处理; 定位出输入图像中的文字区域并生成 包含文字区域的文本框; 将文本框矫正为矩形 框, 并进行文本方向判断和校正; 从矫正后矩形 框中的文字区域识别出图像中文字内容; 将识别 出的文本信息转化为结构化数据并进行存储。 本 发明实现了应用系统界面自动截图、 自动捕捉新 增图像文件、 自动提取图像中文本信息并将文本 信息写入数据库或接口, 整个过程免除人为操 作, 实现大量图像信息自动化处理, 大大提高了 数据采集的工作效率, 节约了各方面的人力物力 财力。 权利要求书1页 说明书3页 附图1页 CN 115546792 A 2022.12.30 CN 115546792 A 1.一种基于图像识别的数据采集方法, 其特 征在于, 包括以下步骤: S1. 获取系统内部或系统外 部的图像数据; S2. 对传输至系统中的图像数据进行监控, 以触发新增文件实时处 理进程; S3. 对输入至系统中的图像数据进行 预处理; S4. 定位出输入图像中的文字区域并生成包 含文字区域的文本 框; S5. 将文本框矫正为矩形框, 并进行文本方向判断和校正; S6. 从矫正后矩形框中的文字区域识别出图像中文字内容; S7. 将识别出的文本信息转 化为结构化数据并进行存 储。 2.根据权利要求1所述的基于图像识别的数据采集方法, 其特征在于: 所述步骤S2中, 采用watc hdog文件监控工具对指定文件路径进行监控。 3.根据权利要求1所述的基于图像识别的数据采集方法, 其特征在于: 所述步骤S3中, 图像的预处理包括消除图像中的噪音和干扰以及对图像进行大小、 偏转、 浓淡以及粗细的 正规化处理。 4.根据权利要求1所述的基于图像识别的数据采集方法, 其特征在于: 所述步骤S4中, 采用基于DBNet的检测算法定位出输入图像中的文字区域, 采用一个固定阈值得到二值化 的分割图, 之后采用启发式算法得到包 含文字区域的文本 框。 5.根据权利要求1所述的基于图像识别的数据采集方法, 其特征在于: 所述步骤S6中, 采用基于 CRNN的文本识别算法识别出矩形框中的文字内容。 6.根据权利要求1所述的基于图像识别的数据采集方法, 其特征在于: 所述步骤S7中, 将结构化数据存 储到数据库中或输出至数据接口。 7.一种基于图像识别的数据采集系统, 其特 征在于, 包括以下模块: 图像获取模块, 用于获取系统内部或外部的图像数据并将 获取的图像数据作为新增文 件传输至系统; 文件实时捕捉模块, 用于通过对系统中指定文件路径的监控实现新增文件实时触发进 程; 图像预处 理模块, 用于对输入至系统中的图像数据进行 预处理; 文本检测模块, 用于在预处理后的输入图像中定位出文字区域并生成包含文字区域的 文本框; 检测框矫正模块, 用于将文本检测模块生成的文本框矫正为矩形框并对文本方向进行 判断和校正; 文本识别模块, 用于从输入图像矩形框中的文字区域识别出文字内容; 信息输出模块, 用于将文本识别模块提取出的文本信息转化为结构化数据并进行存 储。 8.根据权利要求7所述的基于图像识别的数据采集系统, 其特征在于: 所述图像获取模 块包括外部图像获取模块和内部图像获取模块, 所述外部图像获取模块通过外部设备获取 图像信息, 所述内部图像获取模块 通过自动截图功能获取图像信息 。 9.根据权利要求7所述的基于图像识别的数据采集系统, 其特征在于: 所述外部设备包 括扫描仪和高拍仪 。权 利 要 求 书 1/1 页 2 CN 115546792 A 2一种基于图像识别的数据采集方 法及系统 技术领域 [0001]本发明属于大数据采集技术领域, 具体涉及一种基于图像识别的数据采集方法及 系统。 背景技术 [0002]大数据时代, 以图像为代表的非结构化数据为主的信息急剧增加, 面对如此巨大 的信息海洋, 特别是非结构化数据信息, 如何存储、 查询、 分析、 挖掘和利用这些海量信息 资 源就显得尤为关键。 提取图像中的文字信息, 并将这些信息转化为便于存储、 利用的结构化 数据成的需求愈加迫切。 [0003]传统的数据采集模式, 通过人工识别图像内容并录入系统, 此过程过于繁琐且效 率低下。 另外有通过图像识别技术对图像中的文字信息进行解析 的系统, 但需要通过人工 上传图片, 在大量图片信息需要处 理时, 仍然效率 不高。 发明内容 [0004]本发明要解决的技术问题是针对现有技术的不足而提供一种基于图像识别的数 据采集方法及系统, 以提高数据采集的工作效率。 [0005]为解决上述 技术问题, 本发明的内容包括: 一种基于图像识别的数据采集方法, 包括以下步骤: S1. 获取系统内部或系统外 部的图像数据; S2. 对传输至系统中的图像数据进行监控, 以触发新增文件实时处 理进程; S3. 对输入至系统中的图像数据进行 预处理; S4. 定位出输入图像中的文字区域并生成包 含文字区域的文本 框; S5. 将文本框矫正为矩形框, 并进行文本方向判断和校正; S6. 从矫正后矩形框中的文字区域识别出图像中文字内容; S7. 将识别出的文本信息转 化为结构化数据并进行存 储。 [0006]进一步的, 所述 步骤S2中, 采用watc hdog文件监控工具对指定文件路径进行监控。 [0007]进一步的, 所述步骤S3中, 图像 的预处理包括消除图像中的噪音和干扰以及对图 像进行大小、 偏转、 浓淡以及粗细的正 规化处理。 [0008]进一步的, 所述步骤S 4中, 采用基于DBNet的检测算法定位出输入图像中的文字区 域, 采用一个固定阈值得到二值化的分割图, 之后采用启发式算法得到包含文字区域的文 本框。 [0009]进一步的, 所述步骤S6中, 采用基于CRNN 的文本识别算法识别出矩形框中的文字 内容。 [0010]进一步的, 所述 步骤S7中, 将结构化数据存 储到数据库中或输出至数据接口。 [0011]一种基于图像识别的数据采集系统, 包括以下模块: 图像获取模块, 用于获取系统内部或外部的图像数据并将获取的图像数据作为新说 明 书 1/3 页 3 CN 115546792 A 3

.PDF文档 专利 一种基于图像识别的数据采集方法及系统

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于图像识别的数据采集方法及系统 第 1 页 专利 一种基于图像识别的数据采集方法及系统 第 2 页 专利 一种基于图像识别的数据采集方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:32:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。