专利一种基于图像识别的数据采集方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211298321.5 (22)申请日 2022.10.23 (71)申请人河钢数字技术股份有限公司地址 050000 河北省石家庄市高新区中山东路856号科技创新服务中心1号楼 (72)发明人郑士良　次祎铭　安宝　黎荣华　刘威宪　杨秀丽　赵宇　刘培培　 (74)专利代理机构石家庄知住优创知识产权代理事务所(普通合伙) 13131 专利代理师王丽巧 (51)Int.Cl. G06V 30/146(2022.01) G06V 30/148(2022.01) G06F 16/22(2019.01) (54)发明名称一种基于图像识别的数据采集方法及系统 (57)摘要本发明公开了一种基于图像识别的数据采集方法及系统，方法包括以下步骤：获取系统内部或系统外部的图像数据；对传输至系统中的图像数据进行监控；对输入至系统中的图像数据进行预处理；定位出输入图像中的文字区域并生成包含文字区域的文本框；将文本框矫正为矩形框，并进行文本方向判断和校正；从矫正后矩形框中的文字区域识别出图像中文字内容；将识别出的文本信息转化为结构化数据并进行存储。本发明实现了应用系统界面自动截图、自动捕捉新增图像文件、自动提取图像中文本信息并将文本信息写入数据库或接口，整个过程免除人为操作，实现大量图像信息自动化处理，大大提高了数据采集的工作效率，节约了各方面的人力物力财力。权利要求书1页说明书3页附图1页 CN 115546792 A 2022.12.30 CN 115546792 A 1.一种基于图像识别的数据采集方法，其特征在于，包括以下步骤： S1. 获取系统内部或系统外部的图像数据； S2. 对传输至系统中的图像数据进行监控，以触发新增文件实时处理进程； S3. 对输入至系统中的图像数据进行预处理； S4. 定位出输入图像中的文字区域并生成包含文字区域的文本框； S5. 将文本框矫正为矩形框，并进行文本方向判断和校正； S6. 从矫正后矩形框中的文字区域识别出图像中文字内容； S7. 将识别出的文本信息转化为结构化数据并进行存储。 2.根据权利要求1所述的基于图像识别的数据采集方法，其特征在于：所述步骤S2中，采用watc hdog文件监控工具对指定文件路径进行监控。 3.根据权利要求1所述的基于图像识别的数据采集方法，其特征在于：所述步骤S3中，图像的预处理包括消除图像中的噪音和干扰以及对图像进行大小、偏转、浓淡以及粗细的正规化处理。 4.根据权利要求1所述的基于图像识别的数据采集方法，其特征在于：所述步骤S4中，采用基于DBNet的检测算法定位出输入图像中的文字区域，采用一个固定阈值得到二值化的分割图，之后采用启发式算法得到包含文字区域的文本框。 5.根据权利要求1所述的基于图像识别的数据采集方法，其特征在于：所述步骤S6中，采用基于 CRNN的文本识别算法识别出矩形框中的文字内容。 6.根据权利要求1所述的基于图像识别的数据采集方法，其特征在于：所述步骤S7中，将结构化数据存储到数据库中或输出至数据接口。 7.一种基于图像识别的数据采集系统，其特征在于，包括以下模块：图像获取模块，用于获取系统内部或外部的图像数据并将获取的图像数据作为新增文件传输至系统；文件实时捕捉模块，用于通过对系统中指定文件路径的监控实现新增文件实时触发进程；图像预处理模块，用于对输入至系统中的图像数据进行预处理；文本检测模块，用于在预处理后的输入图像中定位出文字区域并生成包含文字区域的文本框；检测框矫正模块，用于将文本检测模块生成的文本框矫正为矩形框并对文本方向进行判断和校正；文本识别模块，用于从输入图像矩形框中的文字区域识别出文字内容；信息输出模块，用于将文本识别模块提取出的文本信息转化为结构化数据并进行存储。 8.根据权利要求7所述的基于图像识别的数据采集系统，其特征在于：所述图像获取模块包括外部图像获取模块和内部图像获取模块，所述外部图像获取模块通过外部设备获取图像信息，所述内部图像获取模块通过自动截图功能获取图像信息。 9.根据权利要求7所述的基于图像识别的数据采集系统，其特征在于：所述外部设备包括扫描仪和高拍仪。权　利　要　求　书 1/1 页 2 CN 115546792 A 2一种基于图像识别的数据采集方法及系统技术领域 [0001]本发明属于大数据采集技术领域，具体涉及一种基于图像识别的数据采集方法及系统。背景技术 [0002]大数据时代，以图像为代表的非结构化数据为主的信息急剧增加，面对如此巨大的信息海洋，特别是非结构化数据信息，如何存储、查询、分析、挖掘和利用这些海量信息资源就显得尤为关键。提取图像中的文字信息，并将这些信息转化为便于存储、利用的结构化数据成的需求愈加迫切。 [0003]传统的数据采集模式，通过人工识别图像内容并录入系统，此过程过于繁琐且效率低下。另外有通过图像识别技术对图像中的文字信息进行解析的系统，但需要通过人工上传图片，在大量图片信息需要处理时，仍然效率不高。发明内容 [0004]本发明要解决的技术问题是针对现有技术的不足而提供一种基于图像识别的数据采集方法及系统，以提高数据采集的工作效率。 [0005]为解决上述技术问题，本发明的内容包括：一种基于图像识别的数据采集方法，包括以下步骤： S1. 获取系统内部或系统外部的图像数据； S2. 对传输至系统中的图像数据进行监控，以触发新增文件实时处理进程； S3. 对输入至系统中的图像数据进行预处理； S4. 定位出输入图像中的文字区域并生成包含文字区域的文本框； S5. 将文本框矫正为矩形框，并进行文本方向判断和校正； S6. 从矫正后矩形框中的文字区域识别出图像中文字内容； S7. 将识别出的文本信息转化为结构化数据并进行存储。 [0006]进一步的，所述步骤S2中，采用watc hdog文件监控工具对指定文件路径进行监控。 [0007]进一步的，所述步骤S3中，图像的预处理包括消除图像中的噪音和干扰以及对图像进行大小、偏转、浓淡以及粗细的正规化处理。 [0008]进一步的，所述步骤S 4中，采用基于DBNet的检测算法定位出输入图像中的文字区域，采用一个固定阈值得到二值化的分割图，之后采用启发式算法得到包含文字区域的文本框。 [0009]进一步的，所述步骤S6中，采用基于CRNN 的文本识别算法识别出矩形框中的文字内容。 [0010]进一步的，所述步骤S7中，将结构化数据存储到数据库中或输出至数据接口。 [0011]一种基于图像识别的数据采集系统，包括以下模块：图像获取模块，用于获取系统内部或外部的图像数据并将获取的图像数据作为新说　明　书 1/3 页 3 CN 115546792 A 3

专利 一种基于图像识别的数据采集方法及系统

专利一种基于图像识别的数据采集方法及系统