行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211149557.2 (22)申请日 2022.09.21 (71)申请人 深圳壹账通智能科技有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室(入驻深圳市 前海商务秘书 有限公司) (72)发明人 陈旷雨 尚昊  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06F 16/22(2019.01) (54)发明名称 Excel数据入库方法、 装置、 电子设备及计算 机存储介质 (57)摘要 本发明涉及数据处理技术, 揭露一种Excel 数据入库方法, 包括: 识别待入库的Exc el表单中 的数值区域及表头区域, 利用所述数值区域内每 个单元格的行号和列号, 生 成每个单元格对应的 二维数值记录, 汇集所有二维数值记录, 得到所 述数值区域对应的事实表, 对所述表头区域内的 每个单元格进行维度类型和维度层级的标注, 利 用标注后的维度类型和维度层 级, 生成所述表头 区域内每个单元格对应的二维维度记录, 汇集所 有二维维度记录, 得到所述表头区域对应的维度 表, 将所述事实表和所述维度表进行关联得到数 据转换表, 对所述数据转换表执行入库操作。 本 发明还提出一种Excel数据入库装置、 设备以及 介质。 本发明可以提升提升Excel数据入库操作 的效率和通用性。 权利要求书3页 说明书12页 附图4页 CN 115481125 A 2022.12.16 CN 115481125 A 1.一种Excel数据入库方法, 其特 征在于, 所述方法包括: 获取待入库的Excel表单, 识别所述待入库的Excel表单中的数值区域及表头区域; 依次获取所述数值区域中每个单元格对应的数值内容, 并以对应单元格所在的行号和 列号作为主键, 生成对应单元格的二维数值记录, 汇集所述数值区域内所有单元格对应的 二维数值记录, 得到所述数值区域对应的事实表; 对所述表头区域内的每个单元格进行维度类型和维度层级的标注, 其中, 所述维度类 型包括行维度和列维度; 依次获取所述表头区域内每个单元格对应的表头 内容, 并以对应单元格所在的起始行 号和起始列号作为主键, 将对应单元格的表头内容、 标注后的维度类型及维度层级组合成 对应单元格的二维维度记录, 汇集所述表头区域内所有单元格对应的二维维度记录, 得到 所述表头区域对应的维度表; 根据所述待入库的Excel表单中的行号和列号信息, 将所述事实表和所述维度表进行 关联得到数据转换表, 对所述数据转换表执 行入库操作。 2.如权利 要求1所述的Excel数据入库方法, 其特征在于, 所述识别所述待入库的Excel 表单中的数值区域及表头区域, 包括: 将所述待入库的Excel表单与预设的Excel模板库 中的Excel模板进行最大匹配操作, 其中, 所述Excel模板包括表头区域标签和数值区域标签; 根据匹配到的Excel模板的表头区域标签和数值区域标签对所述待入库的Excel表单 进行划分, 得到所述待入库的Excel表单中的数值区域及表头区域。 3.如权利要求1所述的Excel数据入库方法, 其特征在于, 所述依次获取所述数值区域 中每个单元格对应的数值内容之前, 所述操作还 包括: 当单元格是合并单元格时, 读取所述合并单元格的数值内容, 并记录所述合并单元格 的起始行号、 起始列号、 结束行号及结束列号; 对所述合并单元格执行撤销合并单 元格的操作; 将所述合并单元格的数值内容赋值到对所述起始行号、 所述起始列号、 所述结束行号 及所述结束列号所锁定的区域内的每 个独立单元格。 4.如权利要求1所述的Excel数据入库方法, 其特征在于, 所述对所述表头区域内的每 个单元格进行维度类型和维度层级的标注, 其中, 所述维度类型包括行维度和列维度, 包 括: 提取所述表头区域内每 个单元格的文本特 征; 依次选择 所述表头区域内一个单 元格作为目标 单元格; 计算所述目标单元格的文本特征与所述表头区域内所述目标单元格同行单元格的文 本特征之间的行关联度; 计算所述目标单元格的文本特征与所述表头区域内所述目标单元格同列单元格的文 本特征之间的列关联度; 比较所述行关联度与 所述列关联度之间的大小, 当所述行关联度不小于所述列关联度 时, 将所述目标单元格的维度类型标注为行维度, 当所述行关联度小于所述列关联度时, 将 所述目标 单元格的维度类型 标注为列维度; 当所述目标单元格的维度类型为行维度时, 按照从左到右的顺序识别所述目标单元格权 利 要 求 书 1/3 页 2 CN 115481125 A 2在所述表头区域内同行单元格中的位置顺序, 将识别到的位置顺序作为所述目标单元格的 维度层级; 当所述目标单元格的维度类型为列维度时, 按照从上到下的顺序识别所述目标单元格 在所述表头区域内同列单元格中的位置顺序, 将识别到的位置顺序作为所述目标单元格的 维度层级。 5.如权利 要求1至4中任一项所述的Excel数据入库方法, 其特征在于, 所述根据所述待 入库的Excel表单中的行号和列号信息, 将所述事实表和所述维度表进行关联得到数据转 换表, 包括: 将所述事实表中的行号与所述维度表中的起始行号做一 致性比较; 将比较结果一致的所有起始行号对应的二维维度记录追加到对应行号的事实表中二 维数值记录中; 将所述事实表中的列号与所述维度表中的起始列号做一 致性比较; 将比较结果一致的所有起始列号对应的二维维度记录追加到对应行号的事实表中二 维数值记录中, 将追加后的事实表作为所述数据转换表。 6.一种Excel数据入库装置, 其特 征在于, 所述装置包括: 区域划分模块, 用于获取待入库的Excel表单, 识别所述待入库的Excel表单中的数值 区域及表头区域; 事实表生成模块, 用于依次获取所述数值区域中每个单元格对应的数值内容, 并以对 应单元格所在的行号和列号作为主键, 生成对应单元格的二维数值记录, 汇集所述数值区 域内所有单 元格对应的二维数值记录, 得到所述数值区域对应的事实表; 维度表生成模块, 用于对所述表头区域内的每个单元格进行维度类型和维度层级的标 注, 其中, 所述 维度类型包括行维度和列维度; 依次获取所述表头区域内每个单元格对应的 表头内容, 并以对应单元格所在的起始行号和 起始列号作为主键, 将对应单元格的表头内 容、 标注后的维度类型及维度层级组合成对应单元格的二维维度记录, 汇集所述表头区域 内所有单 元格对应的二维 维度记录, 得到所述表头区域对应的维度表; 事实表与维度表关联模块, 用于根据所述待入库的Excel表单中的行号和列号信息, 将 所述事实表和所述维度表进行关联 得到数据转换表, 对所述数据转换表执 行入库操作。 7.如权利要求6所述的Excel数据入库装置, 其特征在于, 所述区域划分模块通过下述 操作识别所述待入库的Excel表单中的数值区域及表头区域: 将所述待入库的Excel表单与预设的Excel模板库 中的Excel模板进行最大匹配操作, 其中, 所述Excel模板包括表头区域标签和数值区域标签; 根据匹配到的Excel模板的表头区域标签和数值区域标签对所述待入库的Excel表单 进行划分, 得到所述待入库的Excel表单中的数值区域及表头区域。 8.如权利要求6所述的Excel数据入库装置, 其特征在于, 所述事实表与维度表关联模 块通过下述操作将所述事实表和所述维度表进行关联 得到数据转换表: 将所述事实表中的行号与所述维度表中的起始行号做一 致性比较; 将比较结果一致的所有起始行号对应的二维维度记录追加到对应行号的事实表中二 维数值记录中; 将所述事实表中的列号与所述维度表中的起始列号做一 致性比较;权 利 要 求 书 2/3 页 3 CN 115481125 A 3

.PDF文档 专利 Excel数据入库方法、装置、电子设备及计算机存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 Excel数据入库方法、装置、电子设备及计算机存储介质 第 1 页 专利 Excel数据入库方法、装置、电子设备及计算机存储介质 第 2 页 专利 Excel数据入库方法、装置、电子设备及计算机存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:30:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。