行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211133176.5 (22)申请日 2022.09.16 (71)申请人 平安消费金融有限公司 地址 200120 上海市浦东 新区自由贸易试 验区陆家嘴环路13 33号18层 (72)发明人 刘栩良  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/242(2019.01) G06F 16/28(2019.01) G06K 9/62(2022.01) G06N 7/00(2006.01) (54)发明名称 业务数据跑批方法、 装置、 电子设备及存储 介质 (57)摘要 本发明涉及人工智能, 揭露一种业务数据跑 批方法, 包括: 基于参考属性和朴素贝 叶斯算法 对多张数据表格进行属性预测, 得到数据表格对 应的特征属性; 判断特征属性与真实属性是否一 致, 若一致, 将朴素贝 叶斯算法构建的模型作为 数据跑批模型; 若不一致, 调整朴素贝 叶斯算法 中的参数配置并重新执行属性预测, 直至新的特 征属性和真实属性一致, 将调整参数配置后的朴 素贝叶斯算法构建的模型作为数据跑批模型; 根 据服务器及数据跑批模型对待处理数据进行跑 批处理, 得到 跑批后的业务数据。 此外, 本发明还 涉及区块链 技术, 特征属性可存储于区块链的节 点。 本发明还提出一种业务数据跑批装置、 电子 设备以及存储介质。 本发明可以提高业务数据跑 批的效率。 权利要求书2页 说明书12页 附图3页 CN 115408400 A 2022.11.29 CN 115408400 A 1.一种业 务数据跑批方法, 其特 征在于, 所述方法包括: 从预设数据仓库中获取多 张数据表格及所述数据表格对应的参考属性, 所述参考属性 包括身份属性, 通信属性和金融属性; 基于所述参考属性和预设的朴素贝叶斯算法对多张所述数据表格进行属性预测, 得到 所述数据表格对应的特 征属性; 判断所述特征属性与预设的真实属性是否一致, 若所述特征属性与所述真实属性一 致, 则将所述朴素贝叶斯 算法构建的模型作为数据跑批模型; 若所述特征属性与 所述真实属性不一致, 则调 整所述朴素贝叶斯算法中的参数配置并 重新执行属 性预测, 直至新的特征属 性和所述真实属 性一致, 将调整参数配置后的所述朴 素贝叶斯 算法构建的模型作为数据跑批模型; 根据服务器集群中的多个服务器及所述数据跑批模型对预获取的待处理数据进行跑 批处理, 得到跑批后的业 务数据。 2.如权利要求1所述的业务数据 跑批方法, 其特征在于, 所述从预设数据仓库中获取多 张数据表格, 包括: 获取至少一个历史查询语句, 对所述至少一个历史查询语句进行解析处理, 得到所述 至少一个历史查询语句的关联信息, 所述关联信息包括关联字段以及关联 条件; 基于所述关联信息确定所述至少一个历史查询语句对应的多张数据表格。 3.如权利要求1所述的业务数据 跑批方法, 其特征在于, 所述获取所述数据表格对应的 参考属性, 包括: 提取所述数据表格中的多条表格数据, 并对多条所述表格数据进行聚类处理, 得到数 据聚类子集; 在预获取的属性汇总表中搜索得到所述数据聚类子集对应的属性名称作为 参考属性。 4.如权利要求1所述的业务数据 跑批方法, 其特征在于, 所述基于所述参考属性和预设 的朴素贝叶斯算法对多张所述数据表格进行属性预测, 得到所述数据表格对应的特征属 性, 包括: 提取所述数据表格中的多条表格数据作为表格数据集, 并将所述表格数据集中的表格 数据划分到所述 参考属性下, 得到多个划分数据子集; 将所述参考属性作为所述划分数据子集的类别, 根据预设的类别概率计算公式计算各 个类别在所述表格数据集中的类别频率; 获取待训练样本集, 基于所述类别概率和所述训练样本集和预设的后验概率计算公式 计算每个类别对应的后验概率, 并对多个后验概率进行排序 处理, 将排序后最大 的后验概 率对应的类别作为所述数据表格对应的特 征属性。 5.如权利要求4所述的业务数据 跑批方法, 其特征在于, 所述预设的类别概率计算公式 为: 其中, P(Y=Ck)为所述类别概率, Ck表示第k个类别, K表示类别的总数, yi表示所述划分 数据子集, m表 示所述划分数据子集的数据个数, I(yi=Ck)是指所述划分数据子集yi中类别权 利 要 求 书 1/2 页 2 CN 115408400 A 2为第k个类别的数据个数, yi=Ck是指所述划分数据子集yi的类别为第k个 类别。 6.如权利要求1所述的业务数据 跑批方法, 其特征在于, 所述根据服务器集群中的多个 服务器及所述数据跑批模型对预获取的待处理数据进 行跑批处理, 得到跑批后的业务数据 之前, 所述方法还 包括: 对所述服务器领取到的分片任务进行任务 解析, 得到解析语句; 根据所述 解析语句从数据仓库中获取到对应的数据作为待处 理数据。 7.如权利要求1所述的业务数据 跑批方法, 其特征在于, 所述根据服务器集群中的多个 服务器及所述数据跑批模型对预获取的待处理数据进行跑批处理, 得到跑批后的业务数 据, 包括: 利用所述数据跑批模型对所述待处 理数据进行业 务处理, 得到初始数据; 判断所述初始数据是否为所述数据仓库中数据表格的末点数据, 若所述初始数据为末 点数据, 则将所述初始数据作为跑批后的业 务数据; 若所述初始数据不是末点数据, 则重新执行任务解析处理, 直至所述初始数据为末点 数据, 将新得到的数据作为跑批后的业 务数据。 8.一种业 务数据跑批装置, 其特 征在于, 所述装置包括: 数据提取模块, 用于从预设数据仓库中获取多 张数据表格及所述数据表格对应的参考 属性, 所述 参考属性包括身份属性, 通信属性和金融属性; 属性预测模块, 用于基于所述参考属性和预设的朴素贝叶斯算法对多张所述数据表格 进行属性预测, 得到所述数据表格对应的特 征属性; 模型训练模块, 用于判断所述特征属性与预设的真实属性是否一致, 若所述特征属性 与所述真实属 性一致, 则将所述朴素贝叶斯算法构建的模型作为数据跑批模型, 若所述特 征属性与所述真实属性不一致, 则调整所述朴素贝叶斯算法中的参数配置并重新执行属性 预测, 直至新的特征属 性和所述真实属 性一致, 将调整参数配置后的所述朴素贝叶斯算法 构建的模型作为数据跑批模型; 数据处理模块, 用于根据服务器集群中的多个服务器及所述数据 跑批模型对预获取的 待处理数据进行 跑批处理, 得到跑批后的业 务数据。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所 述的业务数据跑批方法。 10.一种存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处理器执行时 实现如权利要求1至7中任意 一项所述的业 务数据跑批方法。权 利 要 求 书 2/2 页 3 CN 115408400 A 3

.PDF文档 专利 业务数据跑批方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 业务数据跑批方法、装置、电子设备及存储介质 第 1 页 专利 业务数据跑批方法、装置、电子设备及存储介质 第 2 页 专利 业务数据跑批方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:34:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。