行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211212565.7 (22)申请日 2022.09.29 (71)申请人 建信金融科技有限责任公司 地址 200120 上海市中国 (上海) 自由贸易 试验区银城路9 9号12层、 15层 (72)发明人 徐谦  (74)专利代理 机构 中原信达知识产权代理有限 责任公司 1 1219 专利代理师 李阳 徐敏 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/22(2019.01) G06F 16/25(2019.01) G06Q 30/02(2012.01) (54)发明名称 一种数据处 理方法和装置 (57)摘要 本发明公开了一种数据处理方法和装置, 涉 及数据分析领域。 该方法的一具体实施方式包括 响应于确定的业务模型, 获取所述业务模型及其 对应的文件和程序; 解析配置文件以获取用户数 据, 解析用户文件得到用户画 像, 调用处理程序, 生成与用户画 像对应的数据集合, 并对应存储至 业务表格; 解析所述产品文件得到产品信息, 调 取文本库接口, 根据产品信息筛选得到匹配的文 本信息, 并存储至业务表格, 调取预设的渠道库 接口, 从渠道库中筛选得到匹配于用户画像的渠 道信息, 并根据所述匹配关系存储至业务表格; 输出所述业务表格至下游处理节点。 从而, 本发 明的实施方式能够解决现有业务模型适用的业 务场景单一的技 术问题。 权利要求书3页 说明书9页 附图5页 CN 115495658 A 2022.12.20 CN 115495658 A 1.一种数据处 理方法, 其特 征在于, 包括: 响应于确定的业务模型, 获取所述业务模型对应的配置文件、 产品文件、 用户文件、 处 理程序; 解析配置文件得到源数据的地址和格式, 以获取用户数据, 解析用户文件得到多个用 户画像, 调用处理程序, 根据所述用户数据生 成与多个用户画像对应的多个数据集合, 并对 应存储至业务表格; 解析所述产品文件得到产品信息, 调取文本库接口, 根据产品信息筛选得到匹配的文 本信息, 并根据业务表格中产品信息和用户画像的对应关系, 建立文本信息和用户画像的 对应关系并存储至业务表格, 调取预设的渠道库接口, 从渠道库中筛选得到匹配于多个用 户画像的多个渠道信息, 并根据所述匹配关系存 储至业务表格; 输出所述业务表格至下游处 理节点。 2.根据权利要求1所述的方法, 其特 征在于, 响应于确定的业 务模型之前, 包括: 获取业务信息, 新建业务模型, 对业务模型进行编号以绑定所述业务模型和所述业务 信息。 3.根据权利要求2所述的方法, 其特征在于, 对业务模型进行编号以绑定所述业务模型 和所述业务信息之后, 包括: 调取链接库接口, 从链接库中筛选得到匹配于业务信息的源数据地址信息和格式信 息, 在业务模型中新建配置文件以存 储所述源数据地址信息和格式信息 。 4.根据权利要求2所述的方法, 其特征在于, 对业务模型进行编号以绑定所述业务模型 和所述业务信息之后, 包括: 调取产品库接口, 从产品库中筛选得到匹配于业务信息的产品信息, 在业务模型中新 建产品文件以存 储所述产品信息 。 5.根据权利要求4所述的方法, 其特征在于, 新建产品文件以存储所述产品信息之后, 包括: 调取用户库接口, 从用户库中筛选得到和所述产品信 息的指定关键字段相似度 大于预 设的第一阈值的多个用户信息; 基于所述的多个用户信息, 生成所述的产品信息对应的多个用户画像, 生成业务表格 以记录产品信息和用户画像的对应关系, 将业 务表格存 储至用户文件。 6.根据权利要求1所述的方法, 其特 征在于, 获取用户数据之后, 包括: 调取用户库接口, 从用户库中筛选得到和所述产品信 息的预设的指定关键字段相似度 小于预设的第二阈值的多个用户信息; 分析得到所述多个用户信息的共同关键 字段。 7.根据权利要求6所述的方法, 其特征在于, 分析得到所述多个用户信 息的共同关键字 段之后, 包括: 根据预设的排序规则, 使用所述多个共 同关键字段对所述用户数据进行有序筛选, 将 用户数据替换为有序筛 选后的用户数据。 8.根据权利要求1述的方法, 其特征在于, 根据所述用户数据生成与多个用户画像对应 的多个数据集 合, 包括: 逐一将用户画像和全部的用户数据进行相似度比对, 筛选得到用户数据中相似度 大于权 利 要 求 书 1/3 页 2 CN 115495658 A 2预设的第三阈值的多个数据, 将所述多个数据作为和所述用户画像对应的数据集 合。 9.根据权利要求1述的方法, 其特征在于, 建立文本信 息和用户画像的对应关系并存储 至业务表格之后, 包括: 调用预设的优化程序, 提取文本信息中每个语句中逻辑标识为连接词的词语, 对所述 连接词进行逻辑排序, 根据排序结果对包括所述连接词的语句进行相同顺序的排序, 并将 排序后的文本信息和用户画像对应记录 至业务表格。 10.一种数据处 理装置, 其特 征在于, 包括: 获取模块, 用于响应于确定的业务模型, 获取所述业务模型对应的配置文件、 产品文 件、 用户文件、 处 理程序; 处理模块, 用于解析配置文件得到源数据的地址和格 式, 以获取用户数据, 解析用户文 件得到多个用户画像, 调用处理程序, 根据所述用户数据生成与多个用户画像对应的多个 数据集合, 并对应存储至业务表格; 解析所述产品文件得到产品信息, 调取文本库接口, 根 据产品信息筛选得到匹配的文本信息, 并根据业务表格中产品信息和用户画像的对应关 系, 建立文本信息和用户画像的对应关系并存储至业务表格, 调取预设的渠道库接口, 从渠 道库中筛选得到匹配于多个用户画像的多个渠道信息, 并根据所述匹配关系存储至业务表 格; 传输模块, 用于 输出所述业务表格至下游处 理节点。 11.根据权利要求10所述的装置, 其特 征在于, 包括: 获取模块, 用于获取业务信息, 新建业务模型, 对业务模型进行编号以绑定所述业务模 型和所述 业务信息。 12.根据权利要求10所述的装置, 其特 征在于, 包括: 处理模块, 用于调取链接库接口, 从链接库中筛选得到匹配于业务信息的源数据地址 信息和格式信息, 在业 务模型中新建配置文件以存 储所述源数据地址信息和格式信息 。 13.根据权利要求10所述的装置, 其特 征在于, 包括: 处理模块, 用于调取产品库接口, 从产品库中筛选得到匹配于业务信 息的产品信 息, 在 业务模型中新建产品文件以存 储所述产品信息 。 14.根据权利要求10所述的装置, 其特 征在于, 包括: 处理模块, 用于调取用户库接口, 从用户库中筛选得到和所述产品信息的指定关键字 段相似度大于预设的第一阈值的多个用户信息; 基于所述的多个用户信息, 生成所述的产品信息对应的多个用户画像, 生成业务表格 以记录产品信息和用户画像的对应关系, 将业 务表格存 储至用户文件。 15.根据权利要求10所述的装置, 其特 征在于, 包括: 处理模块, 用于调取用户库接口, 从用户库中筛选得到和所述产品信息的预设的指定 关键字段相似度小于预设的第二阈值的多个用户信息; 分析得到所述多个用户信息的共同关键 字段。 16.根据权利要求10所述的装置, 其特 征在于, 包括: 处理模块, 用于根据预设的排序规则, 使用所述多个共 同关键字段对所述用户数据进 行有序筛 选, 将用户数据替换为有序筛 选后的用户数据。 17.根据权利要求10所述的装置, 其特 征在于, 包括:权 利 要 求 书 2/3 页 3 CN 115495658 A 3

.PDF文档 专利 一种数据处理方法和装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法和装置 第 1 页 专利 一种数据处理方法和装置 第 2 页 专利 一种数据处理方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:32:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。