行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111535824.5 (22)申请日 2021.12.15 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 柯虹  (74)专利代理 机构 深圳众鼎专利商标代理事务 所(普通合伙) 44325 代理人 张小燕 (51)Int.Cl. G06F 16/906(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 用户分类的方法、 装置、 设备及存 储介质 (57)摘要 本申请涉及人工智能技术领域, 本申请公开 了一种用户分类的方法、 装置、 设备及存储介质, 通过将获取的用户数据项目中的缺失数据项目 进行填充, 并将填充后的特殊数据项目和常规数 据项目输入训练后的初次分类模型进行分类处 理, 得到初次分类结果; 由于包括特殊数据项目, 会导致最终分类结果的偏差, 将合初次分类结果 进行对应的权重调整, 并加权求和得到用户分类 结果, 提高了用户分类的稳定性, 从而保证了分 类结果的精确性。 权利要求书2页 说明书8页 附图3页 CN 114238726 A 2022.03.25 CN 114238726 A 1.一种用户分类的方法, 其特 征在于, 包括: 获取用户数据项目集合, 识别所述用户数据项目集合中的缺失数据项目和常规数据项 目, 得到多个缺失数据项目和多个常规数据项目; 通过特殊值填充法将多个所述 缺失数据项目填充为多个特殊数据项目; 将多个所述特殊数据项目和多个所述常规数据项目输入训练后的初级分类模型进行 初次分类处理, 得到初次分类结果集合, 其中, 所述初次分类结果集合中包括多个初次分类 结果; 通过训练后的用户分类模型对所述初次分类结果集合中的每个所述初次分类结果进 行权重调整后, 利用加权求和算法进行处 理, 得到用户分类结果。 2.如权利要求1所述的用户分类的方法, 其特征在于, 所述将多个所述特殊数据项目和 多个所述常规数据项目输入训练后的初级分类模型进 行初次分类处理, 得到包括多个初次 分类结果的初次分类结果 集合, 包括; 通过所述训练后的初级分类模型根据各所述常规数据项目的IV值进行初次分类处理, 得到所述常规数据项目对应的常规数据初次分类结果; 通过所述训练后的初级分类模型中的WOE编码单元对各所述特殊数据项目进行初次分 类处理, 得到所述特殊数据项目对应的特殊数据初次分类结果; 将各所述特殊数据初次分类结果和各所述常规数据初次分类结果进行整合, 得到初次 分类结果 集合。 3.如权利要求2所述的用户分类的方法, 其特征在于, 所述通过所述训练后的初级分类 模型根据各所述常规数据项目的IV 值进行初次分类处理, 得到所述常规数据项目对应的常 规数据初次分类结果, 包括: 根据各所述常规数据项目的IV值对所述常规数据项目进行分类处理, 得到强IV值数据 项目和弱IV值数据项目; 利用所述训练后的初级分类模型中的机器学习单元将各所述弱IV值数据项目进行特 征增强处 理; 利用所述训练后的初级分类模型中的评分卡单元对所述特征增强处理的弱IV值数据 项目和强IV值数据项目进行初次分类处 理, 得到所述常规数据初次分类结果。 4.如权利要求2所述的用户分类的方法, 其特征在于, 所述通过训练后的用户分类模型 对多个所述初次分类结果进行权重调整后, 利用加权求和 算法进行处理, 得到用户分类结 果, 包括: 通过多个所述常规数据初次分类结果进行归一 化, 得到常规数据归一 化值; 通过多个初次分类结果进行归一 化, 得到全部数据归一 化值; 利用所述常规数据归一化值与所述全部数据归一化值的比值调整所述初次分类结果 的权重, 并利用加权求和算法计算出 所述用户分类结果。 5.如权利要求4所述的用户分类的方法, 其特征在于, 所述利用所述常规数据归一化值 与所述全部数据归一化值的比值调整 所述初次分类结果的权重, 并利用加权求和算法计算 出所述用户分类结果, 包括: 通过如下公式对所述常规数据初次分类结果进行归一化处理, 得到所述常规数据归一 化值, 公式为τ=∑iωiσi, 其中τ为所述常规数据归一化值, ωi为第i个初次分类结果权重,权 利 要 求 书 1/2 页 2 CN 114238726 A 2σi为常规数据初次分类结果的标准差, i 为常规数据初次分类结果的个数; 通过如下公式对所述初次分类结果进行归一化处理, 得到所述全部数据归一化值, 公 式为τ′=∑jωjσj, 其中τ′为所述全 部数据归一化值, ωj为第j个初次分类结果权重, σj为初 次分类结果的标准差, j为初次分类结果的个数; 所述用户分类模型中用户分类处理的数学表达式为 其中 Score为所述用户分类结果, τ为所述常规数据归一化值, τ ′为所述全部数据归一化值, Sj为 第j个初次分类结果, σj为初次分类结果的标准差, ωj为第j个初次分类结果权重, j为初次 分类结果的个数。 6.如权利要求1所述的用户分类的方法, 其特征在于, 在所述获取用户数据项目集合, 识别所述用户数据项目集合中的缺失数据项目和常规数据项目, 得到多个缺 失数据项目和 多个常规数据项目的步骤之后, 还 包括: 若获取的所述用户数据项目集合中不包括缺失数据项目, 将所述用户数据项目集合进 行初次分类处 理后得到的初级分类结果 集合进行加权求和, 从而得到用户分类结果。 7.如权利要求1所述的用户分类的方法, 其特征在于, 在所述将多个所述特殊数据项目 和多个所述常规数据项目输入所述训练后的初级分类模型进 行初次分类处理, 得到包括多 个初次分类结果的初次分类结果 集合的步骤之前, 还 包括: 将用户数据项目样本集合输入所述初级分类模型, 得到对应的初次分类结果样本集 合; 将所述初次分类结果样本集合输入所述用户分类模型, 根据所述初次分类结果样本集 合所对应的样本用户分类结果, 测试各所述初次分类结果样本在所述用户分类处理中的所 占权重。 8.一种用户分类的装置, 其特 征在于, 包括: 获取模块, 获取用户数据项目集合, 识别所述用户数据项目集合中的缺失数据项目和 常规数据项目, 得到多个缺失数据项目和多个常规数据项目; 缺失数据填充模块, 通过特殊值填充法将多个所述缺失数据项目填充为多个特殊数据 项目; 初次分类模块, 将多个所述特殊数据项目和多个所述常规数据项目输入训练后的初级 分类模型进 行初次分类处理, 得到初次分类结果集合, 其中, 所述初次分类结果集合中包括 多个初次分类结果; 用户分类模块, 通过训练后的用户分类模型对所述初次分类结果集合中的每个所述初 次分类结果进行权 重调整后, 利用加权求和算法进行处 理, 得到用户分类结果。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7任一项所述用户分类的方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述用户分类的方法。权 利 要 求 书 2/2 页 3 CN 114238726 A 3

.PDF文档 专利 用户分类的方法、装置、设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户分类的方法、装置、设备及存储介质 第 1 页 专利 用户分类的方法、装置、设备及存储介质 第 2 页 专利 用户分类的方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。