行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111607572.2 (22)申请日 2021.12.24 (71)申请人 卫盈联信息技 术 (深圳) 有限公司 地址 518000 广东省深圳市前海深港合作 区南山街道桂湾五路128号前海深港 基金小镇A4栋101 (72)发明人 张铁钢 许文彬  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 代理人 高杰 郭梦霞 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 联合建模方法、 装置、 电子设备及存 储介质 (57)摘要 本发明涉及数据处理领域, 揭露一种联合建 模方法, 包括: 对第一样本集及每个第二样本集 分别执行 公有样本ID识别处理, 基于识别结果将 第一样本集拆分为每个第二参与方对应的第一 子样本集; 基于每个第一子样 本集对应的预设模 型的初始参数及对应的第二参与方的第二样本 集, 计算每个第一子样本集对应的梯度值; 基于 梯度值确定每个第一子样本集对应的第一参数; 接收每个第二参与方发送的第二参数及其它第 一参与方 发送的第三参数; 当判断预设模型收敛 时, 基于第一参数、 第二参数及第三参数确定目 标参数, 并将目标参数发送给其它参与方, 完成 联合建模。 本发明还提供一种联合建模装置、 电 子设备及存储介质。 本发明提高了联合模型的精 确度。 权利要求书3页 说明书12页 附图2页 CN 114298321 A 2022.04.08 CN 114298321 A 1.一种联合建模方法, 应用于联合建模系统中任意一个第一参与方, 所述联合建模系 统包括通信连接的多个第一参与方及多个第二参与方, 其特征在于, 各个第一参与方与每 个第二参与方之间包含相同的样本对象及不同的样本特征, 各个第二参与方之 间包含相同 的样本特 征及不同的样本对象, 所述方法包括: 接收所述联合建模系统中每个第 二参与方发送的同态加密密钥对中的公钥, 基于所述 公钥对本地存储的不含标签信息的第一样本集及每个第二参与方 的携带标签信息的第二 样本集分别执行公有样本ID识别处理, 基于公有样 本ID识别结果将所述第一样本集拆 分为 每个第二参与方对应的第一子样本集; 获取每个第一子样本集对应的预设模型的初始参数, 基于所述公钥、 初始参数及对应 的第二参与方的第二样本集, 计算每 个第一子样本集对应的梯度值; 基于所述梯度值对每个第 一子样本集对应的预设模型执行参数更新处理, 得到每个第 一子样本集对应的第一 参数; 接收每个第二参与方发送的其第二样本集对应的采用安全聚合算法处理后的第二参 数及损失值, 并接收其它第一参与方发送的其每个子样本集对应的采用安全聚合算法处理 后的第三 参数; 基于所述损失值判断所述预设模型是否收敛, 当判断是时, 基于所述第 一参数、 第二参 数及第三参数确定目标参数, 并将所述目标参数分别发送给所述联合建模系统中其它参与 方, 完成联合建模。 2.如权利要求1所述的联合建模方法, 其特征在于, 所述基于所述公钥对本地存储的不 含标签信息的第一样本集及每个第二参与方 的携带标签信息的第二样本集分别执行公有 样本ID识别处 理, 包括: 选择一个第二参与方, 计算所述第一样本集中各个样本ID的第一哈希值, 采用所述选 择的第二参与方对应的同态加密密钥对中的公钥加密所述第一哈希值, 得到第一密文, 并 建立第一密文与样本ID之间的映射关系; 接收选择的第 二参与方发送的第 二密文, 所述第 二密文是选择的第 二参与方采用同一 同态加密 密钥对中的公钥加密其第二样本集中各个样本ID的第二哈希值得到的; 计算第一密文与第二密文的交集, 得到公有样本ID密文, 基于所述映射关系确定所述 公有样本ID密文的明文数据。 3.如权利要求1所述的联合建模方法, 其特征在于, 所述基于所述公钥、 初始参数及对 应的第二 参与方的第二样本集, 计算每 个第一子样本集对应的梯度值, 包括: 根据第一子样本集的数量开启多个进程, 每个进程根据对应的第 一子样本集及其初始 参数, 计算每 个第一子样本集对应的第一特 征矩阵; 将所述第一特征矩阵发送给对应的第 二参与方, 接收对应的第 二参与方发送的采用所 述公钥加密后的误差值, 所述误差值是对应的第二参与方根据其第二样本集的第二特征矩 阵及所述第一特 征矩阵计算得到的; 将加密后的误差值代入梯度值计算公式, 得到每个第 一子样本集对应的加密后的梯度 值, 将所述加密后的梯度值发送给对应的第二参与方, 以获取所述加密后的梯度值的明文 数据。 4.如权利要求3所述的联合建模方法, 其特征在于, 所述对应的第 二参与方根据其第 二权 利 要 求 书 1/3 页 2 CN 114298321 A 2样本集的第二特 征矩阵及所述第一特 征矩阵计算 误差值的过程, 包括: 对应的第二参与方基于其第二样本集的第二特征矩阵及所述第一特征矩阵计算其第 二样本集的特 征值; 将所述特 征值输入预设模型, 得到其第二样本集的预测值; 基于所述标签信 息确定其第 二样本集的真实值, 基于所述真实值及所述预测值计算误 差值, 并将所述误差值采用对应的同态加密密钥对中的公钥加密后发送 给对应的第一参与 方。 5.如权利要求3所述的联合建模方法, 其特征在于, 所述将所述加密后的梯度值发送给 对应的第二 参与方, 以获取 所述加密后的梯度值的明文数据, 包括: 为每个第二参与方生成一个第三随机数, 采用对应的公钥加密对应的第三随机数, 计 算加密后的梯度值与加密后的第三 随机数的和, 得到加密和, 将加密和发送给对应的第二 参与方; 接收对应的第 二参与方解密所述加密和得到的数值, 从所述得到的数值中减去对应的 第三随机数, 得到对应的第一子样本集对应的解密后的梯度值。 6.如权利要求3所述的联合建模方法, 其特征在于, 所述每个进程根据对应的第 一子样 本集及其初始参数, 计算每 个第一子样本集对应的第一特 征矩阵, 包括: 选择一个进程, 获取该进程对应的第一子样本集及初始参数, 确定获取的第一子样本 集的初始特征矩阵, 基于所述初始特征矩阵及所述初始 参数计算 获取的第一子样本集对应 的第一特 征矩阵。 7.如权利要求1所述的联合建模方法, 其特 征在于, 所述损失值的计算公式为: 其中, Li为第i个第二参与方对应的损失值, yij为第i个第二参与方的第二样本集中第j 个样本的真实值, hθ(xij)为第i个第二参与方的第二样本集中第j个样本的预测值, n为第i 个第二参与方的第二样本集中样本的总数量。 8.一种联合建模 装置, 其特 征在于, 所述装置包括: 接收模块, 用于接收联合建模系统中每个第二参与方发送的同态加密密钥对中的公 钥, 基于所述公钥对本地存储的不含标签信息的第一样本集及每个第二参与方的携带标签 信息的第二样本集分别执行公有样本ID识别处理, 基于公有样 本ID识别结果将所述第一样 本集拆分为每 个第二参与方对应的第一子样本集; 计算模块, 用于获取每个第 一子样本集对应的预设模型的初始参数, 基于所述公钥、 初 始参数及对应的第二 参与方的第二样本集, 计算每 个第一子样本集对应的梯度值; 更新模块, 用于基于所述梯度值对每个第 一子样本集对应的预设模型执行参数更新处 理, 得到每 个第一子样本集对应的第一 参数; 接收模块, 用于接收每个第 二参与方发送的其第 二样本集对应的采用安全聚合算法处 理后的第二参数及损失值, 并接收其它第一参与方发送的其每个子样本集对应的采用安全 聚合算法处理后的第三 参数; 确定模块, 用于基于所述损失值判断所述预设模型是否收敛, 当判断是时, 基于所述第权 利 要 求 书 2/3 页 3 CN 114298321 A 3

.PDF文档 专利 联合建模方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 联合建模方法、装置、电子设备及存储介质 第 1 页 专利 联合建模方法、装置、电子设备及存储介质 第 2 页 专利 联合建模方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:18:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。