行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111565403.7 (22)申请日 2021.12.20 (71)申请人 北京达佳互联信息技 术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 林伟 陈超超  (74)专利代理 机构 北京中博世 达专利商标代理 有限公司 1 1274 代理人 申健 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 数据确定方法、 装置、 电子设备及存 储介质 (57)摘要 本公开关于一种数据确定方法、 装置、 电子 设备及存储介质, 能够从多个方面刻画用户兴 趣, 提高召回率; 涉及大数据处理技术领域。 该方 法包括: 获取目标对象针对目标资源的交互信 息; 根据所述交互信息确定所述目标对象的特 征; 所述目标对象的特征包括多个维度的特征; 确定多组权重系数, 每组权重系数包括与所述多 个维度的特征对应的多个权重系数; 对每组权重 系数与所述目标对象的特征进行加权处理, 得到 所述目标对象的多个向量; 其中, 目标对象的每 个向量对应一组权重系数; 对所述目标对象 的每 个向量检索相关性符合预设要求的候选资源, 根 据所述目标对象的多个向量中每个向量对应的 候选资源确定所述目标对象对应的数据召回结 果。 权利要求书2页 说明书15页 附图5页 CN 114330519 A 2022.04.12 CN 114330519 A 1.一种数据确定方法, 其特 征在于, 包括: 获取目标对象针对目标资源的交 互信息; 根据所述交互信 息确定所述目标对象的特征; 所述目标对象的特征包括多个维度的特 征; 确定多组权重系数, 每组权重系数包括与所述多个维度的特征对应的多个权重系数; 对每组权重系 数与所述 目标对象的特征进行加权处理, 得到所述 目标对象的多个 向量; 其 中, 所述目标对象的每 个向量对应一组权 重系数; 对所述目标对象的每个向量检索相关性符合预设要求的候选资源, 根据 所述目标对象 的多个向量中每 个向量对应的候选资源确定所述目标对象对应的数据召回结果。 2.根据权利要求1所述的方法, 其特征在于, 所述对每组权重系数与 所述目标对象的特 征进行加权处 理, 得到所述目标对象的多个向量包括: 将所述目标对象的特征输入预置的多个特征选择网络, 每个特征选择网络 中包含一组 权重系数, 通过所述特征选择网络的权重系 数为所述 目标对象的特征进行加权, 获得每个 所述特征选择网络 输出的所述目标对象的向量。 3.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 获取样本特征以及所述样本特征对应的标签信息; 其中, 所述样本特征中包含样本对 象特征以及样本资源特征; 所述标签信息用于表征所述样本对象特征对应的样本对象与所 述样本资源特 征对应的样本资源之间是否存在交 互行为; 将所述样本特征中的样本对象特征输入多个第 一模型, 获得每个所述第 一模型输出的 样本向量; 确定所述样本特 征中样本资源特 征对应的样本资源向量; 分别计算每个样本向量与 所述样本资源向量的相似度, 确定所述相似度最高的目标样 本向量; 根据所述目标样本向量和所述样本资源向量, 确定预估交 互行为发生 概率; 根据所述预估交互行为发生概率和所述样本特征对应的标签信 息, 训练所述多个第 一 模型, 直至满足预设训练结束条件, 得到所述多个特 征选择网络 。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述预估交互行为发生概率和所述样 本特征对应的标签信息, 训练所述多个第一模型, 直至满足预设训练结束 条件, 得到所述多 个特征选择网络, 包括: 根据所述预估交 互行为发生 概率和所述样本特 征对应的标签信息确定损失值; 根据所述损 失值, 更新所述目标样本向量对应的第一模型中的模型参数, 直至所述损 失值满足预设结束条件时, 结束对所述多个第一模型的训练; 将训练结束时的所述第 一模型作为所述特征选择网络, 训练结束时所述第 一模型的模 型参数为所述特 征选择网络的权 重系数。 5.根据权利要求3所述的方法, 其特征在于, 将所述样本特征中的样本对象特征输入多 个第一模型之前, 所述方法还 包括: 随机确定多个所述第一模型的模型参数的初始值。 6.根据权利要求1所述的方法, 其特征在于, 所述对每组权重系数与 所述目标对象的特 征进行加权处 理, 得到所述目标对象的多个向量, 包括:权 利 要 求 书 1/2 页 2 CN 114330519 A 2对所述目标对象的特 征进行聚类, 获得聚类之后的类簇; 根据所述类簇对应的权重系数确定所述目标对象的特征的权重系数, 以获得每个类簇 对应的目标对象的向量。 7.一种数据确定装置, 其特 征在于, 包括: 数据采集模块, 被 配置为获取目标对象针对目标资源的交 互信息; 特征提取模块, 被配置为根据所述交互信息确定所述目标对象的特征, 所述目标对象 的特征包括多个维度的特 征; 向量表达模块, 被配置为确定多组权重系数, 每组权重系数包括与所述多个维度的特 征对应的多个权重系 数; 对每组权重系 数与所述 目标对象的特征进行加权处理, 得到目标 对象的多个向量; 其中, 所述目标对象的每 个向量对应一组权 重系数; 召回结果确定模块, 被配置为对所述目标对象的每个向量检索相关性符合预设要求的 多个候选资源, 根据所述目标对象的多个向量中每个向量对应的候选 资源确定所述目标对 象对应的数据召回结果。 8.一种电子设备, 其特 征在于, 包括: 处理器; 用于存储所述处 理器可执行指令的存 储器; 其中, 所述处理器被配置为执行所述指令, 以实现如权利要求1至6中任一项所述的数 据确定方法。 9.一种计算机可读存储介质, 其特征在于, 当所述计算机可读存储介质中的指令由电 子设备的处理器执行时, 使得电子 设备能够执行如权利要求 1至6中任一项所述的数据确定 方法。 10.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 所述计算机程序/指令 被处理器执行时实现权利要求1至 6中任一项所述的数据确定方法。权 利 要 求 书 2/2 页 3 CN 114330519 A 3

.PDF文档 专利 数据确定方法、装置、电子设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据确定方法、装置、电子设备及存储介质 第 1 页 专利 数据确定方法、装置、电子设备及存储介质 第 2 页 专利 数据确定方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。