专利模型评估方法、装置、设备及计算机可读存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202111548933.0 (22)申请日 2021.12.17 (65)同一申请的已公布的文献号申请公布号 CN 113935788 A (43)申请公布日 2022.01.14 (73)专利权人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人钟子宏　 (74)专利代理机构北京派特恩知识产权代理有限公司 1 1270 代理人刘晖铭　蒋雅洁 (51)Int.Cl. G06Q 30/02(2012.01) G06N 20/00(2019.01)审查员罗湘 (54)发明名称模型评估方法、装置、设备及计算机可读存储介质 (57)摘要本申请提供了一种模型评估方法、装置、设备及计算机可读存储介质；方法包括：获取初步训练好的预测模型、当前时间周期的第一样本数据和当前时间周期的上一个时间周期的第二样本数据；利用初步训练好的预测模型对第一样本数据和第二样本数据分别进行预测处理，得到当前时间周期对应的第一预测结果和上一个时间周期对应的第二预测结果；基于当前时间周期的第一标签信息、第一预测结果、上一个时间周期对应的第二标签信息和第二预测结果，确定初步训练好的预测模型在当前时间周期的评估信息；当确定评估信息达到预设的评估阈值时，将初步训练好的预测模型确定为最终训练好的预测模型。通过本申请，能够提高预测模型对当前数据的预测精度。权利要求书3页说明书21页附图5页 CN 113935788 B 2022.03.22 CN 113935788 B 1.一种模型评估方法，其特征在于，所述方法包括：获取初步训练好的预测模型，获取当前时间周期的第一样本数据和所述当前时间周期的上一个时间周期的第二样本数据；利用所述初步训练好的预测模型对所述第一样本数据和所述第二样本数据分别进行预测处理，得到所述当前时间周期对应的第一预测结果和所述上一个时间周期对应的第二预测结果；基于所述当前时间周期的第一标签信息、所述第一预测结果、所述上一个时间周期的第二标签信息和所述第二预测结果，确定所述初步训练好的预测模型在所述当前时间周期的评估信息；当确定所述评估信息达到预设的评估阈值时，将所述初步训练好的预测模型确定为最终训练好的预测模型；所述基于所述当前时间周期的第一标签信息、所述第一预测结果、所述上一个时间周期的第二标签信息和所述第二预测结果，确定所述初步训练好的预测模型在所述当前时间周期的评估信息，包括：基于所述第一标签信息和所述第一预测结果构建所述当前时间周期对应的混淆矩阵，基于所述第二标签信息和所述第二预测结果构建所述上一个时间周期对应的混淆矩阵，基于所述当前时间周期对应的混淆矩阵和所述上一个时间周期对应的混淆矩阵，确定所述初步训练好的预测模型在所述当前时间周期的评估信息。 2.根据权利要求1中所述的方法，其特征在于，所述第一预测结果和所述第二预测结果均为二值化的向量，所述基于所述当前时间周期的第一标签信息、所述第一预测结果、所述上一个时间周期的第二标签信息和所述第二预测结果，确定所述初步训练好的预测模型在所述当前时间周期的评估信息，包括：基于所述第一预测结果确定在所述当前时间周期中预测为正样本的第一用户集合；基于所述第一预测结果和所述第一标签信息确定在所述当前时间周期中正确预测为正样本的第二用户集合；基于所述第二预测结果和所述第二标签信息确定在所述上一个时间周期中错误预测为负样本的第三用户集合；基于所述第一用户集合、所述第二用户集合和所述第三用户集合确定所述初步训练好的预测模型在所述上一个时间周期的影响下，在所述当前时间周期的查准率。 3.根据权利要求2中所述的方法，其特征在于，基于所述第一用户集合、所述第二用户集合和所述第三用户集合确定所述初步训练好的预测模型在所述上一个时间周期的影响下，在所述当前时间周期的查准率，包括：确定所述第一用户集合和所述第三用户集合的第一交集；确定所述第二用户集合和所述第三用户集合的第二交集；确定所述第一用户集合对应的第一用户个数、所述第二用户集合对应的第二用户个数、所述第三用户集合对应的第三用户个数；确定所述第一交集对应的第四用户个数和所述第二交集对应的第五用户个数；基于所述第一用户个数、所述第二用户个数、所述第三用户个数、所述第四用户个数和所述第五用户个数，确定所述初步训练好的预测模型在所述上一个时间周期的影响下，在所述当前时间周期的查准率。权　利　要　求　书 1/3 页 2 CN 113935788 B 24.根据权利要求3 中所述的方法，其特征在于，所述基于所述当前时间周期的第一标签信息、所述第一预测结果、所述上一个时间周期的第二标签信息和所述第二预测结果，确定所述初步训练好的预测模型在所述当前时间周期的评估信息，包括：基于所述第一标签信息，确定在所述当前时间周期内实际为正样本的第四用户集合；确定所述第三用户集合和所述第四用户集合的第三并集；确定所述第四用户集合对应的第六用户个数和所述第三并集对应的第七用户个数；基于所述第二用户个数、所述第三用户个数、所述第五用户个数、所述第六用户个数和所述第七用户个数，确定所述初步训练好的预测模型在所述上一个时间周期的影响下，在所述当前时间周期的查全率。 5.根据权利要求1中所述的方法，其特征在于，所述方法还包括：获取各个用户标识对应的日志数据，基于所述日志数据确定训练数据，所述训练数据包括多个训练特征数据和各个训练特征数据对应的营销场景标签；获取预设营销场景类型对应的训练特征数据和所述预设营销场景类型对应的预设模型；利用所述预设营销场景类型对应的训练特征数据对所述预设营销场景类型对应的预设模型进行迭代训练；在确定达到迭代结束条件时，获取所述预设营销场景类型对应的初步训练好的预测模型。 6.根据权利要求5中所述的方法，其特征在于，所述基于所述日志数据确定训练数据，包括：基于所述日志数据确定各个用户标识对应的历史特征数据和营销场景标签；基于所述营销场景标签确定各个营销场景类型对应的历史特征数据；将所述各个营销场景类型对应的历史特征数据进行划分，得到所述各个营销场景类型对应的训练特征数据和所述各个营销场景类型对应的测试数据。 7.根据权利要求1至 6任一项所述的方法，其特征在于，所述方法还包括：当确定所述评估信息未达到所述评估阈值时，再次获取所述初步训练好的预测模型对应的新的训练数据；利用所述新的训练数据对所述初步训练好的预测模型继续进行训练，直至所述评估信息达到所述评估阈值，得到最终训练好的预测模型。 8.根据权利要求1至 6任一项所述的方法，其特征在于，所述方法还包括：获取多个营销场景类型分别对应的训练好的预测模型和多个用户标识在当前时间周期的多个用户特征数据；将所述多个用户特征数据分别输入各个训练好的预测模型，得到各个营销场景类型对应的预测向量；基于所述各个营销场景类型对应的预测向量确定各个用户标识对应的目标营销场景类型。 9.根据权利要求8中所述的方法，其特征在于，所述方法还包括：在确定达到推荐时机时，基于所述各个用户标识对应的目标营销场景类型，确定所述各个用户标识对应的目标推荐信息；权　利　要　求　书 2/3 页 3 CN 113935788 B 3

专利 模型评估方法、装置、设备及计算机可读存储介质

专利模型评估方法、装置、设备及计算机可读存储介质