行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211000374.4 (22)申请日 2022.08.19 (71)申请人 北京轩宇空间科技有限公司 地址 101318 北京市顺 义区高丽营镇文化 营村北(临 空二路1号) (72)发明人 徐幸 崔星 申莉 王礼祥  鄢红枚  (74)专利代理 机构 成都诚中致达专利代理有限 公司 51280 专利代理师 杨春 (51)Int.Cl. G06F 16/36(2019.01) G06N 5/02(2006.01) (54)发明名称 故障知识图谱补全方法、 装置、 设备、 存储介 质 (57)摘要 本发明公开了一种故障知识图谱补全 方法、 装置、 设备、 存储介质, 补全方法包括以下步骤: S1、 连接故障知识图谱, 获取结构化三元组; S2、 对三元组集合进行数据处理, 包括样本拆分、 数 据映射; S3、 对训练集样本进行空间投影, 获得初 始化的实体向量集、 原平面关系向量集和超平面 关系向量集; S4、 构建模型, 对初始化的向量进行 训练, 获得训练后的实体向量集、 原平面关系向 量集和超平面关系向量集; S5、 评估模型效果; S6、 对缺失知识进行预测, 确认结果并添加到故 障知识图谱; S7、 对新添加的关系进行可视化显 示, 完成知识图谱补全。 可 以实现大规模故障知 识图谱补全, 并将新发现的关系进行可视化显 示。 权利要求书3页 说明书5页 附图3页 CN 115422366 A 2022.12.02 CN 115422366 A 1.一种故障知识图谱补全方法, 其特 征在于, 包括以下步骤: S1、 连接故障知识图谱, 获取 结构化三元组; S2、 对三元组集 合进行数据处理, 包括样本拆分、 数据映射; S21、 样本拆分是将三元组集 合划分为训练集、 测试集; S22、 数据映射是将三元组集合中的头尾实体和关系分别进行去重操作, 然后重设索 引, 以获得实体和id一 一对应的实体集, 关系和id一 一对应的关系集; S3、 对训练集样本进行空间投影, 获得初始化的实体向量集、 原平面关系向量集和超平 面关系向量 集; S4、 构建模型, 对初始化的向量进行训练, 获得训练后的实体向量集、 原平面关系向量 集和超平面关系向量 集; S5、 评估模型效果; S6、 对缺失知识进行 预测, 确认结果并添加到故障知识图谱。 2.根据权利要求1所述的故障知识图谱补全方法, 其特 征在于, S4、 训练具体步骤: S41、 根据已知存在的正例三元组集合, 替换头实体或者尾实体, 以获得负例三元组集 合; S42、 计算损失函数L: 其中, h, t分别为头实体向量和尾实 体向量, wr为平面法向量, dr为平面上的平移向量, 为h在wr上的投影, 为t 在wr上的投影,fr(h,t)为三元组差值; Δ为正例的三 元组集合, Δ ′为负例三元组集合, γ 为 margin值, C表示软约束的权 重; S43、 更新向量 集中的向量; S44、 重复S42 ‑S43, 以获得最小化的损失函数值; S45、 得到训练后的向量 集。 3.根据权利要求2所述的故障知识图谱补全方法, 其特征在于, S41、 构建负例三元组集 合具体步骤: 计算每一个头实体对应的平均尾实体数tph和每一个尾实体对应的平均头实 体数hpt, 根据头尾节 点数比随机替换训练集三元 组的头尾实体, 当tph>hpt时, 随机替换头 实体, 反之, 替换尾实体。 4.根据权利要求1所述的故障知识图谱补全方法, 其特征在于, S5、 评估模型效果具体 步骤: S51: 读取S2拆分出的测试集; S52: 对于测试集中每个三元组, 将其他实体作为候选项, 计算得到评分函数fr, 并按升 序排列, 对正确答案在序列中的排名求平均, 得到 Mean rank; S53: 计数排在序列前十的正确答案, 得到 Hits@10。 5.根据权利要求1所述的故障知识图谱补全方法, 其特征在于, S6、 对缺失知识进行预 测, 确认结果并添加到故障知识图谱, 具体步骤:权 利 要 求 书 1/3 页 2 CN 115422366 A 2S61: 连接待补全的故障知识图谱; S62: 根据训练好的向量和模型, 计算向量差值DIS: S63: 遍历图谱中所有的实体和关系, 以其他关系作 为候选项, 带入关系向量, 计算每一 个三元组的向量差值, 筛 选出向量差值小于预定 评分标准的组合; S64: 将组合按照向量差值升序排列, 人工确认结果并添加到知识图谱。 6.根据权利要求1所述的故障知识图谱补全方法, 其特征在于, S7、 对新添加的关系进 行可视化显示, 完成知识图谱补 全, 其中, 可视化显示为: 在故障知识图谱中, 高亮显示新添 加的知识。 7.一种故障知识图谱补全 装置, 其特 征在于, 包括: 数据获取模块: 用于连接故障知识图谱, 获取 结构化三元组; 样本拆分模块: 用于对三元组集 合进行样本拆分, 划分为训练集和 测试集; 数据映射模块: 用于对三元组集 合进行数据映射, 获取实体集和关系集; 向量初始化模块: 用于对训练集样本进行空间投影, 获得初始化的实体向量集、 原平面 关系向量 集和超平面关系向量 集; 模型训练模块: 用于构建模型, 对初始化的向量进行训练, 获得训练后的实体向量集、 原平面关系向量 集和超平面关系向量 集; 模型评估 模块: 用于 评估模型效果; 模型利用模块: 用于对缺失知识进行 预测, 确认结果并添加到故障知识图谱。 8.根据权利要求7所述的故障知识图谱补全装置, 其特征在于, 模型训练模块对初始化 的向量进行训练时: 第一步, 根据已知存在的正例三元组集合, 替换头实体或者尾实体, 以获得负例三元组 集合; 第二步, 计算损失函数L: 其中, h, t分别为头实体向量和尾实 体向量, wr为平面法向量, dr为平面上的平移向量, 为h在wr上的投影, 为t 在wr上的投影,fr(h,t)为三元组差值; Δ为正例的三 元组集合, Δ ′为负例三元组集合, γ 为 margin值, C表示软约束的权 重; 第三步, 更新向量 集中的向量; 第四步, 重复第二 步和第三 步, 以获得最小化的损失函数值; 最后, 得到训练后的向量 集。 9.一种故障知识图谱补全设备, 其特征在于, 包括至少一个处理器和存储器; 其中, 所 述存储器存储有计算机执行指 令; 在所述至少一个处理器执行所述存储器存储的计算机执 行指令, 使得所述至少一个处理器执行如权利要求1~6中任一项 所述的故障知识图谱补全权 利 要 求 书 2/3 页 3 CN 115422366 A 3

.PDF文档 专利 故障知识图谱补全方法、装置、设备、存储介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 故障知识图谱补全方法、装置、设备、存储介质 第 1 页 专利 故障知识图谱补全方法、装置、设备、存储介质 第 2 页 专利 故障知识图谱补全方法、装置、设备、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。