(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211000374.4
(22)申请日 2022.08.19
(71)申请人 北京轩宇空间科技有限公司
地址 101318 北京市顺 义区高丽营镇文化
营村北(临 空二路1号)
(72)发明人 徐幸 崔星 申莉 王礼祥
鄢红枚
(74)专利代理 机构 成都诚中致达专利代理有限
公司 51280
专利代理师 杨春
(51)Int.Cl.
G06F 16/36(2019.01)
G06N 5/02(2006.01)
(54)发明名称
故障知识图谱补全方法、 装置、 设备、 存储介
质
(57)摘要
本发明公开了一种故障知识图谱补全 方法、
装置、 设备、 存储介质, 补全方法包括以下步骤:
S1、 连接故障知识图谱, 获取结构化三元组; S2、
对三元组集合进行数据处理, 包括样本拆分、 数
据映射; S3、 对训练集样本进行空间投影, 获得初
始化的实体向量集、 原平面关系向量集和超平面
关系向量集; S4、 构建模型, 对初始化的向量进行
训练, 获得训练后的实体向量集、 原平面关系向
量集和超平面关系向量集; S5、 评估模型效果;
S6、 对缺失知识进行预测, 确认结果并添加到故
障知识图谱; S7、 对新添加的关系进行可视化显
示, 完成知识图谱补全。 可 以实现大规模故障知
识图谱补全, 并将新发现的关系进行可视化显
示。
权利要求书3页 说明书5页 附图3页
CN 115422366 A
2022.12.02
CN 115422366 A
1.一种故障知识图谱补全方法, 其特 征在于, 包括以下步骤:
S1、 连接故障知识图谱, 获取 结构化三元组;
S2、 对三元组集 合进行数据处理, 包括样本拆分、 数据映射;
S21、 样本拆分是将三元组集 合划分为训练集、 测试集;
S22、 数据映射是将三元组集合中的头尾实体和关系分别进行去重操作, 然后重设索
引, 以获得实体和id一 一对应的实体集, 关系和id一 一对应的关系集;
S3、 对训练集样本进行空间投影, 获得初始化的实体向量集、 原平面关系向量集和超平
面关系向量 集;
S4、 构建模型, 对初始化的向量进行训练, 获得训练后的实体向量集、 原平面关系向量
集和超平面关系向量 集;
S5、 评估模型效果;
S6、 对缺失知识进行 预测, 确认结果并添加到故障知识图谱。
2.根据权利要求1所述的故障知识图谱补全方法, 其特 征在于, S4、 训练具体步骤:
S41、 根据已知存在的正例三元组集合, 替换头实体或者尾实体, 以获得负例三元组集
合;
S42、 计算损失函数L:
其中,
h, t分别为头实体向量和尾实
体向量, wr为平面法向量, dr为平面上的平移向量,
为h在wr上的投影,
为t
在wr上的投影,fr(h,t)为三元组差值; Δ为正例的三 元组集合, Δ ′为负例三元组集合, γ 为
margin值, C表示软约束的权 重;
S43、 更新向量 集中的向量;
S44、 重复S42 ‑S43, 以获得最小化的损失函数值;
S45、 得到训练后的向量 集。
3.根据权利要求2所述的故障知识图谱补全方法, 其特征在于, S41、 构建负例三元组集
合具体步骤: 计算每一个头实体对应的平均尾实体数tph和每一个尾实体对应的平均头实
体数hpt, 根据头尾节 点数比随机替换训练集三元 组的头尾实体, 当tph>hpt时, 随机替换头
实体, 反之, 替换尾实体。
4.根据权利要求1所述的故障知识图谱补全方法, 其特征在于, S5、 评估模型效果具体
步骤:
S51: 读取S2拆分出的测试集;
S52: 对于测试集中每个三元组, 将其他实体作为候选项, 计算得到评分函数fr, 并按升
序排列, 对正确答案在序列中的排名求平均, 得到 Mean rank;
S53: 计数排在序列前十的正确答案, 得到 Hits@10。
5.根据权利要求1所述的故障知识图谱补全方法, 其特征在于, S6、 对缺失知识进行预
测, 确认结果并添加到故障知识图谱, 具体步骤:权 利 要 求 书 1/3 页
2
CN 115422366 A
2S61: 连接待补全的故障知识图谱;
S62: 根据训练好的向量和模型, 计算向量差值DIS:
S63: 遍历图谱中所有的实体和关系, 以其他关系作 为候选项, 带入关系向量, 计算每一
个三元组的向量差值, 筛 选出向量差值小于预定 评分标准的组合;
S64: 将组合按照向量差值升序排列, 人工确认结果并添加到知识图谱。
6.根据权利要求1所述的故障知识图谱补全方法, 其特征在于, S7、 对新添加的关系进
行可视化显示, 完成知识图谱补 全, 其中, 可视化显示为: 在故障知识图谱中, 高亮显示新添
加的知识。
7.一种故障知识图谱补全 装置, 其特 征在于, 包括:
数据获取模块: 用于连接故障知识图谱, 获取 结构化三元组;
样本拆分模块: 用于对三元组集 合进行样本拆分, 划分为训练集和 测试集;
数据映射模块: 用于对三元组集 合进行数据映射, 获取实体集和关系集;
向量初始化模块: 用于对训练集样本进行空间投影, 获得初始化的实体向量集、 原平面
关系向量 集和超平面关系向量 集;
模型训练模块: 用于构建模型, 对初始化的向量进行训练, 获得训练后的实体向量集、
原平面关系向量 集和超平面关系向量 集;
模型评估 模块: 用于 评估模型效果;
模型利用模块: 用于对缺失知识进行 预测, 确认结果并添加到故障知识图谱。
8.根据权利要求7所述的故障知识图谱补全装置, 其特征在于, 模型训练模块对初始化
的向量进行训练时:
第一步, 根据已知存在的正例三元组集合, 替换头实体或者尾实体, 以获得负例三元组
集合;
第二步, 计算损失函数L:
其中,
h, t分别为头实体向量和尾实
体向量, wr为平面法向量, dr为平面上的平移向量,
为h在wr上的投影,
为t
在wr上的投影,fr(h,t)为三元组差值; Δ为正例的三 元组集合, Δ ′为负例三元组集合, γ 为
margin值, C表示软约束的权 重;
第三步, 更新向量 集中的向量;
第四步, 重复第二 步和第三 步, 以获得最小化的损失函数值;
最后, 得到训练后的向量 集。
9.一种故障知识图谱补全设备, 其特征在于, 包括至少一个处理器和存储器; 其中, 所
述存储器存储有计算机执行指 令; 在所述至少一个处理器执行所述存储器存储的计算机执
行指令, 使得所述至少一个处理器执行如权利要求1~6中任一项 所述的故障知识图谱补全权 利 要 求 书 2/3 页
3
CN 115422366 A
3
专利 故障知识图谱补全方法、装置、设备、存储介质
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:43:33上传分享