(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211225973.6
(22)申请日 2022.10.09
(71)申请人 国家电网有限公司
地址 100031 北京市西城区西长安 街86号
申请人 国网冀北电力有限公司
国家电网有限公司大 数据中心
北京国电通网络技 术有限公司
国网信息通信产业 集团有限公司
(72)发明人 丁勇 王端瑞 张朋 侯本忠
吕元旭 沈卫东 刘峰 杨媛琦
王宏刚 刘席洋 张婉 陈金华
文洪昌 张苗苗
(74)专利代理 机构 北京唯智勤实知识产权代理
事务所(普通 合伙) 11557
专利代理师 陈佳(51)Int.Cl.
G06Q 40/00(2012.01)
G06F 16/36(2019.01)
G06F 40/279(2020.01)
G06N 3/04(2006.01)
(54)发明名称
基于知识图谱的审计评估信息生 成方法、 装
置和电子设备
(57)摘要
本公开的实施例公开了基于知识图谱的审
计评估信息生成方法、 装置和电子设备。 该方法
的一具体实施方式包括: 获取目标审计报告文
本; 对目标审计报告文本进行文本清洗, 以生成
文本信息; 生成文本信息对应的目标知识图谱;
确定目标知识图谱对应的同构知识图谱, 得到同
构知识图谱集合; 根据目标知识图谱、 同构知识
图谱集合和预先训练的质量评估模 型, 生成目标
审计报告文本对应的审计评估信息; 将审计评估
信息发送至目标显示终端以供显示。 该实施方式
提高了审计效率和生成的审计评估信息的准确
性。
权利要求书4页 说明书16页 附图5页
CN 115471307 A
2022.12.13
CN 115471307 A
1.一种基于知识图谱的审计评估信息生成方法, 包括:
获取目标审计报告 文本;
对所述目标审计报告 文本进行文本清洗, 以生成文本信息;
生成所述文本信息对应的目标知识图谱;
确定所述目标知识图谱 对应的同构知识图谱, 得到同构知识图谱集 合;
根据所述目标知识图谱、 所述同构知识图谱集合和预先训练的质量评估模型, 生成所
述目标审计报告 文本对应的审计评估信息;
将所述审计评估信息发送至目标显示终端以供显示。
2.根据权利要求1所述的方法, 其中, 所述对所述目标审计报告文本进行文本清洗, 以
生成文本信息, 包括:
读取所述目标审计报告 文本, 以生成候选文本信息;
对所述候选文本信 息进行实体识别, 以生成第 一实体信 息集合, 其中, 所述第 一实体信
息集合中的第一实体信息包括: 实体位置信息和实体信息;
确定所述第一实体信息包括的实体信息与目标实体库中的每个实体信息的实体相似
度, 以生成相似度值;
从所述目标实体库中筛选出对应的相似度值位于目标区间内的实体信 息, 作为候选实
体信息, 得到候选实体信息集 合;
根据所述第 一实体信 息包括的实体位置信 息和目标候选实体信 息, 对所述候选文本信
息包括的所述第一实体信息进行实体替换, 其中, 所述 目标候选实体信息是所述候选实体
信息集合中满足第一筛 选条件的候选实体信息;
将实体替换后的候选文本信息, 确定为所述文本信息 。
3.根据权利要求1所述的方法, 其中, 所述生成所述文本信息对应的目标知识图谱, 包
括:
对所述文本信息进行实体识别, 以生成第二实体信息集 合;
对所述第二实体信息集合中的第二实体信息进行实体剔除, 以生成剔除后的实体信
息, 得到剔除后的实体信息集 合;
确定所述剔除后的实体信 息集合中的每个实体信 息对应的关系信 息, 得到关系信 息组
集合;
根据所述剔除后的实体信息集 合和所述关系信息组集 合, 生成所述目标知识图谱。
4.根据权利要求3所述的方法, 其中, 所述确定所述目标知识图谱对应的同构知识图
谱, 得到同构知识图谱集 合, 包括:
从知识图谱库中筛选出满足第二筛选条件的知识图谱, 作为候选知识图谱, 得到候选
知识图谱集合, 其中, 所述第二筛选条件为知识图谱包含的实体节点的数量大于等于所述
目标知识图谱包含的实体节点的数量、 且知识图谱包含的关系边的数量大于等于所述目标
知识图谱 包含的关系边的数量;
对所述目标知识图谱中每 个实体节点执 行以下处 理步骤:
对所述实体节点进行 特征向量构建, 以生成第一实体节点特 征向量;
对与所述实体节点相连的至少一条关系边进行特征向量构建, 以生成第 一关系边特征
向量;权 利 要 求 书 1/4 页
2
CN 115471307 A
2对于所述 候选知识图谱集 合中的每 个候选知识图谱, 执 行以下处 理步骤:
对所述候选知识图谱中的每个实体节点进行特征向量构建, 以生成第 二实体节点特征
向量, 得到第二实体节点特 征向量序列;
对所述候选知识图谱中的每个目标关系边组进行特征向量构建, 以生成第 二关系边特
征向量序列, 其中, 所述 目标关系边组是所述候选知识图谱实体节点相连的至少一个关系
边;
确定得到的第一实体节点特征向量序列中的每个第一实体节点特征向量和所述第二
实体节点特征向量序列中的每个第二 实体节点特征向量的特征相似度, 得到实体节点相似
度值组序列;
确定得到的第一关系边特征向量序列中的每个第一关系边特征向量和所述第二关系
边特征向量序列中的每个第二关系边特征向量的特征相似度, 得到关系边相似度值组序
列;
从所述实体节点相似度值组序列中的每个实体节点相似度值组中筛选出数值最大的
实体节点相似度值, 作为第一 候选值, 得到第一 候选值集合;
从所述关系边相似度值组序列中的每个关系边相似度值组中筛选出数值最大的关系
边相似度值, 作为第二 候选值, 得到第二 候选值集合;
对所述第一候选值集合中的第一候选值和所述第二候选值集合中的第二候选值进行
加权求和, 以生成所述 候选知识图谱 对应的图谱相似度数值;
从所述候选知识图谱集合中筛选出对应的图谱相似度数值满足第三筛选条件候选知
识图谱, 作为同构知识图谱, 得到所述同构知识图谱集 合。
5.根据权利要求4所述的方法, 其中, 所述质量评估模型包括: 特征提取模型集合、 第一
分类模型、 特 征融合模型和第二分类模型; 以及
所述根据所述目标知识图谱、 所述同构知识图谱集合和预先训练的质量评估模型, 生
成所述目标审计报告 文本对应的审计评估信息, 包括:
将所述目标知识图谱和所述同构知识图谱集合中的同构知识图谱, 并行输入所述特征
提取模型集合中的特征提取模型中, 以生成第一特征图谱特征信息和 第二图谱特征信息集
合;
将所述第一特征图谱特征信 息和所述第 二图谱特征信 息集合输入所述第 一分类模型,
以生成分类结果;
将所述第一特征图谱特征信 息和所述分类结果对应的至少一个第 二图谱特征信 息, 输
入所述特 征融合模型, 以生成第三图谱特 征信息;
将所述第三图谱特 征信息输入所述第二分类模型, 以生成所述审计评估信息 。
6.根据权利要求1所述的方法, 其中, 在所述将所述审计评估信 息发送至目标显示终端
以供显示之前, 所述方法还 包括:
向与所述目标显示终端连接的通信终端发送通信请求;
响应于接收到所述通信终端发送的通信连接请求, 与 所述通信终端创建端到端的通信
链路;
响应于确定所述通信链路创建成功, 通过所述通信链路传输所述审计评估信 息对应的
加密文本 至所述通信终端。权 利 要 求 书 2/4 页
3
CN 115471307 A
3
专利 基于知识图谱的审计评估信息生成方法、装置和电子设备
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:42:51上传分享