(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210939619.3
(22)申请日 2022.08.05
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 刘永娇
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 李辉 王维宁
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/216(2020.01)
G06F 40/284(2020.01)
(54)发明名称
事件检测方法及装置
(57)摘要
本发明公开了一种事件检测方法及装置, 可
用于金融领域或其他技术领域, 该方法包括: 确
定词集中每个词各自对应的TF ‑IDF权重, 并根据
TF‑IDF权重对所述词集中的所有词进行筛选, 得
到关键词; 针对同时出现在至少一个所述文档中
的任意两个所述关键词, 计算出该两个所述关键
词彼此的关联 强度; 根据所述关键词以及所述关
联强度生成有向网络图; 根据每个所述有向边各
自对应的权重确定每个所述节点各自对应的整
体关联性得分, 并根据所述整体关联性得分对所
述节点进行筛选, 确定出所述节点中的关键节
点; 根据所述关键节点进行事件提取。 本发明提
供了一种更为 准确和高效的事 件检测方案 。
权利要求书2页 说明书8页 附图3页
CN 115391551 A
2022.11.25
CN 115391551 A
1.一种事 件检测方法, 其特 征在于, 包括:
通过对文档集合中的各文档进行分词处理, 得到所述文档集合中每个文档各自对应的
词集;
确定所述词集 中每个词各自对应的TF ‑IDF权重, 并根据TF ‑IDF权重对所述词集中的所
有词进行筛 选, 得到关键词;
针对同时出现在至少一个所述文档中的任意两个所述关键词, 计算出该两个所述关键
词彼此的关联强度;
根据所述关键词以及所述关联强度生成有向网络图, 其中, 所述有向网络图包含: 节
点、 有向边以及每个所述有向边各自对应的权重, 所述关键词 与所述节点一一对应, 同时出
现在至少一个所述文档中的任意两个所述关键词所对应的节点通过有向边相连接, 有向边
的指向以及有向边对应的权重由有向边连接的两个节点对应的关键词彼此 的关联强度所
确定;
根据每个所述有向边各自对应的权重确定每个所述节点各自对应的整体关联性得分,
并根据所述整体关联性得分对所述节点进行筛 选, 确定出 所述节点中的关键节点;
根据所述关键节点进行事 件提取。
2.根据权利要求1所述的事件检测方法, 其特征在于, 所述确定所述词集中每个词各自
对应的TF ‑IDF权重, 具体包括:
根据每个词出现在所述文档集合中的频率以及每个词的逆文档频率, 确定每个词各自
对应的TF ‑IDF权重。
3.根据权利要求1所述的事件检测方法, 其特征在于, 所述计算出该两个所述关键词彼
此的关联强度, 具体包括:
根据所述文档集合中同时包含该两个所述关键词的文档的数量以及所述文档集合中
仅包含该两个所述关键词中的一个的文档的数量计算出该两个所述关键词彼此 的关联强
度。
4.根据权利要求1所述的事件检测方法, 其特征在于, 有向边的指向具体由有向边连接
的两个节点中关联强度高的节点指向关联强度低的节点; 有向边对应的权重具体采用有向
边连接的两个节点中关联强度高的节点的关联强度。
5.根据权利要求1所述的事件检测方法, 其特征在于, 所述根据每个所述有向边各自对
应的权重确定每 个所述节点各自对应的整体关联性得分, 包括:
获取目标节点的入邻居节点 集合和出邻居节点 集合;
根据所述目标节点与所述入邻居节点集合中的各节点的权重以及所述目标节点与所
述出邻居节点 集合中的各节点的权 重, 确定所述目标节点的对应的整体关联性得分。
6.一种事 件检测装置, 其特 征在于, 包括:
词集确定单元, 用于通过对文档集合中的各文档进行分词处理, 得到所述文档集合中
每个文档各自对应的词集;
关键词筛选单元, 用于确定所述词集中每个词各自对应 的TF‑IDF权重, 并根据TF ‑IDF
权重对所述词集中的所有词进行筛 选, 得到关键词;
关联强度计算单元, 用于针对同时出现在至少一个所述文档中的任意两个所述关键
词, 计算出 该两个所述关键词彼此的关联强度;权 利 要 求 书 1/2 页
2
CN 115391551 A
2有向网络图生成单元, 用于根据所述关键词以及所述关联强度生成有向网络图, 其中,
所述有向网络图包含: 节点、 有向边以及每个所述有向边各自对应的权重, 所述关键词 与所
述节点一一对应, 同时出现在至少一个所述文档中的任意两个所述关键词所对应的节点通
过有向边相连接, 有向边的指向以及有向边对应的权重由有向边连接的两个节点对应的关
键词彼此的关联强度所确定;
关键节点筛选单元, 用于根据每个所述有向边各自对应的权重确定每个所述节点各自
对应的整体关联性得分, 并根据所述整体关联性得分对所述节点进行筛选, 确定出所述节
点中的关键节点;
事件提取单元, 用于根据所述关键节点进行事 件提取。
7.根据权利要求6所述的事件检测装置, 其特征在于, 所述关键词筛选单元, 具体用于
根据每个词出现在所述文档集合中的频率以及每个词的逆文档频率, 确定每个词各自对应
的TF‑IDF权重。
8.根据权利要求6所述的事件检测装置, 其特征在于, 所述关联强度计算单元, 具体用
于根据所述文档集合中同时包含该两个所述关键词的文档的数量以及所述文档集合中仅
包含该两个所述关键词中的一个的文档的数量计算出 该两个所述关键词彼此的关联强度。
9.根据权利要求6所述的事件检测装置, 其特征在于, 有向边的指向具体由有向边连接
的两个节点中关联强度高的节点指向关联强度低的节点; 有向边对应的权重具体采用有向
边连接的两个节点中关联强度高的节点的关联强度。
10.根据权利要求6所述的事 件检测装置, 其特 征在于, 所述关键节点筛 选单元, 包括:
节点集合获取模块, 用于获取目标节点的入邻居节点 集合和出邻居节点 集合;
整体关联性得分计算模块, 用于根据 所述目标节点与 所述入邻居节点集合中的各节点
的权重以及所述目标节点与所述出邻居节点集合中的各节点的权重, 确定所述目标节点的
对应的整体关联性得分。
11.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至5任意一项所
述方法的步骤。
12.一种计算机可读存储介质, 其上存储有计算机程序/指令, 其特征在于, 该计算机程
序/指令被处 理器执行时实现权利要求1至 5任意一项所述方法的步骤。
13.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 该计算机程序/指令被
处理器执行时实现权利要求1至 5任意一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 115391551 A
3
专利 事件检测方法及装置
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:41:44上传分享