(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210943240.X
(22)申请日 2022.08.08
(71)申请人 中国地质大 学 (北京)
地址 100083 北京市海淀区学院路2 9号
(72)发明人 季晓慧 刘成健 董雨航 杨眉
何明跃
(74)专利代理 机构 北京头头知识产权代理有限
公司 11729
专利代理师 刘锋
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/36(2019.01)
G06F 40/295(2020.01)
G06F 40/35(2020.01)
G06N 3/08(2006.01)
(54)发明名称
应用于矿物领域知识图谱的问答方法、 电子
装置及存 储介质
(57)摘要
本发明公开了一种应用于矿物领域知识图
谱的问答方法, 该方法包括: 根据已有矿物知识
图谱定义问句意图类别并引入相关疑问词, 构建
问句集, 训练问句意图识别和实体/属性抽取模
型, 用训练好的模型对用户输入的问句进行意图
识别和实体/属性抽取, 并生成知识图谱查询语
句, 向知识图谱输入查询语句, 获得相应问句答
案。 本发明提供的矿物知识图谱问答方法、 电子
装置及存储介质, 其通过构建问句意图模板和问
句集对基于Bert的模型进行训练, 在问句集构建
过程中通过同义转换、 句式重构以及汉英互译转
换等方式增加问句数量, 提高对 形式多样的自然
语言问题回答的能力, 实现了对自然语 言输入问
句的准确回答。 可以将该问答方法应用于矿物领
域知识图谱的智能查询。
权利要求书1页 说明书3页 附图4页
CN 115269806 A
2022.11.01
CN 115269806 A
1.一种应用于矿物领域知识图谱的问答方法, 应用于电子装置 中, 其特征在于, 所述方
法包括:
根据已有矿物知识图谱定义问句意图类别并引入相关 疑问词;
构建问句集, 训练问句意图识别和实体/属性抽取模型;
用训练好的模型对用户输入的问句进行意图识别和实体/属性抽取, 并生成知识图谱
查询语句;
向知识图谱输入查询语句, 获得相应问句答案 。
2.根据权力要求1所述的应用于矿物领域知识图谱的问答方法, 其特征在于, 步骤 “根
据已有矿物知识图谱定义问句意图类别并引入相关 疑问词”具体包括:
根据已有矿物知识图谱定义 “英文名”、“物理特性 ”、“化学特性 ”、“矿物分类 ”、“晶系”、
“晶类”、“产地”、“形成年代 ”、“主要用途 ”、“储量”、“共/伴生”、“技术手段 ”等12类问句意图
模板, 并引入 “是什么”、“在哪里”、“何时”、“有多少”以及“如何”等疑问词。
3.根据权利要求1所述的应用于矿物领域知识图谱的问答方法, 其特征在于, 步骤 “构
建问句集, 训练问句意图识别和实体/属性抽取模型 ”具体包括:
从已有矿物知识图谱中随机抽取实体、 关系/属性, 与已引入的相关疑问词进行组合,
并根据已构建的问句意图模板构造 问句。 为了使问答系统能处理更多样的问句, 通过同义
转换、 句式重构以及汉英互译转换等方式对生 成的问句进行 处理, 以增加问句数量、 提高对
更丰富多样的自然语言问句的处理能力。 对所生成的问句进 行意图及实体/属性标注后, 生
成问句集, 按7.5:1.25:1.25的比例划分为训练数据、 验证数据和 测试数据。
为了尽快对用户的输入问题进行回答, 仅使用基于Bert的深度 学习模型进行意图识别
和实体/属性抽取, 未加入BiLSTM等其他网络层, 对模 型用生成的问句集中的训练数据进 行
训练, 用验证数据进行验证, 获得最终用于意图识别和实体/属性抽取的模型。
4.根据权利要求1所述的应用于矿物领域知识图谱的问答方法, 其特征在于, 步骤 “用
训练好的模型对用户输入的问句进行意图识别和实体/属 性抽取, 并生成知识图谱查询语
句”具体包括:
将训练好的基于Bert的问句意图识别和实体/属性抽取模型应用到用户输入的查询问
题中, 得到用户问题意图类别 及相关实体/属性, 并根据构建的问句意图模板生成知识图谱
查询语句。
5.根据权利要求1所述的应用于矿物领域知识图谱的问答方法, 其特征在于, 步骤 “向
知识图谱输入查询语句, 获得相应问句答案 ”具体包括:
将获得的知识图谱查询语句输入 矿物知识图谱进行查询, 获得最后答案 。
6.如权力要求1所述的应用于矿物领域知识图谱的问答方法, 其特征在于: 所述应用于
矿物领域知识图谱的问答方法用于对矿物领域知识图谱进 行智能查询, 通过输入自然语言
问句来准确、 快速地获得专业 答案。
7.一种电子装置, 其特 征在于, 所属电子装置包括:
处理器; 及存储器, 所述存储器 中存储有多个程序模块, 所述多个程序模块由所述处理
器加载并执 行如权利要求1 ‑5中任意一项所述的应用于矿物领域知识图谱的问答方法。
8.一种存储介质, 其上存储有至少一条计算机指令, 其特征在于, 所述指令由处理器并
加载执行如权利要求1 ‑5中任意一项所述的应用于矿物领域知识图谱的问答方法。权 利 要 求 书 1/1 页
2
CN 115269806 A
2应用于矿物领域知识图谱的问答 方法、 电子装置及存储介质
技术领域
[0001]本发明涉及数据处理技术领域, 尤其涉及 一种应用于矿物领域知识图谱的问答方
法、 电子装置及存 储介质。
背景技术
[0002]获取矿物知识对于矿物及相关地质研究十分重要, 目前已有的矿物知识获取方法
主要分为两种: 一种 是在专门的矿物数据库中输入相关关键词进行矿物知识获取; 一种 是
在通用搜索引擎, 如百度、 谷歌上进 行相关矿物知识 查询。 在专门的矿物数据库上进 行知识
获取的方法无法处理以自然语言形式输入的问句, 而通用搜索引擎虽然 可以处理以自然语
言形式输入的问句, 但返回的结果 不够专业, 需要用户进行进一 步的人工 筛选, 效率低下。
发明内容
[0003]有鉴于此, 有必要在最新用于组织和存储矿物知识的知识图谱上构建能对用户以
自然语言形式输入的问句进行回答的矿物知识问答系统, 以专 业、 准确、 高效地对用户的矿
物知识提问进行回答。
[0004]本发明的第一方面提供一种应用于矿物领域知识图谱的问答方法, 应用在电子装
置中, 所述方法包括:
[0005]根据已有矿物知识图谱定义问句意图类别并引入相关 疑问词;
[0006]构建问句集, 训练问句意图识别和实体/属性抽取模型;
[0007]用训练好的模型对用户输入的问句进行意图识别和实体/属性抽 取, 并生成知识
图谱查询语句;
[0008]向知识图谱输入查询语句, 获得相应问句答案 。
[0009]优选地, 步骤 “根据已有矿物知识图谱定义问句意图类别并引入相关疑问词 ”具体
包括:
[0010]根据已有矿物知识图谱定义 “英文名”、“物理特性 ”、“化学特性 ”、“矿物分类 ”、“晶
系”、“晶类”、“产地”、“形成年代 ”、“主要用途 ”、“储量”、“共/伴生”、“技术手段 ”等12类问句
意图模板, 并引入 “是什么”、“在哪里”、“何时”、“有多少”以及“如何”等疑问词。
[0011]优选地,“构建问句集, 训练问句意图识别和实体/属性抽取模型 ”具体包括:
[0012]从已有矿物知识图谱中随机抽取实体、 关系/属性, 与已引入的相关疑问词进行组
合, 并根据已构建的问句意图模板构 造问句。 为了使问答系统 能处理更多样的问句, 通过同
义转换、 句式重构以及汉英互译转换等方式对生成的问句进 行处理, 以增加问句数量、 提高
模型泛化能力。 对所生成的问句进行意图及实体/属性标注后, 生成问句集, 按7.5:1.25:
1.25的比例划分为训练数据、 验证数据和 测试数据。
[0013]为了尽快对用户的输入问题进行回答, 仅使用基于Bert的深度学习模型进行意图
识别和实体/属性抽取, 未加入BiLSTM等其他网络层, 对模 型用生成的问句集中的训练数据
进行训练, 用验证数据进行验证, 获得最终用于意图识别和实体/属性抽取的模型。说 明 书 1/3 页
3
CN 115269806 A
3
专利 应用于矿物领域知识图谱的问答方法、电子装置及存储介质
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:43:25上传分享