(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210964565.6
(22)申请日 2022.08.12
(65)同一申请的已公布的文献号
申请公布号 CN 115033717 A
(43)申请公布日 2022.09.09
(73)专利权人 杭州恒生聚源信息技 术有限公司
地址 310018 浙江省杭州市杭州经济技 术
开发区白杨街道科技园路2号2幢
1701-1714室
专利权人 上海恒生聚源数据服 务有限公司
(72)发明人 杨祎聪 顾文斌 孙勇 任俊安
李晓平
(74)专利代理 机构 北京超凡宏宇专利代理事务
所(特殊普通 合伙) 11463
专利代理师 张文娥
(51)Int.Cl.
G06F 16/36(2019.01)G06F 16/35(2019.01)
G06F 40/289(2020.01)
G06K 9/62(2022.01)
G06N 3/08(2006.01)
(56)对比文件
CN 115017324 A,202 2.03.03
CN 112052681 A,2020.12.08
CN 111680109 A,2020.09.18
CN 111737476 A,2020.10.02
WO 2021121198 A1,2021.0 6.24
CN 111460826 A,2020.07.28
CN 10710 3281 A,2017.08.2 9
CN 106910199 A,2017.0 6.30
CN 114153978 A,202 2.03.08
US 2010088355 A1,2010.04.08
田萱等.基 于语义分割的食品标签文本 检
测. 《农业机 械学报》 .2020,(第08 期),
审查员 李乔
(54)发明名称
三元组抽取模型训练方法、 三元组抽取方
法、 装置及设备
(57)摘要
本申请提供一种三元 组抽取模 型训练方法、
三元组抽取方法、 装置及设备, 涉及自然语言处
理技术领域。 该方法包括: 获取样本文本以及样
本文本对应的多个样本三元 组; 各样本三元组中
的样本主体进行遍历, 确定各样 本主体对应的样
本权重, 其中, 样本权重用于表征与样本主体具
有相同关系以及相同客体的主体的数量; 将样本
文本输入初始三元组抽取模型, 得到多个预测三
元组; 以各预测三元组、 各样本三元组以及各样
本主体对应的样本权重作为损失函数的输入参
数, 确定初始三元组抽取模型的损失信息, 并根
据损失信息对初始三元组抽取模型进行迭代修
正, 得到目标三元组抽取模型。 应用本申请实施
例, 可提高对三元组抽取的精确度。
权利要求书3页 说明书18页 附图5页
CN 115033717 B
2022.11.08
CN 115033717 B
1.一种三元组抽取模型训练方法, 其特 征在于, 所述方法包括:
获取样本文本以及所述样本文本对应的多个样本三元组;
对各所述样本三元组中的样本主体进行遍历, 确定各所述样本主体对应的样本权重,
所述样本 权重用于表征与所述样本主体具有相同关系以及相同客体的主体的数量;
获取各所述样本三元组对应的样本主体 类型以及样本客体 类型;
将所述样本文本、 各所述样本三元组对应的样本主体类型以及样本客体类型输入初始
三元组抽取模型, 得到多个预测三元组;
其中, 所述初始三元组抽取模型包括初始主体抽取子模型、 初始关系及客体抽取子模
型, 所述初始主体抽取子模型与所述初始关系及客体抽取子模型 连接;
将各所述样本三元组中的样本主体向量、 各所述预测三元组中的预测主体向量以及各
所述样本主体对应的样本权重作为第一损失函数的输入参数, 得到第一损失信息, 其中, 所
述预测主体向量根据将所述主体抽取训练样本的特征输入所述初始主体抽取子模型中得
到, 所述预测主体 向量由预测主体的起始位置 向量以及结束位置 向量组成, 所述主体抽取
训练样本的特征 由根据所述样本文本以及各所述样本三元组对应的样本主体类型构建得
到;
根据各所述预测三元组中的预测主体的位置以及所述初始关系及客体抽取子模型的
输入序列中的各位置, 确定所述输入序列中各位置分别对应的放缩系数;
将所述输入序列中各位置分别对应的放缩系数、 所述输入序列中各位置对应的位置向
量以及各所述样本主体对应的样本权重作为第二损失函数的输入参数, 得到第二损失信
息;
根据所述第 一损失信 息以及所述第 二损失信 息, 确定所述初始三元组抽取模型的损失
信息, 并根据所述损失信息对所述初始三元组抽取模型进行迭代修正, 得到目标三元组抽
取模型。
2.根据权利要求1所述的方法, 其特征在于, 所述将所述样本文本、 各所述样本三元组
对应的样本主体类型以及样本客体类型输入初始三元组抽取模型, 得到多个预测三元组,
包括:
将所述主体抽取训练样本的特征输入所述初始主体抽取子模型, 得到上下文向量以及
多个预测主体向量;
将所述上下文向量、 各所述预测主体向量、 各所述样本三元组对应的样本客体类型输
入所述初始关系及客体抽取子模型, 得到多个预测三元组, 所述预测三元组包括: 预测主体
向量、 所述预测主体向量对应的预测客体向量以及所述预测主体向量与所述预测客体向量
的关系, 其中, 所述预测客体向量由预测客体的起始位置向量以及结束位置向量组成。
3.根据权利要求2所述的方法, 其特征在于, 所述将所述主体抽取训练样本的特征输入
所述初始主体抽取子模型, 得到上 下文向量以及多个预测主体向量, 包括:
将所述主体抽取训练样本的特征输入所述初始主体抽取子模型中的初始编码层, 得到
上下文向量;
将所述上下文向量输入所述初始主体抽取子模型中的初始全连接层, 得到多个预测主
体对应的头指针向量以及尾指针向量;
根据所述上下文向量以及所述多个预测主体对应的头指针向量以及尾指针向量, 得到权 利 要 求 书 1/3 页
2
CN 115033717 B
2多个预测主体向量。
4.根据权利要求2所述的方法, 其特征在于, 所述将所述上下文向量、 各所述预测主体
向量、 各所述样本三元组对应的样本客体类型输入所述初始关系及客体抽取子模型, 得到
多个预测三元组, 包括:
分别将所述上下文向量、 各所述样本三元组对应的样本客体类型与 各所述预测主体向
量进行融合处 理, 得到多个客体抽取训练样本的特 征;
将各所述客体抽取训练样本中的特征分别 输入所述初始关系及客体抽取子模型, 得到
多个预测三元组。
5.根据权利要求1所述的方法, 其特征在于, 所述对各所述样本三元组中的样本主体进
行遍历, 确定各 所述样本主体对应的样本 权重, 包括:
在已遍历样本主体集 合中查找当前遍历到的第一样本主体;
若所述已遍历样本主体集合中存在与所述第一样本主体具有相同关系以及相同客体
的并列样本主体, 则将所述并列样本主体的样本 权重作为所述第一样本主体的样本 权重;
否则, 遍历各所述样本三元组中的样本主体, 得到与所述第一样本主体具有相同关系
以及相同客体的并列样本主体的数量, 根据所述并列样本主体的数量确定所述第一样本主
体的样本 权重, 并将所述第一样本主体增 加至所述已遍历样本主体集 合中。
6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
根据各所述样本主体对应的样本权重对所述初始三元组抽取模型的学习率进行调 整,
得到目标 学习率;
所述根据 所述损失信 息对所述初始三元组抽取模型进行迭代修正, 得到目标三元组抽
取模型, 包括:
根据所述损 失信息以及所述目标学习率, 对所述初始三元组抽取模型进行迭代修正,
得到目标三元组抽取模型。
7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述获取样本文本以及所述样本
文本对应的多个样本三元组之前, 所述方法还 包括:
获取样本文本对应的初始三元组;
将所述样本文本对应的初始三元组拆分为包 含有单一主体的样本三元组。
8.一种三元组抽取 方法, 其特 征在于, 所述方法包括:
获取待处 理文本;
将所述待处理文本输入目标三元组抽取模型, 得到所述待处理文本对应的多个预测三
元组, 其中, 所述目标三元组抽取模 型基于权利要求 1‑7任一项所述的三元 组抽取模型训练
方法得到 。
9.根据权利要求8所述的方法, 其特征在于, 所述将所述待处理文本输入目标三元组抽
取模型, 得到所述待处 理文本对应的多个预测三元组, 包括:
将所述待处理文本以及所述待处理文本对应的主体类型以及客体类型输入目标三元
组抽取模型, 得到所述待处 理文本对应的多个预测三元组。
10.根据权利要求8或9所述的方法, 其特 征在于, 所述方法还 包括:
若所述预测三元组中的第 一预测三元组和第 二预测三元组 的客体以及关系分别相同,
且所述第一预测三元 组的主体归属于所述第二预测三元组的主体, 则从所述多个预测三元权 利 要 求 书 2/3 页
3
CN 115033717 B
3
专利 三元组抽取模型训练方法、三元组抽取方法、装置及设备
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:41:41上传分享