专利 三元组抽取模型训练方法、三元组抽取方法、装置及设备

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210964565.6 (22)申请日 2022.08.12 (65)同一申请的已公布的文献号申请公布号 CN 115033717 A (43)申请公布日 2022.09.09 (73)专利权人杭州恒生聚源信息技术有限公司地址 310018 浙江省杭州市杭州经济技术开发区白杨街道科技园路2号2幢 1701-1714室专利权人上海恒生聚源数据服务有限公司 (72)发明人杨祎聪　顾文斌　孙勇　任俊安　李晓平　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 专利代理师张文娥 (51)Int.Cl. G06F 16/36(2019.01)G06F 16/35(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01) G06N 3/08(2006.01) (56)对比文件 CN 115017324 A,202 2.03.03 CN 112052681 A,2020.12.08 CN 111680109 A,2020.09.18 CN 111737476 A,2020.10.02 WO 2021121198 A1,2021.0 6.24 CN 111460826 A,2020.07.28 CN 10710 3281 A,2017.08.2 9 CN 106910199 A,2017.0 6.30 CN 114153978 A,202 2.03.08 US 2010088355 A1,2010.04.08 田萱等.基于语义分割的食品标签文本检测. 《农业机械学报》 .2020,(第08 期), 审查员李乔 (54)发明名称三元组抽取模型训练方法、三元组抽取方法、装置及设备 (57)摘要本申请提供一种三元组抽取模型训练方法、三元组抽取方法、装置及设备，涉及自然语言处理技术领域。该方法包括：获取样本文本以及样本文本对应的多个样本三元组；各样本三元组中的样本主体进行遍历，确定各样本主体对应的样本权重，其中，样本权重用于表征与样本主体具有相同关系以及相同客体的主体的数量；将样本文本输入初始三元组抽取模型，得到多个预测三元组；以各预测三元组、各样本三元组以及各样本主体对应的样本权重作为损失函数的输入参数，确定初始三元组抽取模型的损失信息，并根据损失信息对初始三元组抽取模型进行迭代修正，得到目标三元组抽取模型。应用本申请实施例，可提高对三元组抽取的精确度。权利要求书3页说明书18页附图5页 CN 115033717 B 2022.11.08 CN 115033717 B 1.一种三元组抽取模型训练方法，其特征在于，所述方法包括：获取样本文本以及所述样本文本对应的多个样本三元组；对各所述样本三元组中的样本主体进行遍历，确定各所述样本主体对应的样本权重，所述样本权重用于表征与所述样本主体具有相同关系以及相同客体的主体的数量；获取各所述样本三元组对应的样本主体类型以及样本客体类型；将所述样本文本、各所述样本三元组对应的样本主体类型以及样本客体类型输入初始三元组抽取模型，得到多个预测三元组；其中，所述初始三元组抽取模型包括初始主体抽取子模型、初始关系及客体抽取子模型，所述初始主体抽取子模型与所述初始关系及客体抽取子模型连接；将各所述样本三元组中的样本主体向量、各所述预测三元组中的预测主体向量以及各所述样本主体对应的样本权重作为第一损失函数的输入参数，得到第一损失信息，其中，所述预测主体向量根据将所述主体抽取训练样本的特征输入所述初始主体抽取子模型中得到，所述预测主体向量由预测主体的起始位置向量以及结束位置向量组成，所述主体抽取训练样本的特征由根据所述样本文本以及各所述样本三元组对应的样本主体类型构建得到；根据各所述预测三元组中的预测主体的位置以及所述初始关系及客体抽取子模型的输入序列中的各位置，确定所述输入序列中各位置分别对应的放缩系数；将所述输入序列中各位置分别对应的放缩系数、所述输入序列中各位置对应的位置向量以及各所述样本主体对应的样本权重作为第二损失函数的输入参数，得到第二损失信息；根据所述第一损失信息以及所述第二损失信息，确定所述初始三元组抽取模型的损失信息，并根据所述损失信息对所述初始三元组抽取模型进行迭代修正，得到目标三元组抽取模型。 2.根据权利要求1所述的方法，其特征在于，所述将所述样本文本、各所述样本三元组对应的样本主体类型以及样本客体类型输入初始三元组抽取模型，得到多个预测三元组，包括：将所述主体抽取训练样本的特征输入所述初始主体抽取子模型，得到上下文向量以及多个预测主体向量；将所述上下文向量、各所述预测主体向量、各所述样本三元组对应的样本客体类型输入所述初始关系及客体抽取子模型，得到多个预测三元组，所述预测三元组包括：预测主体向量、所述预测主体向量对应的预测客体向量以及所述预测主体向量与所述预测客体向量的关系，其中，所述预测客体向量由预测客体的起始位置向量以及结束位置向量组成。 3.根据权利要求2所述的方法，其特征在于，所述将所述主体抽取训练样本的特征输入所述初始主体抽取子模型，得到上下文向量以及多个预测主体向量，包括：将所述主体抽取训练样本的特征输入所述初始主体抽取子模型中的初始编码层，得到上下文向量；将所述上下文向量输入所述初始主体抽取子模型中的初始全连接层，得到多个预测主体对应的头指针向量以及尾指针向量；根据所述上下文向量以及所述多个预测主体对应的头指针向量以及尾指针向量，得到权　利　要　求　书 1/3 页 2 CN 115033717 B 2多个预测主体向量。 4.根据权利要求2所述的方法，其特征在于，所述将所述上下文向量、各所述预测主体向量、各所述样本三元组对应的样本客体类型输入所述初始关系及客体抽取子模型，得到多个预测三元组，包括：分别将所述上下文向量、各所述样本三元组对应的样本客体类型与各所述预测主体向量进行融合处理，得到多个客体抽取训练样本的特征；将各所述客体抽取训练样本中的特征分别输入所述初始关系及客体抽取子模型，得到多个预测三元组。 5.根据权利要求1所述的方法，其特征在于，所述对各所述样本三元组中的样本主体进行遍历，确定各所述样本主体对应的样本权重，包括：在已遍历样本主体集合中查找当前遍历到的第一样本主体；若所述已遍历样本主体集合中存在与所述第一样本主体具有相同关系以及相同客体的并列样本主体，则将所述并列样本主体的样本权重作为所述第一样本主体的样本权重；否则，遍历各所述样本三元组中的样本主体，得到与所述第一样本主体具有相同关系以及相同客体的并列样本主体的数量，根据所述并列样本主体的数量确定所述第一样本主体的样本权重，并将所述第一样本主体增加至所述已遍历样本主体集合中。 6.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据各所述样本主体对应的样本权重对所述初始三元组抽取模型的学习率进行调整，得到目标学习率；所述根据所述损失信息对所述初始三元组抽取模型进行迭代修正，得到目标三元组抽取模型，包括：根据所述损失信息以及所述目标学习率，对所述初始三元组抽取模型进行迭代修正，得到目标三元组抽取模型。 7.根据权利要求1 ‑6任一项所述的方法，其特征在于，所述获取样本文本以及所述样本文本对应的多个样本三元组之前，所述方法还包括：获取样本文本对应的初始三元组；将所述样本文本对应的初始三元组拆分为包含有单一主体的样本三元组。 8.一种三元组抽取方法，其特征在于，所述方法包括：获取待处理文本；将所述待处理文本输入目标三元组抽取模型，得到所述待处理文本对应的多个预测三元组，其中，所述目标三元组抽取模型基于权利要求 1‑7任一项所述的三元组抽取模型训练方法得到。 9.根据权利要求8所述的方法，其特征在于，所述将所述待处理文本输入目标三元组抽取模型，得到所述待处理文本对应的多个预测三元组，包括：将所述待处理文本以及所述待处理文本对应的主体类型以及客体类型输入目标三元组抽取模型，得到所述待处理文本对应的多个预测三元组。 10.根据权利要求8或9所述的方法，其特征在于，所述方法还包括：若所述预测三元组中的第一预测三元组和第二预测三元组的客体以及关系分别相同，且所述第一预测三元组的主体归属于所述第二预测三元组的主体，则从所述多个预测三元权　利　要　求　书 2/3 页 3 CN 115033717 B 3

专利 三元组抽取模型训练方法、三元组抽取方法、装置及设备

专利三元组抽取模型训练方法、三元组抽取方法、装置及设备