行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111631393.2 (22)申请日 2021.12.28 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 贺路阳 武小波 王颖  (74)专利代理 机构 中国贸促会专利商标事务所 有限公司 1 1038 专利代理师 曾琳 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 40/289(2020.01) G06N 20/00(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 用于对投诉信息进行分类的方法、 装置和存 储介质 (57)摘要 本公开涉及用 于对投诉信息进行分类的方 法、 装置和存储介质。 该方法包括: 提取用户投诉 文本中的敏感数据, 并从用户投诉文本中删除提 取的敏感数据以得到待分析文本; 在待分析文本 中确定待输入到经机器学习得到的分类模型的 多个关键词短语, 所述多个关键词短语是在待分 析文本中的候选短语之中根据候选短语中包含 的词语而确定的; 以及通过使用所述分类模型对 待分析文本和所述多个关键词短语进行处理, 得 到与用户投诉文本对应的投诉类型。 通过上述方 案, 能够实现对用户投诉信息的自动分类, 有助 于用户投诉信息处理效率的提高, 使得用户的满 意度和体验得以改善 。 权利要求书2页 说明书8页 附图3页 CN 114491019 A 2022.05.13 CN 114491019 A 1.一种用于对投诉信息进行分类的方法, 包括: 提取用户投诉文本 中的敏感数据, 并从用户投诉文本 中删除提取的敏感数据以得到待 分析文本; 在待分析文本 中确定待输入到经机器学习得到的分类模型的多个关键词短语, 所述多 个关键词短语是在待分析文本中的候选 短语之中根据候选 短语中包含的词语而确定的; 以 及 通过使用所述分类模型对待分析文本和所述多个关键词短语进行处理, 得到与用户投 诉文本对应的投诉类型。 2.根据权利要求1所述的方法, 其中, 所述 提取用户投诉文本中的敏感数据包括: 在用户投诉文本包括指示手机号、 身份证号和/或电子邮箱地址的敏感数据的情况下, 通过使用正则表达式提取指示手机号、 身份 证号和/或电子邮箱地址的敏感数据; 以及 在用户投诉文本包括指示地址信息和/或姓名的敏感数据的情况下, 通过使用预训练 模型提取指示 地址信息和/或姓名的敏感数据。 3.根据权利要求1所述的方法, 其中, 根据快速关键词提取算法, 从待分析文本中确定 所述多个关键词短语。 4.根据权利要求1所述的方法, 其中, 确定所述多个关键词短语包括: 在待分析文本中确定候选短语; 对于每个候选短语, 通过以下 方式计算该候选短语的得分: 根据该候选短语中包 含的每个词语的共现关系值和出现频率, 计算该词语的得分, 和 根据该候选短语中包 含的每个词语的得分, 计算该候选短语的得分; 按照候选短语的得分从高到低的顺序, 对候选短语进行排序; 以及 选择得分最高的多个候选短语作为输入到分类模型的所述多个关键词短语。 5.根据权利要求1所述的方法, 其中, 所述分类模型是将删除敏感数据的已知投诉文本 的词向量和已知投诉文本所对应的关键词短语的词向量作为输入、 并将已知投诉文本所对 应的投诉类型作为输出, 对机器学习模型进行训练而得到的, 在使用训练好的所述分类模型时, 所述分类模型的多个输入端中的一个输入端输入待 分析文本的词向量, 所述分类模型的多个输入端中的其它输入端分别输入 所述多个关键词 短语的词向量, 并且所述分类模型的多个输出端分别指示多个预定投诉类型的概 率。 6.根据权利要求1所述的方法, 其中, 所述分类模型是使用双向长短时记忆循环神经网 络算法得到的。 7.根据权利要求1所述的方法, 进一 步包括: 输出所述分类模型对待分析文本和所述多个关键词短语进行处理之后得到的最大M个 概率及其对应的投诉类型, 并将概率最大的投诉类型作为与用户投诉文本对应的投诉类 型, 其中M 至少等于2。 8.一种用于对投诉信息进行分类的装置, 包括: 存储器, 所述存 储器存储有计算机可 执行指令; 以及 处理器, 所述处理器与所述存储器耦接, 所述计算机可执行指令当被所述处理器执行 时使所述处 理器执行根据权利要求1 ‑7中任一项所述的方法。 9.一种计算机可读存储介质, 存储有计算机可执行指令, 所述计算机可执行指令当被权 利 要 求 书 1/2 页 2 CN 114491019 A 2处理器执行时使所述处 理器执行根据权利要求1 ‑7中任一项所述的方法。 10.一种用于对投诉信息进行分类的装置, 包括: 用于执行根据权利要求1 ‑7中任一项 所述的方法的步骤的部件。权 利 要 求 书 2/2 页 3 CN 114491019 A 3

.PDF文档 专利 用于对投诉信息进行分类的方法、装置和存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于对投诉信息进行分类的方法、装置和存储介质 第 1 页 专利 用于对投诉信息进行分类的方法、装置和存储介质 第 2 页 专利 用于对投诉信息进行分类的方法、装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。