行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111256980.8 (22)申请日 2021.10.27 (71)申请人 建信金融科技有限责任公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区银城路99号12层、 15 层 (72)发明人 田浩 张彪 何钟豪  (74)专利代理 机构 北京品源专利代理有限公司 11332 代理人 王风茹 (51)Int.Cl. G06F 16/242(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) G06V 10/74(2022.01) (54)发明名称 一种SQL语句处理方法、 装置、 设备及存储介 质 (57)摘要 本发明公开了一种SQL语句处理方法、 装置、 设备及存储介质。 本发明实施例涉及自然语言处 理领域, 该方法包括: 获取待检测SQL语句 、 N个历 史SQL语句集合以及2N个模型, 其中, N为大于或 者等于2的正整数; 根据待检测SQL语句 、 N个历史 SQL语句集合以及2N个模型确定目标SQL语句集 合, 其中, 所述目标SQL语句集合包 括: 历史SQL语 句集合中与所述待检测SQL语句的相似度数值排 序前M的第一历史SQL语句, M为大于或者等于3的 正整数; 获取目标SQL语句集合中相似度最高的 目标SQL语句, 并显示所述目标SQL语句。 通过本 发明的技术方案, 能够实现在运行SQL语句建立 数据项之前对SQL语句的相似度检测, 可以快速 且准确的找出相似的SQL语句, 保证了数据项建 立的唯一 性。 权利要求书2页 说明书18页 附图2页 CN 113986950 A 2022.01.28 CN 113986950 A 1.一种SQ L语句处理方法, 其特 征在于, 包括: 获取待检测SQL语句、 N个历史SQL语句集合以及2N个模型, 其中, N为大于或者等于2的 正整数; 根据待检测SQL语句、 N个历史SQL语句集合以及2N个模型确定目标SQL语句集合, 其 中, 所述目标SQL语句集合包括: 历史SQL语句集合中与所述待检测SQL语句的相 似度数值排序 前M的第一历史SQ L语句, M为大于或者 等于3的正整数; 获取目标SQ L语句集合中相似度最高的目标SQ L语句, 并显示所述目标SQ L语句。 2.根据权利要求1所述的方法, 其特征在于, 在获取目标SQL语句集合中相似度最高的 目标SQL语句, 并显示所述目标SQ L语句之后, 还 包括: 若接收到用户输入的存 储指令, 则将所述待检测SQ L语句存储至数据库。 3.根据权利要求1所述的方法, 其特 征在于, 获取N个历史SQ L语句集合包括: 获取历史SQ L语句; 根据所述历史SQ L语句创建第一SQ L语句集合; 根据SQL语句关键词对所述第一SQL语句集合中的SQL语句进行分类, 得到N个历史SQL 语句集合。 4.根据权利 要求3所述的方法, 其特征在于, 根据所述历史SQL语句创建第一SQL语句集 合, 包括: 将首条历史SQ L语句存储至第一SQ L语句集合; 将与所述第一SQL语句集合中的SQL语句不同的非首条历史SQL语句存储至所述第一 SQL语句集合。 5.根据权利 要求3所述的方法, 其特征在于, 根据SQL语句关键词对所述第一SQL语句集 合中的SQ L语句进行分类, 得到N个历史SQ L语句集合, 包括: 若所述第一SQL语句集合中的第一SQL语句中第一SQL语句关键词出现的次数大于其他 SQL语句关键词出现 的次数, 则将所述第一SQL语句添加至所述第一SQL语句关键词对应的 第一历史SQ L语句集合中; 若所述第一SQL语句集合中的第一SQL语句中第一SQL语句关键词出现的次数等于其他 SQL语句关键词出现 的次数, 则将所述第一SQL语句随机添加 至所述第一SQL语句关键词对 应的第一历史SQ L语句集合或者所述 其他SQL语句关键词对应的第二历史SQ L语句集合; 若所述第一SQL语句中不存在SQL语句关键词对, 则将第一SQL语句添加至第三历史SQL 语句集合中, 其中, 所述第一历史SQL语句集合、 第二历史SQL语句集合和第三历史SQL语句 集合为不同的集 合。 6.根据权利要求1所述的方法, 其特征在于, 获取目标SQL语句集合中相似度最高的目 标SQL语句, 并显示所述目标SQ L语句, 包括: 获取每个目标SQ L语句集合中相似度最高的目标SQ L语句; 若任一目标SQL语句的相似度 大于相似度阈值, 则生成重复提示信息, 并显示所述目标 SQL语句和所述重复提 示信息。 7.根据权利 要求3所述的方法, 其特征在于, 在根据SQL语句关键词对所述第一SQL语句 集合中的SQ L语句进行分类, 得到N个历史SQ L语句集合之前, 还 包括: 基于正则表达式剔除所述SQ L语句中的注释信息;权 利 要 求 书 1/2 页 2 CN 113986950 A 2和/或; 若构成所述第一SQL语句集合中SQL语句的目标单词的长度大于长度阈值, 则将所述目 标单词转换为目标 标识, 其中, 所述目标 单词非SQ L语句关键词, 且非数字 。 8.根据权利要求7 所述的方法, 其特 征在于, 将所述目标 单词转换为目标 标识, 包括: 将所述目标 单词进行二进制转换, 得到二进制数; 根据所述 二进制数和预设标识符确定目标 标识。 9.根据权利 要求3所述的方法, 其特征在于, 所述N个历史SQL语句集合包括: 历史SQL操 作语句集合、 历史SQL定义语句集合、 历史SQL控制语句集合、 历史SQL嵌入语句集合以及历 史SQL剩余语句集 合。 10.根据权利要求1所述的方法, 其特征在于, 根据待检测SQL语句、 N个历史SQL语句集 合以及2N个模型确定目标SQ L语句集合, 包括: 若所述待检测 SQL语句中第一SQL语句关键词出现的次数大于其他SQL语句关键词出现 的次数, 则将所述第一SQL语句关键词对应的第一历史SQL语句集合中与所述待检测SQL语 句的相似度数值 排序前M的历史SQ L语句确定为目标SQ L语句集合。 11.一种SQ L语句处理装置, 其特 征在于, 包括: 获取模块, 用于获取待检测SQL语句、 N个历史SQL语句集合以及2N个模型, 其中, N为大 于或者等于2的正整数; 确定模块, 用于根据待检测SQL语句、 N个历史SQL语句集合以及2N个模型确定目标SQL 语句集合, 其中, 所述目标SQL语句集合包括: 历史SQL语句集合中与所述待检测SQL语句的 相似度数值 排序前M的第一历史SQ L语句, M为大于或者 等于3的正整数; 显示模块, 用于获取目标SQL语句集合中相似度最高的目标SQL语句, 并显示所述目标 SQL语句。 12.根据权利要求1 1所述的装置, 其特 征在于, 还 包括: 存储模块, 用于在获取目标SQL语句集合中相似度最高的目标SQL语句, 并显示所述目 标SQL语句之后, 若接收到用户输入的存 储指令, 则将所述待检测SQ L语句存储至数据库。 13.根据权利要求1 1所述的装置, 其特 征在于, 获取模块包括: 第一获取 单元, 用于获取历史SQ L语句; 创建单元, 用于根据所述历史SQ L语句创建第一SQ L语句集合; 分类单元, 用于根据SQL语句关键词对所述第一SQL语句集合 中的SQL语句进行分类, 得 到N个历史SQ L语句集合。 14.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储器, 用于存 储一个或多个程序; 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述处理器实现如权利 要求1‑10中任一所述的方法。 15.一种包含计算机程序的计算机可读存储介质, 其上存储有计算机程序, 其特征在 于, 该程序被一个或多个处 理器执行时实现如权利要求1 ‑10中任一所述的方法。权 利 要 求 书 2/2 页 3 CN 113986950 A 3

.PDF文档 专利 一种SQL语句处理方法、装置、设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种SQL语句处理方法、装置、设备及存储介质 第 1 页 专利 一种SQL语句处理方法、装置、设备及存储介质 第 2 页 专利 一种SQL语句处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 18:58:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。