行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210445233.7 (22)申请日 2022.04.26 (71)申请人 辽宁科技大 学 地址 114051 辽宁省鞍山市高新区千山路 185号 (72)发明人 巩荣芬 刘淑明 储茂祥 刘历铭  焦玉鹏  (74)专利代理 机构 鞍山嘉讯科技专利事务所 (普通合伙) 21224 专利代理师 张群 (51)Int.Cl. G06V 40/20(2022.01) G06V 10/764(2022.01) G06K 9/62(2022.01) G06V 10/44(2022.01)G06V 30/18(2022.01) G06F 3/01(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/82(2022.01) (54)发明名称 一种空中书 写文本输入方法及装置 (57)摘要 本发明提供一种空中书写文本输入方法及 装置, 使用手持的书写棒在空中书写文字, 利用 具有显示屏与摄像头的嵌入式平台装置采集并 显示书写过程, 通过目标跟踪、 文本识别等方法 实现包含数字、 符号和英文三种文字类型的文本 输入, 以满足无接触、 便捷的人机交互。 包括: 初 始化空中书写文本输入系统; 手持书写棒进入摄 像头监视的空中区域并移动书写棒到跟踪框中; 利用目标跟踪模 型跟踪书写棒, 确定当前跟踪框 的位置; 判断是否切换输入文字类型; 利用书写 棒在空中书写文字, 并生成文字图像; 利用文字 识别模型识别文字图像识别出文字; 增加文字显 示; 判断是否清除增加显示的文字; 清除增加显 示的文字; 判断文本中所有文字的输入是否结 束。 权利要求书3页 说明书12页 附图7页 CN 114821782 A 2022.07.29 CN 114821782 A 1.一种空中书 写文本输入方法, 其特 征在于, 包括如下步骤: 步骤1: 初始化空中书 写文本输入系统; 步骤2: 手持书 写棒进入摄 像头监视的空中区域, 并移动书 写棒到跟踪框中; 步骤3: 利用目标跟踪模型跟踪 书写棒, 确定当前跟踪框的位置; 步骤4: 判断是否切换输入文字类型, 如果是则转到步骤5, 如果否则转到步骤6; 步骤5: 切换输入文字类型; 步骤6: 利用书 写棒在空中书 写文字, 并生成文字图像; 步骤7: 利用文字识别模型识别文字图像, 识别出文字; 步骤8: 增 加文字显示; 步骤9: 判断是否清除增 加显示的文字, 如果是则转到步骤10, 如果否则转到步骤1 1; 步骤10: 清除增 加显示的文字; 步骤11: 判断文本中所有 文字的输入是否结束, 如果是则结束, 如果否则转到步骤4。 2.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤1中, 初 始化空中书 写文本输入系统包括 步骤如下: 步骤1‑1: 初始化显示屏上的操作窗和跟踪框; 步骤1‑2: 初始化输入文字类型; 步骤1‑3: 加载与输入文字类型相匹配的文字识别模型参数; 步骤1‑4: 加载目标跟踪模型参数。 3.根据权利要求2所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤1 ‑3中, 文字识别模型采用新设计的网络, 具体包括如下: 文字识别模型包括文字图像、 特征提取网络、 分类网络和输出类别, 文字图像是模型的 输入, 文字图像包含待识别的完整图和二值图, 特征提取网络提取文字图像的深度特征, 特 征提取网络包括卷积层、 Bi ‑CNN层、 平均池化层、 Bi ‑CNN层和平均池化层, 卷积层对文字图 像完整图和二值图分别进 行通道扩充, Bi ‑CNN层由并行的常规卷积和空洞卷积后接通道 拼 接组成, 第一个Bi ‑CNN层对文字图像二值图的通道特征图进行常规卷积, 第一个Bi ‑CNN层 对文字图像完整图的通道扩充图进 行空洞卷积, 第一个Bi ‑CNN层对常规卷积和空洞卷积后 的两个特征图进 行通道拼接, 第二个Bi ‑CNN层对上一层的特征图分别进 行常规卷积和空洞 卷积, 第二个Bi ‑CNN层对常规卷积和空洞 卷积后的两个特征图进行通道拼接, 两个平均池 化层都对通道拼接后的特征图进行尺寸压缩, 分类网络用于文字的分类识别, 分类网络由 两个全连接层组成, 输出类别是文字图像识别的结果; 当输入文字类型 是数字时, 文字识别模型的输出类别是0 ‑9, 类别数目是10; 当输入文字类型 是符号时, 文字识别模型的输出类别是常用的符号, 类别数 是38; 当输入文字类型是英文时, 文字识别模型的输出类别是大写和小写的英文字符, 类别 数是52; 文字识别模型采用新的双图并行输入网络结构, 文字识别模型识别的是数字、 符号和 英文三种类型的书写体文字, 文字识别模型融合文字图像完整图的全局特征和文字图像二 值图的局部特 征, 文字识别模型降低背景信息对特 征提取网络的影响。 4.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤3 中, 利 用目标跟踪模型跟踪 书写棒包括 步骤如下:权 利 要 求 书 1/3 页 2 CN 114821782 A 2步骤3‑1: 读取书 写棒模板图像; 步骤3‑2: 根据跟踪框的位置提取书 写棒搜索图像; 步骤3‑3: 调用目标跟踪模型SiamFC 网络, 计算书写棒的模板图像与搜索图像之间 的响 应图; 步骤3‑4: 根据书 写棒响应图确定当前跟踪框的位置 。 5.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤4中, 判 断是否切换文字类型的过程如下: 根据当前跟踪框的位置, 判断书写棒是否处于操作窗类型区的位置, 如果是则需要切 换输入文字类型, 如果否则不需要切换输入文字类型。 6.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤5 中, 切 换输入文字类型的过程如下: 根据当前跟踪框的位置, 确定书 写棒位于数字、 符号和英文三个子区中的一个; 设定新的输入文字为此子区的类型; 加载与新的输入文字类型相匹配的文字识别模型参数。 7.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤6 中, 空 中书写文字并生成文字图像包括 步骤如下: 步骤6‑1: 备份跟踪框的位置; 步骤6‑2: 在操作窗书 写区对应的空中区域, 移动书 写棒; 步骤6‑3: 调用目标跟踪模型SiamFC 网络, 确定当前跟踪框相对于备份跟踪框移动的轨 迹; 步骤6‑4: 在操作窗书 写区直接绘制出跟踪框移动的轨 迹; 步骤6‑5: 重复上述 步骤, 绘制书 写过程跟踪框全部的移动轨 迹; 步骤6‑6: 手指遮挡书 写棒; 步骤6‑7: 提取当前目标跟踪模型SiamFC 网络中的响应图最大值, 当响应图最大值小于 阈值时结束 文字书写操作; 步骤6‑8: 提取操作窗书 写区绘制的轨 迹, 生成文字图像, 包括完整图和二 值图。 8.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤9判断 是否清除增 加显示的文字的过程如下: 调用目标跟踪模型SiamFC网络, 确定当前跟踪框的位置; 根据当前跟踪框的位置, 判断书写棒是否处于操作窗执行区的清除子区, 如果是则需 要清除增 加显示的文字, 如果否则不需要清除。 9.根据权利要求1所述的一种空中书写文本输入方法, 其特征在于, 所述的步骤11判断 文本中所有 文字的输入是否结束的过程如下: 调用目标跟踪模型SiamFC网络, 确定当前跟踪框的位置; 根据当前跟踪框的位置, 判断书写棒是否处于操作窗执行区的结束子区, 如果是则结 束文本输入, 如果否则可以继续文本 输入。 10.一种应用权利要求1所述的一种空中书写文本输入方法的空中书写文本输入装置, 包括如下模块: 摄像头模块: 用于实时采集书 写棒在空中的书 写、 操作视频;权 利 要 求 书 2/3 页 3 CN 114821782 A 3

PDF文档 专利 一种空中书写文本输入方法及装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种空中书写文本输入方法及装置 第 1 页 专利 一种空中书写文本输入方法及装置 第 2 页 专利 一种空中书写文本输入方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。