专利 一种基于深度学习的自动对焦方法及系统

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210674506.5 (22)申请日 2022.06.15 (65)同一申请的已公布的文献号申请公布号 CN 114760419 A (43)申请公布日 2022.07.15 (73)专利权人深圳深知未来智能有限公司地址 518000 广东省深圳市宝安区新安街道灵芝园社区22区勤诚达乐园13号楼 2310 (72)发明人许心文　黄政林　郭奇锋　 (74)专利代理机构深圳市徽正知识产权代理有限公司 4 4405 专利代理师卢杏艳 (51)Int.Cl. H04N 5/232(2006.01) G06N 20/00(2019.01)(56)对比文件 CN 111798414 A,2020.10.20 CN 113706590 A,2021.1 1.26 CN 111083365 A,2020.04.28 CN 112433339 A,2021.0 3.02 WO 2021197357 A1,2021.10.07 CN 113747041 A,2021.12.0 3 CN 109698901 A,2019.04.3 0 CN 104820 328 A,2015.08.0 5 CN 110531484 A,2019.12.0 3 CN 109714519 A,2019.0 5.03 US 2018284574 A1,2018.10.04 US 2011002680 A1,201 1.01.06 朱倩等.基于图像分析的数码相机对焦技术研究. 《江苏大学学报(自然科学版)》 .20 03,(第 04期), 审查员李芳 (54)发明名称一种基于深度学习的自动对焦方法及系统 (57)摘要本发明公开了一种基于深度学习的自动对焦方法及系统，方法包括：获取摄像头拍摄的离焦图像，根据训练好的目标深度学习模型计算所述离焦图像的清晰度；获取电机步数范围，根据所述清晰度与电机步数范围，得到电机的移动步数，所述电机用于驱动摄像头移动；控制电机根据所述移动步数进行第一次移动；控制电机在预定的步数范围内进行第二次移动，获取所述第二次移动过程图像的清晰度最高时对应的目标位置，控制电机移动至所述目标位置，完成自动对焦。本发明实施例可利用网络的预测值快速地使电机移动到准焦位置，极大地提高了自动对焦的速度；减小了电机搜寻的范围，在极暗和多灯光场景均表现除了良好的对焦效果，提升了对焦效率。权利要求书3页说明书9页附图1页 CN 114760419 B 2022.09.20 CN 114760419 B 1.一种基于深度学习的自动对焦方法，其特征在于，包括：获取摄像头拍摄的离焦图像，根据训练好的目标深度学习模型计算所述离焦图像的清晰度；获取电机步数范围，所述电机用于驱动摄像头移动，根据所述清晰度与电机步数范围，得到电机的移动步数，具体包括以下步骤：从电机驱动获得当前场景当前焦段有效的电机步数范围，记作其中最小电机位置为 step_min,最大电机位置为step_max；获取当前电机位置的图片cur_rgb，经过数据预处理后记作cur_gray，送入训练好的目标深度学习模型预测得清晰度值为F_pred；获取当前电机位置记作cur_step；根据F_pred推算电机需要移动到的位置step_pos，其公式如下： step_pos＝cur_step+(1 ‑F_pred)*(step_max ‑step_min) 将电机移动到step_pos位置，然后用传统对焦算法在step_pos左右两侧小范围搜寻清晰度最高的准焦位置；控制电机根据所述移动步数进行第一次移动；控制电机在预定的步数范围内进行第二次移动，获取所述第二次移动过程图像的清晰度最高时对应的目标位置，控制电机移动至所述目标位置，完成自动对焦。 2.根据权利要求1所述的基于深度学习的自动对焦方法，其特征在于，所述获取摄像头拍摄的离焦图像，根据训练好的目标深度学习模型计算所述离焦图像的清晰度前，包括：预先构建初始深度学习模型；预先获取用于训练初始深度学习模型的训练样本及监督有效值；根据训练样本、监督有效值对所述初始深度学习模型进行训练，生成训练好的目标深度学习模型。 3.根据权利要求2所述的基于深度学习的自动对焦方法，其特征在于，所述预先获取用于训练初始深度学习模型的训练样本及监督有效值，包括：预先采集摄像头不同场景、所有焦段且在电机有效步数范围内的所有图片；对所有图片进行颜色空间转换,生成灰度图像；获取灰度图像中图像均匀区域的每个像素的梯度值，对梯度值进行直方图统计，得到梯度阈值；任意选取图像中的一对焦窗口，根据一像素框构建一图像块，计算所述图像块对应的梯度；根据所述像素框遍历所述对焦窗口，得到若干个图像块对应的梯度值；对所述若干个图像块对应的梯度值中小于梯度阈值的梯度值进行剔除；将保留的梯度值进行求和，得到选取图像的最终评价值；对同一焦段不同场景的所有图像计算最终评价值，选取不同场景的最终评价值的最大值和最小值；对最终评价值的最大值和最小值进行归一化处理后，生成监督有效值。 4.根据权利要求3所述的基于深度学习的自动对焦方法，其特征在于，所述根据训练样本、监督有效值对所述初始深度学习模型进行训练，生成训练好的目标深度学习模型，包括：权　利　要　求　书 1/3 页 2 CN 114760419 B 2将所述灰度图像进行数据增强后，生成训练样本；将所述训练样本输入初始深度学习模型，输出训练样本对应的输出评价值；根据输出评价值与所述监督有效值计算对应的损失函数；根据损失函数更新初始深度学习模型的网络参数，重复上述过程，直至生成训练好的目标深度学习模型。 5.一种基于深度学习的自动对焦系统，其特征在于，所述系统包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现以下步骤：获取摄像头拍摄的离焦图像，根据训练好的目标深度学习模型计算所述离焦图像的清晰度；获取电机步数范围，所述电机用于驱动摄像头移动，根据所述清晰度与电机步数范围，得到电机的移动步数，具体包括以下步骤：从电机驱动获得当前场景当前焦段有效的电机步数范围，记作其中最小电机位置为 step_min,最大电机位置为step_max；获取当前电机位置的图片cur_rgb，经过数据预处理后记作cur_gray，送入训练好的目标深度学习模型预测得清晰度值为F_pred；获取当前电机位置记作cur_step；根据F_pred推算电机需要移动到的位置step_pos，其公式如下： step_pos＝cur_step+(1 ‑F_pred)*(step_max ‑step_min) 将电机移动到step_pos位置，然后用传统对焦算法在step_pos左右两侧小范围搜寻清晰度最高的准焦位置；控制电机根据所述移动步数进行第一次移动；控制电机在预定的步数范围内进行第二次移动，获取所述第二次移动过程图像的清晰度最高时对应的目标位置，控制电机移动至所述目标位置，完成自动对焦。 6.根据权利要求5所述的基于深度学习的自动对焦系统，其特征在于，所述计算机程序被所述处理器执行时还实现以下步骤：预先构建初始深度学习模型；预先获取用于训练初始深度学习模型的训练样本及监督有效值；根据训练样本、监督有效值对所述初始深度学习模型进行训练，生成训练好的目标深度学习模型。 7.根据权利要求6所述的基于深度学习的自动对焦系统，其特征在于，所述计算机程序被所述处理器执行时还实现以下步骤：预先采集摄像头不同场景、所有焦段且在电机有效步数范围内的所有图片；对所有图片进行颜色空间转换,生成灰度图像；获取灰度图像中图像均匀区域的每个像素的梯度值，对梯度值进行直方图统计，得到梯度阈值；任意选取图像中的一对焦窗口，根据一像素框构建一图像块，计算所述图像块对应的梯度；根据所述像素框遍历所述对焦窗口，得到若干个图像块对应的梯度值；对所述若干个图像块对应的梯度值中小于梯度阈值的梯度值进行剔除；权　利　要　求　书 2/3 页 3 CN 114760419 B 3

专利 一种基于深度学习的自动对焦方法及系统

专利一种基于深度学习的自动对焦方法及系统