(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210674506.5
(22)申请日 2022.06.15
(65)同一申请的已公布的文献号
申请公布号 CN 114760419 A
(43)申请公布日 2022.07.15
(73)专利权人 深圳深知未来智能有限公司
地址 518000 广东省深圳市宝安区新 安街
道灵芝园社区22区勤诚达乐园13号楼
2310
(72)发明人 许心文 黄政林 郭奇锋
(74)专利代理 机构 深圳市徽正知识产权代理有
限公司 4 4405
专利代理师 卢杏艳
(51)Int.Cl.
H04N 5/232(2006.01)
G06N 20/00(2019.01)(56)对比文件
CN 111798414 A,2020.10.20
CN 113706590 A,2021.1 1.26
CN 111083365 A,2020.04.28
CN 112433339 A,2021.0 3.02
WO 2021197357 A1,2021.10.07
CN 113747041 A,2021.12.0 3
CN 109698901 A,2019.04.3 0
CN 104820 328 A,2015.08.0 5
CN 110531484 A,2019.12.0 3
CN 109714519 A,2019.0 5.03
US 2018284574 A1,2018.10.04
US 2011002680 A1,201 1.01.06
朱倩等.基 于图像分析的数码相机对焦技 术
研究. 《江苏 大学学报(自然科 学版)》 .20 03,(第
04期),
审查员 李芳
(54)发明名称
一种基于深度学习的自动对焦方法及系统
(57)摘要
本发明公开了一种基于深度学习的自动对
焦方法及系统, 方法包括: 获取摄像头拍摄的离
焦图像, 根据训练好的目标深度学习模型计算所
述离焦图像的清晰度; 获取电机步数范围, 根据
所述清晰度与电机步数范围, 得到电机的移动步
数, 所述电机用于驱动摄像头移动; 控制电机根
据所述移动步数进行第一次移动; 控制电机在预
定的步数范围内进行第二次移动, 获取所述第二
次移动过程图像的清晰度最高时对应的目标位
置, 控制电机移动至所述目标位置, 完成自动对
焦。 本发明实施例可利用网络的预测值快速地使
电机移动到准焦位置, 极大地提高了自动对焦的
速度; 减小了电机搜寻的范围, 在极暗和多灯光
场景均表现除了良好的对焦效果, 提升了对焦效
率。
权利要求书3页 说明书9页 附图1页
CN 114760419 B
2022.09.20
CN 114760419 B
1.一种基于深度学习的自动对焦方法, 其特 征在于, 包括:
获取摄像头拍摄的离焦图像, 根据训练好的目标深度学习 模型计算所述离焦图像的清
晰度;
获取电机步数范围, 所述电机用于驱动摄像头移动, 根据所述清晰度与电机步数范围,
得到电机的移动步数, 具体包括以下步骤:
从电机驱动获得当前场景当前焦段有效的电机步数范围, 记作其中最小电机位置为
step_min,最大电机位置为step_max; 获取当前电机位置的图片cur_rgb, 经过数据预处理
后记作cur_gray, 送入训练好的目标深度学习模型 预测得清晰度值 为F_pred;
获取当前电机位置记作cur_step;
根据F_pred推算电机需要移动到的位置step_pos, 其公式如下:
step_pos=cur_step+(1 ‑F_pred)*(step_max ‑step_min)
将电机移动到step_pos位置, 然后用传统对焦算法在step_pos左右两侧小范围搜寻清
晰度最高的准焦位置;
控制电机根据所述移动步数进行第一次移动;
控制电机在预定的步数范围内进行第 二次移动, 获取所述第 二次移动过程图像的清晰
度最高时对应的目标位置, 控制电机移动至所述目标位置, 完成自动对焦。
2.根据权利要求1所述的基于深度学习的自动对焦方法, 其特征在于, 所述获取摄像头
拍摄的离焦图像, 根据训练好的目标深度学习模型计算所述离焦图像的清晰度前, 包括:
预先构建初始深度学习模型;
预先获取用于训练初始深度学习模型的训练样本及监 督有效值;
根据训练样本、 监督有效值对所述初始深度学习模型进行训练, 生成训练好的目标深
度学习模型。
3.根据权利要求2所述的基于深度学习的自动对焦方法, 其特征在于, 所述预先获取用
于训练初始深度学习模型的训练样本及监 督有效值, 包括:
预先采集摄 像头不同场景、 所有焦段且在电机有效步数 范围内的所有图片;
对所有图片进行颜色空间转换,生成灰度图像;
获取灰度图像中图像均匀区域的每个像素的梯度值, 对梯度值进行直方图统计, 得到
梯度阈值;
任意选取图像中的一对焦窗口, 根据一像素框构建一图像块, 计算所述图像块对应的
梯度;
根据所述像素框遍历所述对焦窗口, 得到若干个图像块对应的梯度值;
对所述若干个图像块对应的梯度值中小于梯度阈值的梯度值进行剔除;
将保留的梯度值进行求和, 得到 选取图像的最终评价 值;
对同一焦段不同场景的所有图像计算最终评价值, 选取不同场景的最终评价值的最大
值和最小值;
对最终评价 值的最大值和最小值进行归一 化处理后, 生成监 督有效值。
4.根据权利要求3所述的基于深度学习的自动对焦方法, 其特征在于, 所述根据训练样
本、 监督有效值对所述初始深度学习模型进行训练, 生成训练好的目标深度学习模型, 包
括:权 利 要 求 书 1/3 页
2
CN 114760419 B
2将所述灰度图像进行 数据增强后, 生成训练样本;
将所述训练样本 输入初始深度学习模型, 输出训练样本对应的输出评价 值;
根据输出评价 值与所述 监督有效值计算对应的损失函数;
根据损失函数更新初始深度学习模型的网络参数, 重复上述过程, 直至生成训练好的
目标深度学习模型。
5.一种基于深度学习的自动对焦系统, 其特征在于, 所述系统包括: 存储器、 处理器及
存储在所述存储器上并可在所述处理器上运行的计算机程序, 所述计算机程序被所述处理
器执行时实现以下步骤:
获取摄像头拍摄的离焦图像, 根据训练好的目标深度学习 模型计算所述离焦图像的清
晰度;
获取电机步数范围, 所述电机用于驱动摄像头移动, 根据所述清晰度与电机步数范围,
得到电机的移动步数, 具体包括以下步骤:
从电机驱动获得当前场景当前焦段有效的电机步数范围, 记作其中最小电机位置为
step_min,最大电机位置为step_max; 获取当前电机位置的图片cur_rgb, 经过数据预处理
后记作cur_gray, 送入训练好的目标深度学习模型 预测得清晰度值 为F_pred;
获取当前电机位置记作cur_step;
根据F_pred推算电机需要移动到的位置step_pos, 其公式如下:
step_pos=cur_step+(1 ‑F_pred)*(step_max ‑step_min)
将电机移动到step_pos位置, 然后用传统对焦算法在step_pos左右两侧小范围搜寻清
晰度最高的准焦位置;
控制电机根据所述移动步数进行第一次移动;
控制电机在预定的步数范围内进行第 二次移动, 获取所述第 二次移动过程图像的清晰
度最高时对应的目标位置, 控制电机移动至所述目标位置, 完成自动对焦。
6.根据权利要求5所述的基于深度学习的自动对焦系统, 其特征在于, 所述计算机程序
被所述处 理器执行时还实现以下步骤:
预先构建初始深度学习模型;
预先获取用于训练初始深度学习模型的训练样本及监 督有效值;
根据训练样本、 监督有效值对所述初始深度学习模型进行训练, 生成训练好的目标深
度学习模型。
7.根据权利要求6所述的基于深度学习的自动对焦系统, 其特征在于, 所述计算机程序
被所述处 理器执行时还实现以下步骤:
预先采集摄 像头不同场景、 所有焦段且在电机有效步数 范围内的所有图片;
对所有图片进行颜色空间转换,生成灰度图像;
获取灰度图像中图像均匀区域的每个像素的梯度值, 对梯度值进行直方图统计, 得到
梯度阈值;
任意选取图像中的一对焦窗口, 根据一像素框构建一图像块, 计算所述图像块对应的
梯度;
根据所述像素框遍历所述对焦窗口, 得到若干个图像块对应的梯度值;
对所述若干个图像块对应的梯度值中小于梯度阈值的梯度值进行剔除;权 利 要 求 书 2/3 页
3
CN 114760419 B
3
专利 一种基于深度学习的自动对焦方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:50:58上传分享