行业标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210800957.9 (22)申请日 2022.07.08 (65)同一申请的已公布的文献号 申请公布号 CN 114862858 A (43)申请公布日 2022.08.05 (73)专利权人 湖北省烟草科学研究院 地址 430030 湖北省武汉市硚口区宝丰二 路6号香溢大酒店 (72)发明人 杨春雷 孙光伟 杨锦鹏 余君  饶雄飞 裴文灿 刘小伟 刘竞  黄金国  (74)专利代理 机构 南京纵横知识产权代理有限 公司 32224 专利代理师 徐瑛(51)Int.Cl. G06T 7/00(2017.01) G06T 5/00(2006.01) G06V 10/30(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) G06N 20/20(2019.01) 审查员 司马成 (54)发明名称 基于集成学习的雪茄烟采收成熟度识别方 法及系统 (57)摘要 本发明公开一种基于集成学习的雪茄烟采 收成熟度识别方法及系统, 方法包括: 获取待测 雪茄烟图像, 并对待测雪茄烟图像进行预处理; 对预处理后的待测雪茄烟图像进行矢量化降维, 并提取RGB、 HSV特征值, 得到特征集合; 利用 Wrapper包装算法对特征集合中的数据进行特征 降维, 得到待测雪茄烟图像的初始数据集; 将初 始数据集输入训练好的随机森 林模型中, 输出雪 茄烟图像的成熟度识别结果。 本发 明对雪茄烟图 像数据进行矢量化降维, 保障雪茄烟图像数据信 息的高效提取和利用; 同时利用集成学习的优 势, 将烟叶纹理、 颜色作为成熟度等级识别模型 的输入特征, 解决数据价值受损的问题; 利用 Wrapper包装算法在实现特征选择的同时进行特 征降维, 降低模型的训练成本 。 权利要求书2页 说明书9页 附图6页 CN 114862858 B 2022.11.11 CN 114862858 B 1.基于集成学习的雪茄烟采收成熟度识别方法, 其特 征在于, 包括: 获取待测雪茄烟图像, 并对所述待测雪茄烟图像进行预处理; 对雪茄烟图像进行预处 理包括: 使用非局部平均去 噪算法对雪茄烟图像进行去 噪; 接着使用暗通道去雾算法对去 噪后的雪茄烟图像进 行去雾; 最后使用图像色彩校正算法对去雾后的雪茄烟图像进行色彩 校正; 对预处理后的待测雪茄烟图像进行矢量化降维, 并提取RGB、 HSV特征值, 得到特征集 合; 对预处理后的待测雪茄烟图像进 行矢量化降维, 进一步包括: 提取雪茄烟图像中上万个 像素点的颜色特征值, 得到数据为[图长, 图宽, 颜色特征值通道数]的矩阵, 将数据矢量化 为[图长*图宽, 颜色特征值通道数]的矩阵, 得到聚类前的图像数据; 将聚类前的图像数据 导入K‑Means算法, 选取聚类数量R, 聚类得到图像数据中的R种颜色特征值; 用R种类的质心 处像素点的颜色特 征值替代当前类下 所有像素点的颜色特 征值; 利用Wrapper包装算法对特征集合中的数据进行特征降维, 得到待测雪茄烟图像的初 始数据集; 特征降维包括: 数据无量纲化; 利用Wrapper包装算法的特征选择和算法训练同 时进行的特点, 依靠识别模型自身学习需求进行特征选择, 从当前 的一组特征中修剪最不 重要的特征, 在修剪的特征集合上递归地重复特征选择和 算法训练同时进行 的过程, 直到 最终到达所需数量的要选择的特 征子集; 将初始数据集输入训练好的随机森林模型中, 输出所述雪茄烟图像的成熟度识别结 果。 2.根据权利要求1所述基于集成学习的雪茄烟采收成熟度识别方法, 其特征在于, 将初 始数据集输入训练好的随机森林模型中, 输出所述雪茄烟图像的成熟度识别结果, 之前还 包括: 获取大量雪茄烟图像样本, 并对所述雪茄烟图像样本进行 预处理; 对预处理后的待测雪茄烟图像进行矢量化降维, 并提取RGB、 HSV特征值, 得到特征集 合; 对特征集合中的数据进行雪茄烟成熟度等级编码; 对特征集合中的所有样本数据进行无量纲化操作, 并利用Wrapper包装算法对所有样 本数据进行 特征降维, 得到所有样本的初始数据集; 根据Bagging集成法, 将初始数据集作 为模型输入, 将雪茄烟成熟度 等级编码作 为模型 识别标签, 使用随机森林算法对初始数据集进行建模, 构建随机森林模型; 将初始数据集中的特征集合和对应的雪茄烟成熟度等级编码按照预设的比例划分为 训练集数据和 测试集数据; 输入训练集数据对构建的随机森林模型进行训练, 得到训练好的随机森林模型。 3.根据权利要求1或2所述基于集成学习的雪茄烟采收成熟度识别方法, 其特征在于, 在进行雪茄烟成熟度等级编 码或进行无量纲 化操作之前, 对特征集合中的数据进 行数据清 洗, 包括对特 征集合中的数据进行缺失值和异常值处 理。 4.根据权利要求2所述基于集成学习的雪茄烟采收成熟度识别方法, 其特征在于, 所述 方法进一 步包括: 将决策树模型作为基评估器, 构建多个相互独立的基评估器, 并对多个基评估器按照 Bagging原则进行集成, 得到随机森林模型;权 利 要 求 书 1/2 页 2 CN 114862858 B 2将多个基评估器的识别结果通过平均或者多数表决原则来决定随机森林模型的识别 结果, 得到强评估器, 用于对雪茄烟成熟度等级的识别。 5.基于集成学习的雪茄烟采收成熟度识别系统, 其特 征在于, 包括: 采集模块, 用于获取雪茄烟图像; 预处理模块, 用于对雪茄烟图像进行预处理; 所述预处理模块进一步包括: 去噪模块, 用于使用非局部平均去 噪算法对雪茄烟图像进行去 噪; 去雾模块, 用于使用暗通道去雾算 法对去噪后的雪茄烟图像进行去雾; 校正模块, 用于使用图像色彩校正算法对去雾后的雪 茄烟图像进行色彩校正; 矢量化降维模块, 用于对预处理后的雪茄烟图像进行矢量化降维, 并提取RGB、 HSV特征 值, 得到特征集合; 所述矢量化降维模块进一步包括: 数据提取模块, 用于提取雪茄烟图像 中上万个像素点的颜色特征值, 得到数据为[图长, 图宽, 颜色特征值通道数]的矩阵, 将数 据矢量化为[图长*图宽, 颜色特征值通道数]的矩阵, 得到聚类前的图像数据; 聚类模块, 用 于将聚类前的图像数据导入 K‑Means算法, 选取聚类数量 R, 聚类得到图像数据中的R种颜色 特征值信息; 降维模块, 用于用R种类的质心处像素点的颜色特征值替代当前类下所有像素 点的颜色特征值; 特征值提取模块, 用于基于降维后的数据提取RGB、 HSV特征值, 得到特征 集合; 特征降维模块, 用于对特征集合中的数据进行无量纲化操作, 并利用Wrapp er包装算法 对特征集合中的数据进 行特征降维, 得到待测雪茄烟图像的初始数据集; 特征降维包括: 数 据无量纲 化; 利用Wrapper包装算法的特征选择和算法训练同时进行的特点, 依靠识别模 型 自身学习需求进行特征选择, 从当前 的一组特征中修剪最不重要的特征, 在修剪的特征集 合上递归地重复特征选择和算法训练同时进 行的过程, 直到最终到达所需数量的要选择的 特征子集; 模型识别模块, 用于将初始数据集输入训练好的随机森林模型中, 输出所述雪茄烟图 像的成熟度识别结果。 6.根据权利要求5所述基于集成学习的雪茄烟采收成熟度识别系统, 其特征在于, 所述 系统还包括: 随机森林模型构建模块, 用于根据Bagging集成法, 将初始数据集作为模型输 入, 将雪茄烟成熟度等级编码作为模型识别标签, 使用随机森林算法对初始数据集进行建 模, 构建随机森林模 型; 随机森林模型训练模块, 用于将初始数据集中的特征集合和对应的 雪茄烟成熟度等级编码按照预设的比例划分为训练集数据和测试集数据, 输入训练集数据 对构建的随机森林模型进行训练, 得到训练好的随机森林模型。权 利 要 求 书 2/2 页 3 CN 114862858 B 3

.PDF文档 专利 基于集成学习的雪茄烟采收成熟度识别方法及系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于集成学习的雪茄烟采收成熟度识别方法及系统 第 1 页 专利 基于集成学习的雪茄烟采收成熟度识别方法及系统 第 2 页 专利 基于集成学习的雪茄烟采收成熟度识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:58:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。