行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210882919.2 (22)申请日 2022.07.26 (71)申请人 华东师范大学 地址 200241 上海市闵行区东川路5 00号 (72)发明人 李庆利 李逸殊 林凡力 胡雨婷  (74)专利代理 机构 北京盛询知识产权代理有限 公司 11901 专利代理师 相黎超 (51)Int.Cl. G16H 50/20(2018.01) G16H 30/20(2018.01) G16H 30/40(2018.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06N 20/00(2019.01) (54)发明名称 生成包含自动标注文件的基准病理数据集 的方法及系统 (57)摘要 本发明公开了生成包含自动标注文件的基 准病理数据集的方法及系统, 包括以下步骤: 获 取病理图像, 其中所述病理图像包括: 目标图像 和高光谱图像; 对所述高光谱图像提取伪彩图; 对所述高光谱图像中的像素进行识别标注, 得到 病理数据集的标签部分; 对所述目标图像和所述 伪彩图进行聚类, 基于聚类结果对 所述目标图像 和所述伪彩图进行染色归一化处理, 得到病理数 据集的图像部分; 基于所述标签部分和所述图像 部分, 得到病理数据集。 通过以上技术方案, 本发 明能够生成了包含自动标注文件的基准病理数 据集, 缓解了计算机辅助诊断方面研究数据集紧 缺的情况。 权利要求书2页 说明书6页 附图5页 CN 115274093 A 2022.11.01 CN 115274093 A 1.一种生成包 含自动标注文件的基准病理数据集的方法, 其特 征在于, 包括以下步骤: 获取病理图像, 其中所述病理图像包括: 目标图像和高光谱图像; 对所述高光谱图像提 取伪彩图; 对所述高光谱图像中的像素进行识别标注, 得到病理数据集的标签部分; 对所述目标图像和所述伪彩图进行聚类, 基于聚类结果对所述目标图像和所述伪彩图 进行染色归一化处理, 得到病理数据集的图像部分; 基于所述标签部 分和所述图像部 分, 得 到病理数据集。 2.根据权利要求1所述的生成包含自动标注文件的基准病理数据集的方法, 其特征在 于, 得到病理数据集的标签部分的过程包括: 通过病理识别模型对所述高光谱图像中的像素进行识别标注, 得到病理数据集的标签 部分, 其中所述病理识别模型为 LightGBM模型。 3.根据权利要求2所述的生成包含自动标注文件的基准病理数据集的方法, 其特征在 于, 对所述高光谱图像中的像素进行识别标注之前还 包括: 提取所述高光谱图像的特征像素, 基于所述特征像素的通道值及标签构建病理识别模 型, 通过决策树算法对所述病理识别模 型进行训练, 直到输出的误差减小到期 望值, 得到训 练好的病理识别模型, 通过训练好的病理识别模型对所述高光谱图像中的像素进 行识别标 注。 4.根据权利要求1所述的生成包含自动标注文件的基准病理数据集的方法, 其特征在 于, 对所述目标图像和所述伪彩图进行聚类的过程包括: 基于所述目标图像和所述伪彩图中的像素值, 对所述目标图像和所述伪彩图分别进行 聚类, 得到聚类结果。 5.根据权利要求4所述的生成包含自动标注文件的基准病理数据集的方法, 其特征在 于, 得到病理数据集的图像部分的过程包括: 基于所述聚类结果, 分别计算第一亮度值和第二亮度值, 将所述第一亮度值和所述第 二亮度值进行比较, 若所述第一亮度值小于所述第二亮度值, 则将所述伪彩图中像素点的 红绿蓝三通道的值替换成所述 目标图像中像素点的红绿蓝三通道的值; 否则不替换; 基于 比较结果得到病理数据集的图像部分; 其中所述第 一亮度值为所述伪彩图中像素点的亮度值, 所述第 二亮度值为所述目标图 像中像素点亮度值。 6.一种生成包含自动标注文件的基准病理数据集的系统, 其特征在于, 包括: 病理图像 获取模块、 数据集标签获取模块及数据集图像获取模块; 所述病理图像获取模块, 用于获取病理图像, 其中所述病理图像包括: 目标图像和高光 谱图像; 对所述高光谱图像提取伪彩图; 所述数据集标签获取模块, 用于对所述高光谱图像中的像素进行识别标注, 得到病理 数据集的标签部分;权 利 要 求 书 1/2 页 2 CN 115274093 A 2所述数据集图像获取模块, 用于对所述目标图像和所述伪彩图进行聚类, 基于聚类结 果对所述目标图像和所述伪彩图进行染色归一 化处理, 得到病理数据集的图像部分。 7.根据权利要求6所述的生成包含自动标注文件的基准病理数据集的系统, 其特征在 于, 所述数据集标签获取模块包括模型构建单 元; 所述模型构建单元, 用于提取所述高光谱图像的代表性像素, 基于所述代表性像素的 通道值及标签构建病理识别模型, 通过决策树算法对所述病理识别模型进行训练, 直到输 出的误差减小到期望值, 得到训练好的病理识别模型, 其中所述病理识别模型为LightGBM 模型。 8.根据权利要求7所述的生成包含自动标注文件的基准病理数据集的系统, 其特征在 于, 所述数据集标签获取模块还 包括标签获取 单元; 所述标签获取单元, 用于通过所述训练好的病理识别模型对所述高光谱图像中的像素 进行识别标注, 得到病理数据集的标签部分。 9.根据权利要求6所述的生成包含自动标注文件的基准病理数据集的系统, 其特征在 于, 所述数据集图像获取模块包括图像处 理单元; 所述图像处理单元, 基于所述目标图像和所述伪彩图中的像素值, 对所述目标图像和 所述伪彩图分别进行聚类, 得到聚类结果。 10.根据权利要求9所述的生成包含自动标注文件的基准病理数据集的系统, 其特征在 于, 所述数据集图像获取模块还 包括亮度值比较单 元; 所述亮度值比较单元, 基于所述聚类结果, 分别计算第 一亮度值和第 二亮度值, 将所述 第一亮度值和所述第二亮度值进行比较, 若所述第一亮度值小于所述第二亮度值, 则将所 述伪彩图中像素点的红绿蓝三通道的值替换成所述目标图像中像素点的红绿蓝三通道的 值; 否则不 替换; 基于比较结果得到病理数据集的图像部分; 其中所述第 一亮度值为所述伪彩图中像素点的亮度值, 所述第 二亮度值为所述目标图 像中像素点亮度值。权 利 要 求 书 2/2 页 3 CN 115274093 A 3

.PDF文档 专利 生成包含自动标注文件的基准病理数据集的方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 生成包含自动标注文件的基准病理数据集的方法及系统 第 1 页 专利 生成包含自动标注文件的基准病理数据集的方法及系统 第 2 页 专利 生成包含自动标注文件的基准病理数据集的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。