行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210630121.9 (22)申请日 2022.06.06 (71)申请人 南通大学 地址 226019 江苏省南 通市崇川区啬园路9 号 (72)发明人 丁卫平 王海鹏 冯志豪 沈鑫杰  曹金鑫 程纯 秦廷桢 侯涛  邹志丹 高自强 薛皓文  (74)专利代理 机构 南京经纬专利商标代理有限 公司 32200 专利代理师 王毅 (51)Int.Cl. G06V 40/18(2022.01) G06V 10/762(2022.01) G16H 50/20(2018.01) (54)发明名称 一种面向大数据眼底图像的并行超像素 Spark聚类方法 (57)摘要 本发明涉及图像处理分析技术领域, 具体涉 及一种面向大数据眼底图像的并行超像素Spark 聚类方法。 步骤包括: S10、 系统首先获取用户上 传的大数据眼底图像, 将请求信息发送至诊断系 统, 并调用后台Java程序和Python代码; S20、 调 用基于Spark平台的超像 素FCM加速聚类算法, 对 眼底图像进行超像素处理; S30、 通过Spark框架 进行分布式计算, 用超像素块的均值像素颜色特 征进行编码并转化为弹性分布性数据集RDD, 将 RDD划分到各节点, 各节点进行FCM 隶属度计算后 汇总, 再分区进行聚类中心更新计算, 直至算法 收敛; S40、 输出FCM聚类的结果并保存眼底图像 聚类结果; S50、 将大量眼底图像数据同时运行结 果存储至 数据库MySQL中, 等待前端请求查看时, 将指定眼底图像聚类结果反馈 至系统用户。 权利要求书2页 说明书5页 附图2页 CN 115063877 A 2022.09.16 CN 115063877 A 1.一种面向大数据眼底图像的并行超像素Spark聚类方法, 其特征在于, 包括如下步 骤: S10、 系统首先获取用户上传的大数据眼底图像, 将请求信息发送至诊断系统, 并调用 后台Java程序和Pytho n代码; S20、 调用基于Spark平台的超像素FCM加速聚类算法, 对眼底图像进行超像素处理, 按 照步距S划 分图像并在每个划 分区域生成超像素聚类中心CK, 通过区域间重复计算像素点 间相似性, 将一些具有相似特性的像素聚合起来形成一个更具有代表性的超像素点, 并将 超像素点作为自适应FC M的基本个 体; S30、 通过Spark框架进行分布式计算, 用超像素块的均值像素颜色特征进行编码并转 化为弹性分布性数据集RDD, 将RDD划分到各节点, 各节点进行FCM隶属度计算后汇总, 再分 区进行聚类中心更新计算, 直至算法收敛; S40、 输出 FCM聚类的结果并保存眼底图像聚类结果; S50、 将大量眼底图像数据的运行结果存储至数据库MySQL 中, 等待前端请求查看时, 将 指定眼底图像聚类结果反馈 至系统用户。 2.根据权利要求1所述的一种面向大数据眼底图像的并行超像素Spark聚类方法, 其特 征在于, 所述 步骤S20包括: S21、 按照步距S划分眼底病变图像并在每个划分区域生成超像素聚类中心CK= [RkGkBkXkYk]T, 其中, RkGkBk和XkYk分别代表第k个聚类中心的颜色距离参 数和空间距离参数, T代表转置矩阵; 若眼底病变图像共有Ns个像素点, 预设K个超像素块, 相邻种子点的步长距 离S, 计算方式如公式(1)所示: 其中, S为相邻种子点的距离, Ns为像素点个数, K为超像素块个数; S22、 在聚类中心的n ×n领域内重新选择中心种子点, 一般取n=3; 然后为了让中心点 不在边界上, 将其设置在 梯度最小的位置; S23、 将算法搜索范围设置为2S ×2S; S24、 计算领域像素点和中心点的距离, 计算方式如公式(2)、 (3)和(4)所示: 其中, dc代表眼底图像的颜色距离, rj‑ri代表第j个像素点到第i个像素点在R通道上的 距离, gj‑gi和bj‑bi分别代表G和B通道上的第j个 像素点到第i个 像素点的距离, 其中, ds代表眼底图像的空间距离, xj‑xi和yj‑yi分别代表x轴和y轴上第j个像素点到第 i个像素点的相对距离, 其中, Di'j代表像素点i到第j个种子点的距离, S是步长距离, λ代表颜 色距离相对比重, 取值范围[1,40];权 利 要 求 书 1/2 页 2 CN 115063877 A 2S25、 采用四连通分量算法进一步处理眼底图像的孤立像素点进行修正, 即迭代完成后 有可能产生的错分点; S26、 输出超像素 预处理后的眼底图像的均值像素颜色特 征。 3.根据权利要求1所述的一种面向大数据眼底图像的并行超像素Spark聚类方法, 其特 征在于, 所述 步骤S30包括: S31、 初始化各参数, 并初始化Spark的Context组件, 进行资源的申请, 然后从分布式文 件系统HDFS中加载眼底图像数据并调用并行函数paral lelize转换为RD D集合; S32、 Spark 集群根据SparkCo ntext资源信息对RD D按照执行器节点的个数进行分区; S33、 利用Spark的广播变量方式将聚类中心发布到每个节点, 随后每个节点进行各分 区的隶属度计算更新; S34、 通过执行函数Reduce进行汇总, 并把每一次的目标函数计算结果进行保存, 其次 进行再次分区, 每个节 点进行聚类中心的更新计算, 再次进行Reduce汇总, 完成了一次迭代 中隶属度矩阵更新计算和聚类中心更新计算; S35、 将多次迭代计算的聚类结果汇总到基于Spark平台的主节点, n满足如下公式(5): n=2w+10                          (5) 其中, w表示用于分布式计算的服 务器数量并且w≥2; S36、 将汇总后的隶属度矩阵进行逐像素目标函数计算, 判断是否收敛, 如果没有收敛, 转至步骤S33; 如果收敛, 则输出眼底图像的像素聚类结果并保存在分布式文件系统HDFS 中。权 利 要 求 书 2/2 页 3 CN 115063877 A 3

.PDF文档 专利 一种面向大数据眼底图像的并行超像素Spark聚类方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向大数据眼底图像的并行超像素Spark聚类方法 第 1 页 专利 一种面向大数据眼底图像的并行超像素Spark聚类方法 第 2 页 专利 一种面向大数据眼底图像的并行超像素Spark聚类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:57:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。