行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210802772.1 (22)申请日 2022.07.07 (71)申请人 江苏科技大学 地址 212100 江苏省镇江市丹徒新区长晖 路666号 (72)发明人 徐天杰 王平心 李刘万 吴婷凤  凡嘉琛  (74)专利代理 机构 安徽思沃达知识产权代理有 限公司 342 20 专利代理师 赵瑜 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/774(2022.01) (54)发明名称 一种自学习属性权 重的K-means聚类方法 (57)摘要 本发明涉及聚类 分析技术领域, 具体涉及一 种自学习属性权重的K ‑means聚类方法; 本发明 获得给定图像的聚类数据集, 初始化初始聚类中 心和权值, 根据最小距离, 从数据集中获得数据 点集, 计算数据点集的最小树, 然后估算一个合 理的θ值, 去除从T中去掉所有大于θ的边, 将所 得到的连通 分支数作为聚类个数, 并将连通分支 定点中心作为聚类质心, 通过迭代计算, 完成聚 类, 所提供的方法, 聚类平均值得到大幅提升, 收 敛性也得到提升, 而 且提升了速度。 权利要求书1页 说明书4页 附图1页 CN 115272732 A 2022.11.01 CN 115272732 A 1.一种自学习属性权 重的K‑means聚类方法, 其特 征在于, 包括以下步骤: (1)获得给定图像的聚类数据集, 初始化初始聚类中心和权值, 根据最小距离, 从数据 集中获得 数据点集; (2)计算数据点 集的最小树T=(VT,ET); (3)将ET的所有边长按照长度从小到大进行排序e1, e2, ..., en‑1, 分别计算他们的均值 M均和方差V方; (4)计算 (5)从T中去掉 共P‑1条大于θ 的边, 获得P个连通分支, 分别标记 为Tp=(Vp,Ep), 计算Tp的质心; (6)令 计算 2.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(1)中, 获得给定图像的聚类数据集是对所给定的图像进行灰度化处理、 中值滤波处理、 图像分割以及特 征提取, 将所提取的特 征数据作为聚类数据集。 3.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(2)中, 计算数据点 集的最小数的方法为: 假设数据集 为RN,数据点集为X={x1,x2,…,xn}; 计算数据点 集X={x1,x2,…,xn}的一颗最小树T=(VT,ET)。 4.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(3)中, 所述的均值 5.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(3)中, 所述的方差 6.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(5)中, 7.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(5)中, Tp的质心公式为: 8.根据权利要求1所述的一种自学习属性权重的K ‑means聚类方法, 其特征在于, 在步 骤(6)中, 若 则停止计算, 其中t=0时, ω为设定值。权 利 要 求 书 1/1 页 2 CN 115272732 A 2一种自学习属性权重的K ‑means聚类方法 技术领域 [0001]本发明涉及聚类分析技术领域, 具体涉及一种自学习属性权重的K ‑means聚类方 法。 背景技术 [0002]聚类是一个将数据集中在某些方面相似的数据成员进行分类 组织的过程, 聚类就 是一种发现这种内在结构的技 术, 聚类技 术经常被称为无监 督学习。 [0003]聚类分析是将抽象的数据集按有关特征的相似程度划分为若干 组或类的过程,其 目的是将一个没有类别标记的数据集按照某种准则划分为若干个类, 使得同一个类中的对 象尽可能的相似, 而属于不同类的对 象间的差异尽可能大。 聚类分析作为一种重要的无监 督学习方法,能够从研究对 象的特征数据中挖掘出关联规则, 是一种强有力的信息处理方 法,它在数据挖掘、 图像分割、 模式识别和特征提取等诸多领域都有着广泛的应用,并取得 了令人满意的效果。 [0004]如专利申请号为CN201910615891.4的专利, 其在说明书中记载有 “根据数据集的 差异矩阵计算各个样本的样 本密度, 得到k ‑1个密度最大的样 本集, 以这些样本集的均值作 为聚类质心, 得到k ‑1 个聚类质心, 然后取剩余数据的均值作为第k聚类质心, 相比传统的 聚类算法(各个属性具有相同的权重), 该算法更能体现簇内相似性与簇间相异性, 使得各 个聚类簇具有本簇内特征权重, 该权重能够体现本簇内样本的共同特征, 以及本簇内各个 属性对聚类的影 响大小”, 又如专利申请号为CN201910387627.X的专利, 其在说明书中记载 有“利用自下而 上的层次聚类改进二分k ‑means聚类, 聚类过程中无需指定K值个数, 一次二 分聚类即可获得最小SSE簇, 再通过判别 条件, 使其自动收敛。 该方法 的聚类性能优于K ‑均 值聚类算法和二分K ‑均值聚类算法, 使聚类后的结构更加紧密, 簇边界更清晰。 根据本发明 实施例的改进二分k ‑means聚类方法, 通过计算误差平方和SSE衡量该聚类算法性能的优 劣。 通过层次聚类和二分k ‑means聚类结合的改进算法对数据进行多 次的聚类, 直到收敛, 可获得更好的聚类效果 ”, 上述方法, 虽然能够实现聚类分析效果, 但是其过程复杂, 聚类 后, 收敛性 不佳, 而且速度较慢, 无法满足需求。 [0005]综上所述, 研 发一种自学习属性权重的K ‑means聚类方法, 是聚类分析技术领域中 急需解决的关键问题。 发明内容 [0006]针对现有技术所存在的上述缺点, 本发明在于提供一种自学习属性权重的K ‑ means聚类方法, 本发 明所提供的方法, 聚类平均值得到大幅提升, 收敛性也得到提升, 而且 提升了速度。 [0007]为实现上述目的, 本发明提供了如下技 术方案: [0008]本发明提供了一种自学习属性权 重的K‑means聚类方法, 包括以下步骤: [0009](1)获得给定图像的聚类数据集, 初始化初始聚类中心和权值, 根据最小距离, 从说 明 书 1/4 页 3 CN 115272732 A 3

.PDF文档 专利 一种自学习属性权重的K-means聚类方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种自学习属性权重的K-means聚类方法 第 1 页 专利 一种自学习属性权重的K-means聚类方法 第 2 页 专利 一种自学习属性权重的K-means聚类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:56:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。