(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211199482.9
(22)申请日 2022.09.29
(71)申请人 长安大学
地址 710064 陕西省西安市雁塔区二环南
路中段126号
(72)发明人 刘占文 焦子恒 王佳瑶 黄泽宇
王洋 樊星 李宇航 杨楠
贾晓航 李美芸 杨劲松 李文倩
(74)专利代理 机构 西安恒泰知识产权代理事务
所 61216
专利代理师 周春霞
(51)Int.Cl.
G06K 9/62(2022.01)
G06V 10/762(2022.01)
G06V 10/764(2022.01)G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于无监督图节点聚类的目标分类方法
(57)摘要
本申请涉及目标分类模型训练方法, 包括:
构建目标分类模 型; 基于图训练数据集对目标分
类模型进行训练, 得到训练后的目标分类模型;
图训练数据集包括多个图节点, 每个图节点表示
一个待分类目标; 目标分类模型包括依次连接的
深层表征提取层和聚类层。 本申请的目标分类模
型训练方法, 解决了现有的半监督方法无法对不
含节点标签信息的目标数据集进行分类的难题,
基于无监督学习的网络训练同时也降低了聚类
结果好坏对 标签信息多少的依赖度, 大大增强了
网络的稳定性, 始终在聚类任务中表现出较好的
性能; 实现了端对端学习, 规避了多模块训练目
标不一致的问题, 降低了工程的复杂度、 减小了
训练误差, 使网络性能更加鲁棒。
权利要求书2页 说明书9页 附图6页
CN 115526256 A
2022.12.27
CN 115526256 A
1.一种目标分类模型训练方法, 其特 征在于, 包括:
构建目标分类模型;
基于图训练数据集对所述目标分类模型进行训练, 得到训练后的目标分类模型; 所述
图训练数据集包括多个图节点, 每个所述图节点表示一个待分类目标; 所述 目标分类模型
包括依次连接的深层表征提取层和聚类层;
所述深层表征提取层用于提取 所述图训练数据集中每 个所述图节点的深层表征;
所述聚类层用于基于所述深层表征对所述多个图节点进行聚类, 确定多个聚类中心;
以及, 根据每 个所述图节点的深层表征和所述多个聚类中心确定每 个所述图节点的类别。
2.如权利要求1所述的方法, 其特征在于, 其中, 基于 图训练数据集对所述目标分类模
型进行训练, 包括:
根据所述图训练数据集确定图; 所述图中包括多个图节点和所述多个图节点之间的邻
接关系; 所述邻接关系用于表征任意两个图节点之间的关系;
根据所述图中的邻接关系确定邻接矩阵;
根据每个所述图节点的特 征向量确定特 征矩阵;
基于所述邻接矩阵和所述特 征矩阵对所述目标分类模型进行训练。
3.如权利要求2所述的方法, 其特征在于, 基于所述邻 接矩阵和所述特征矩阵对所述目
标分类模型进行训练, 包括:
对所述邻接矩阵A加上自环, 得到矩阵
即
其中, IN∈RN×N为单位矩阵;
对 所 述 矩 阵
进 行 标 准 化 处 理 , 得 到 标 准 化 处 理 后 的 邻 接 矩 阵
即
其中,
为度矩阵;
基于所述标准 化处理后的邻接矩阵
和所述特 征矩阵X对所述目标分类模型进行训练。
4.如权利要求1所述的方法, 其特征在于, 所述深层表征提取层包括依次连接的两个卷
积层和一个全连接层。
5.如权利要求1所述的方法, 其特征在于, 其中, 根据每个所述图节点的深层表征和所
述多个聚类中心确定每 个所述图节点的类别, 包括:
计算每个 所述图节点的深层 表征与所述多个聚类中心的欧式距离gi, i=1, 2, …, N, i为
图节点的标号, N为图节点的个数, 欧式距离gi是一个D维的行向量, D为所述聚类中心的个
数;
所有所述图节点对应的欧式距离形成一个误差矩阵g=[g1,g2,…gi…,gN];
对所述误差矩阵g中的每一个行向量中的元素按照由小到大进行排序, 形成排序后的
误差矩阵h=[h1,h2,…hj…,hD]T, hj为一个N维的列向量;
基于所述排序后的误差矩阵h确定权重矩阵p=[p1,p2,…pj…,pD]T, 权重矩阵p是一个
N*D的矩阵, 采用以下公式确定pj, 这里, pj是一个N维的列向量:
其中, hj为误差矩阵h中的第j个列向量;
根据所述权重矩阵p确定每个所述图节点的类别, 所述权重矩阵p中的每一个行向量中权 利 要 求 书 1/2 页
2
CN 115526256 A
2的元素反映所述行向量对应的图节点属于所述元 素对应类别的概 率大小。
6.如权利要求1所述的方法, 其特 征在于, 所述训练包括:
对所述目标分类模型进行 预训练, 获取并保存 模型参数;
将所述模型参数作为初值对所述目标分类模型进行正式训练, 得到训练后的目标分类
模型。
7.如权利要求6所述的方法, 其特 征在于, 所述预训练采用的损失函数L oss1为:
其中, N为图节点的个数, Z为所述深层表征提取层中两层卷积的输出, L为拉普拉斯矩
阵,
为度矩阵,
为邻接矩阵A加上 自环后得到的矩阵, trace(.)表示迹, γ
为正则化参数, zi为Z中的第i个图节点对应的输出, zj为Z中的第j个图节点对应的输出, sij
为图中第i个图节点和第j个图节点之间有边的概 率。
8.如权利要求6所述的方法, 其特 征在于, 所述 正式训练采用的损失函数L oss2为:
其中, Yid为所述聚类层的输出中第i个图节点属于第d个类别的概率, N为图节点的个
数, D为图节点的类别的个数, Z ’id为所述深层表征提取层的输出Z ’中的第i个图节点的第d
个类别的输出, z ’i为所述深层表征提取层的输出Z ’中的第i个图节点对应的输出, z ’j为所
述深层表征提取层的输出Z ’中的第j个图节点对应的输出, sij为图中第 i个图节点和第j个
图节点之间有边的概 率。
9.一种基于无监 督图节点聚类的目标分类方法, 其特 征在于, 包括:
根据待分类目标图数据集确定图对应的邻 接矩阵和特征矩阵; 所述待分类目标图数据
集包括多个图节点, 每个所述图节点表示一个待分类目标, 所述邻接矩阵用于表征任意两
个所述图节点之间的关系, 所述特 征矩阵用于表征每 个所述图节点的特 征向量;
将所述邻接矩阵和所述特征矩阵输入到目标分类模型中, 输出每个待分类目标的类
别;
所述目标分类模型为根据权利要求1 ‑8中任一权利要求的目标分类模型训练方法得到
的。权 利 要 求 书 2/2 页
3
CN 115526256 A
3
专利 基于无监督图节点聚类的目标分类方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:04:27上传分享