行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111564014.2 (22)申请日 2021.12.20 (71)申请人 杭州电子科技大 学 地址 310018 浙江省杭州市下沙高教园区2 号大街 (72)发明人 王兴起 杨令 魏丹 陈滨  (74)专利代理 机构 杭州君度专利代理事务所 (特殊普通 合伙) 33240 代理人 杨舟涛 (51)Int.Cl. G06F 11/36(2006.01) G06N 20/00(2019.01) (54)发明名称 基于流形组合特征和联合分布的跨项目软 件缺陷预测方法 (57)摘要 本发明提出基于流形组合特征和联合分布 的跨项目软件缺陷预测方法, 本发 明选择在流形 特征空间中考虑使用具有域适应的全局边缘化 降噪自动编码器提取全局可转移特征和具有域 适应的局部子集边缘化降噪自动编码器提取局 部可转移特征, 然后将提取的全局可转移特征和 局部可转移特征线性组合为新的组合特征并应 用实现联合分布匹配; 其次, 该方法引入一种迭 代学习的伪标签策略, 通过在循环中多次更新伪 标签来提高伪标签准确率, 该策略通过利用新的 组合特征实现联合分布匹配, 然后通过联合分布 匹配获取实例权重训练模型并再次更新标签, 并 使更新后的标签进行新一轮的组合特征提取、 伪 标签更新和联合分布匹配, 直至最终的预测结果 收敛。 权利要求书2页 说明书4页 附图1页 CN 114253849 A 2022.03.29 CN 114253849 A 1.基于流形组合特征和联合分布的跨项目软件缺陷预测方法, 其特征在于, 该方法具 体包括以下步骤: 步骤1、 获取缺陷数据集和无缺陷数据集, 筛 选部分数据进行实验 验证; 步骤2、 在流形 特征空间中提取 数据的全局可转移特 征和局部可转移特 征; 步骤3、 利用线性方式组合为组合特征, 将组合特征和联合分布匹配相结合; 具体操作 如下: 即在流形特征空间使用DA ‑GMDA和DA ‑LMDA从源项 目和目标项 目生成全局可转移特征 和 以及源项目局部可转移特征和目标项目局部可转移特征 和 然后将 和 以及 和 线性组合成新的组合特征 和 后, 首次更新伪标 签, 并用组合特征计算格拉姆矩阵 通过格拉姆矩阵进行联合分 布匹配; 步骤4、 通过联合分布匹配获得实例权重; 并基于该权重训练预测模型, 最后基于该预 测模型进行伪标签的二次更新; 步骤5、 重复训练预测模型过程中, 更新后的标签再次用于提取组合特征并更新伪标签 和联合分布匹配, 直至最后预测稳定收敛, 即可 结束训练。 2.根据权利要求1所述的基于流形组合特征和联合分布的跨项目软件缺陷预测方法, 其特征在于: 在流形特征空间中提取数据的全局可转移特征和局部可转移特征; 具体操作 如下: 步骤2‑1: 在流形特征空间中提取可转移特征; 首先通过在格拉斯曼流形G(dk)中学习一 个映射函数g(.), 其中, dk是不同项目数据子空间的维度; 利用测 地线流核GFK来学习g(.) 的计算效率, G( ·)看作是一个dk维的子空间集 合; 对任意两个数据特征xi、 xj构造测地线流, 等于将原始特征转换为无限维特征空间; 新 的特征数据记为z=g(x), 新的特 征的内积产生 一个半正定的GF K: 其中G是半正定矩阵; 原始数据x转化为格拉斯曼流形特征, 项目实例 集合X={XS, XT}, 其中XS是源项目实例集合, XT是目标项目实例集合; G只是一种表达式, 不 能直接计算, 所以平方根通过Denman ‑Beavers算法计算; 在以下部分中使用 作为流 形特征表示; 步骤2‑2: DA‑GMDA利用XS和XT来提取具有更多可转移容量的全局特征; 假设边缘分布Ms (xS)≠Mt(xt)和条件分布Cs(yS|xS)≠Ct(yt|xt), 且边缘分布和条件分布同时匹配; DA ‑GMDA 旨在学习映射矩阵W以重建可转移的全局特征空间; 输入数据 因噪声概率p而损坏; 目标函 数定义为: 其中 和 分别匹配边缘分布和匹配条件分布, 是源项目数据XS 的损坏版本, 是目标项目数据XT的损坏版本; λ是正则化参数; 采用双曲正切函数生成源权 利 要 求 书 1/2 页 2 CN 114253849 A 2项目全局可转移特 征 和目标项目全局可转移特 征 步骤2‑3: 采用DA ‑LMDA来提取局部 子集的特 征; 根据标签和伪标签将源项目实例和目标项目实例分为不同的局部子集; 其次, 通过匹 配局部子集分布并重构局部子空间的DA ‑LMDA, 以获得不同子集更丰富的可转移局部特征; DA‑LMDA关于带有标签c的局部 子集的目标函数定义 为: 其中, 表示来自源项目 的带有标签c的实例, 表示来自目标项目 的带 有标签c的实例; 是 的损坏版本, 是 的损坏版本, λ是正则化参数; 得到在标签c上 的源项目局部可转移特 征 和目标项目局部可转移特 征 权 利 要 求 书 2/2 页 3 CN 114253849 A 3

.PDF文档 专利 基于流形组合特征和联合分布的跨项目软件缺陷预测方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于流形组合特征和联合分布的跨项目软件缺陷预测方法 第 1 页 专利 基于流形组合特征和联合分布的跨项目软件缺陷预测方法 第 2 页 专利 基于流形组合特征和联合分布的跨项目软件缺陷预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。