(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111332530.2
(22)申请日 2021.11.11
(65)同一申请的已公布的文献号
申请公布号 CN 114065620 A
(43)申请公布日 2022.02.18
(73)专利权人 四川大学
地址 610000 四川省成 都市一环路南 一段
24号
(72)发明人 李川 刘江亭 蒲雪梅 曾严
(74)专利代理 机构 四川省成 都市天策商标专利
事务所(有限合 伙) 51213
专利代理师 张秀敏
(51)Int.Cl.
G06F 30/27(2020.01)
G06F 17/16(2006.01)
G06F 119/14(2020.01)
(56)对比文件
CN 111339935 A,2020.0 6.26
CN 109739 926 A,2019.0 5.10
CN 112329830 A,2021.02.0 5CN 112102887 A,2020.12.18
US 2021166788 A1,2021.0 6.03
US 20212173 38 A1,2021.07.15
梁猛.基于分子可视化与机 器学习的蛋白质
功能分析研究. 《中国优秀博硕士学位 论文全文
数据库(博士) 信息科技 辑》 .2021,(第07期),
I140-5.
陈娴.荧光蛋白突变 体发光微观机理及其调
控的理论研究. 《中国优秀博硕士学位 论文全文
数据库(博士) 基础科 学辑》 .2019,(第04期),
A006-50.
H. Carrillo-Cabada 等.A Graphic
Encoding Method for Quantitative
Classificati on of Protei n Structure and
Representati on of Conformati onal Changes.
《IEEE/ACM Transacti ons on Computati onal
Biology and Bi oinformatics》 .2021,第18卷
(第4期),13 36-1349. (续)
审查员 刘明惠
(54)发明名称
基于像素图表征和CNN的可解释性分子动力
学轨迹分析方法
(57)摘要
本发明公开了基于像素图表征和CNN的可解
释性分子动力学轨迹分析方法, 获取两条不同类
别的MD轨迹数据集, 将原子和残 基对应, 并删除H
原子; 进行数据预处理并用像素图方式表征数
据, 得到两组带有标签的像素图数据集, 并对CNN
模型进行训练和测试; 构造解释器输出像素评分
矩阵; 采样并获取像素评分矩阵, 累加并求平均
值, 得到原子评分; 对一个残基中所有原子的评
分求平均值, 得到该残基评分。 本发明采用像素
图表征方式直接将所有的坐标信息映射到图像
中, 能达到尽可能小的信息损失。 将所有的坐标
信息映射到图像中, 在表征过程中达到线性无损, 同时避免了计算大量描述符的时间和人力成
本。
[转续页]
权利要求书1页 说明书9页 附图1页
CN 114065620 B
2022.06.03
CN 114065620 B
(56)对比文件
Frank Noé 等.Mac hine Learn ing for Molecular Simulati on. 《Annual Review of
Physical C hemistry》 .2020,第71卷3 61-390.2/2 页
2[接上页]
CN 114065620 B1.一种基于像素图表征和CNN的可解释性分子动力学轨迹分析方法, 其特征在于, 包
括:
步骤S100、 获取两条不同类别的MD轨迹数据集, MD轨迹数据集包括MD轨迹以及该MD轨
迹的拓扑 结构, 将两条MD轨 迹的原子和残基对应, 并删除MD轨 迹中的H原子;
步骤S200、 读取处理后的MD轨迹数据 集, 选取MD轨迹中的任意一帧作为参考帧, 将MD轨
迹数据集中的每一个构象叠加在参 考帧上, 实现MD轨 迹空间上的偏差消除;
步骤S300、 对偏差消除后的MD数据集进行像素图表征, 得到两组带有标签的像素图数
据集, 具体包括:
步骤S310、 对于 轨迹数据每一帧中的每 个原子, 计算 其对应的颜色坐标rgb:
A、 获取原子的xyz坐标与颜色坐标的转换矩阵t rs:
B、 根据公式rgb=xyz ×trs计算原子的xyz坐标对应的颜色坐标;
步骤S320、 对于轨迹数据每一帧的所有原子的颜色坐标按原子及残基顺序排列, 拼接
成一张正方 形图像, 并用黑色补齐;
步骤S330、 对于两条轨迹, 分别添加标签0和标签1, 表示两条轨迹属于不同的两个类
别, 作为后续CN N模型的标签;
步骤S400、 将像素图数据 集按时间顺序分为N组, 进行随机的五折划分, 再进行拼接, 得
到最终的五折交叉验证数据集;
步骤S500、 构造卷积神经网络 CNN模型, 对五折交叉验证数据集进行模型训练和 测试;
步骤S600、 构造解释器, 对CNN模型进行切 片, 在每一个局部做线性拟合, 并对每一个局
部做线性模型的解释, 得到对CNN模型的近似解释以及影响CNN模型分类决策的像素点, 找
到二维图像中对分类决策有重要影响的区域, 以像素评分矩阵形式得 出;
步骤S700、 每隔预设M帧采样获取一个像素评分矩阵, 累加并求平均值, 根据像素点和
原子的一一对应关系得到原子评分; 对一个残基中所有原子的评分求平均值, 得到该残基
评分; 将原子 评分及残基评分输出到文件。权 利 要 求 书 1/1 页
2
CN 114065620 B
3
专利 基于像素图表征和CNN的可解释性分子动力学轨迹分析方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 00:48:16上传分享