行业标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210750372.0 (22)申请日 2022.06.29 (65)同一申请的已公布的文献号 申请公布号 CN 114841898 A (43)申请公布日 2022.08.02 (73)专利权人 华中科技大 学 地址 430074 湖北省武汉市洪山区珞喻路 1037号 (72)发明人 黄胜友 何佳铧 李涛  (74)专利代理 机构 华中科技大 学专利中心 42201 专利代理师 尹丽媛 (51)Int.Cl. G06T 5/00(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06T 3/40(2006.01) G06T 5/50(2006.01) G06V 10/762(2022.01) G06K 9/62(2022.01) 审查员 司马成 (54)发明名称 基于深度学习的冷冻电镜三维密度图后处 理方法和装置 (57)摘要 本发明公开了一种基于深度学习的冷冻电 镜三维密度图后处理方法和装置, 属于结构生物 学检测技术领域, 所述方法包括: 构建包括多个 实验密度图和关联的PDB结构的训练样本集; 将 每个实验密度图和其对应的模拟密度图进行分 割得到多个实验密度块和多个模拟密度块; 将各 个实验密度图对应的多个实验密度块输入基于 UNet++网络模型构建的深度学习网络得到多个 预测密度块; 利用目标损失函数获取预测密度块 与对应的模拟密度块之间的差值, 反向传播差值 从而训练深度学习网络; 将当前冷冻电镜密度图 切割为多个当前密度块, 将当前密度块输入训练 好的深度学习网络, 将输出的密度块进行组装 得 到最终密度图。 本发明能够提高冷冻电镜密度图 的可解释性。 权利要求书2页 说明书7页 附图2页 CN 114841898 B 2022.09.23 CN 114841898 B 1.一种基于深度学习的冷冻电镜三维密度图后处 理方法, 其特 征在于, 包括以下步骤: S1: 构建包括多个实验密度图和关联的PDB结构的训练样本集; 所述S1包括: S11: 从 EMDB数据库和PDB数据库下载满足预设分辨率的单粒子冷冻电镜图以及与之关联的PDB结 构作为初始样 本; S12: 对 所述单粒子冷冻电镜图及其关联的PDB结构进 行筛选和聚类, 剔除 不满足要求的初始样 本; S13: 将剩余的所述初始样本中的单粒子 冷冻电镜图作为所述 实验 密度图, 将每 个所述实验密度图分割成多个预设尺寸的实验密度块; S2: 将每个所述实验密度图和其对应的模拟密度图进行分割, 分别得到多个实验密度 块和多个模拟密度块; 将各个所述实验密度图对应的多个实验密度块输入基于UNet++网络 模型构建的深度学习网络得到多个预测密度块; 利用目标损失函数获取多个所述预测密度 块与对应多个所述模拟密度块之间的差值, 反向传播所述差值从而训练所述深度学习网 络; 其中, 所述模拟密度图为所述实验密度图对应的无噪声的冷冻电镜 图; 所述目标损 失 函数为平 滑L1损失函数和结构相似性损失函数之和; S3: 将当前冷冻电镜密度图切割为多个当前密度块, 将所有的所述当前密度块输入训 练好的深度学习网络, 将输出的密度块进行组装得到最终密度图。 2.如权利要求1所述的基于深度 学习的冷冻电镜三维密度图后处理方法, 其特征在于, 所述S12包括: S121: 若一所述初始样本中的单粒子冷冻电镜图具有非正交的轴或分辨率不满足FSC ‑ 0.143黄金标准或与之关联的PDB结构中仅包含骨架原子、 包含未知的残基或包含缺失的 链, 则剔除所述初始样本; S122: 若一所述初始样本中的PDB结构对应 的CC_mask值低于预设值, 则剔除所述初始 样本; S123: 使用贪心算法对剩余的所述初始样本中单粒子冷冻电镜图进行聚类得到多个集 合, 确定出各个集合中的代表样本, 将所述代表样本中的单粒子冷冻电镜图作为所述训练 样本。 3.如权利要求2所述的基于深度 学习的冷冻电镜三维密度图后处理方法, 其特征在于, 所述S123包括: 若一所述初始样本中PDB结构内的任一条链与另一所述初始样本中PDB结构内任一条 链有大于 30%的序列相似性, 则将两个初始样本放置 到一个集 合; 将每个所述集合中相似样本数量最多的初始样本作为所述集合的所述代表样本, 然后 移除该集 合中其余初始样本; 将所述代 表样本中的单 粒子冷冻电镜图作为所述训练样本 。 4.如权利要求1所述的基于深度 学习的冷冻电镜三维密度图后处理方法, 其特征在于, 所述S2之前, 所述方法还 包括: 通过三次立方插值将各个所述实验密度图的网格间隔进行统一, 负的密度值被截断到 零; 采用全局归一 化策略将每 个所述实验密度图的密度值进行归一 化。 5.如权利要求1所述的基于深度 学习的冷冻电镜三维密度图后处理方法, 其特征在于, 所述S2包括:权 利 要 求 书 1/2 页 2 CN 114841898 B 2S21: 将每个所述实验密度图和其对应的模拟密度图进行分割, 分别得到多个实验密度 块和多个模拟密度块; S22: 将各个所述实验密度图对应的多个实验密度块输入基于UNet++网络模型构建的 深度学习网络得到多个预测密度块; 所述UNet++网络模型包括多个编码 器模块和多个解码 器模块; S23: 利用所述平滑L1损失函数计算预测密度块和模拟密度块之间的密度值的第一差 值; 利用所述结构相似性损失函数根据预测密度块和模拟密度块的对比度相似性和结构相 似性进行比较得到第二差值; 将所述第一差值和所述第二差值的和作为所述差值, 反向传 播所述差值从而训练所述深度学习网络 。 6.如权利要求5所述的基于深度 学习的冷冻电镜三维密度图后处理方法, 其特征在于, 所述S21包括: 利用预设步长三维滑动 窗口将所述实验密度图及其相应的模拟密度图分成多对预设 尺寸的密度块, 分别记为所述 实验密度块和所述模拟密度块; 其中, 所述模拟密度图是从对 应的实验密度图相关联的P DB结构无噪声地模拟得到的。 7.如权利要求5所述的基于深度 学习的冷冻电镜三维密度图后处理方法, 其特征在于, 所述S23之后, 所述方法还 包括: 当所述目标损失函数的输出在连续多轮训练中均 未降低, 则学习率将降低到其当前值 的1/2; 当学习率达到最小值1e ‑5时, 停止训练, 多次训练得到多个目标深度学习网络, 将损失 函数最小对应的目标深度学习网络作为所述训练好的深度学习网络 。 8.一种基于深度学习的冷冻电镜三维密度图后处理装置, 其特征在于, 用于执行权利 要求1‑7任一项所述的基于深度学习的冷冻电镜三维密度图后处 理方法, 包括: 构建模块, 用于构建包括多个实验密度图和关联的P DB结构的训练样本集; 训练模块, 用于将每个所述实验密度图和其对应的模拟密度图进行分割, 分别得到多 个实验密度块和多个模拟密度块; 将各个所述实验密度图对应的多个实验密度块输入基于 UNet++网络模 型构建的深度学习网络得到多个预测密度块; 利用目标损失函数获取多个所 述预测密度块与对应多个所述模拟密度块之间的差值, 反向传播所述差值从而训练所述深 度学习网络; 其中, 所述模拟密度图为所述实验密度图对应的无噪声的冷冻电镜 图; 所述目标损 失 函数为平 滑L1损失函数和结构相似性损失函数之和; 执行模块, 用于将当前冷冻电镜密度图切割为多个当前密度块, 将所有的所述当前密 度块输入训练好的深度学习网络, 将输出的密度块进行组装得到最终密度图。 9.一种电子设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114841898 B 3

.PDF文档 专利 基于深度学习的冷冻电镜三维密度图后处理方法和装置

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度学习的冷冻电镜三维密度图后处理方法和装置 第 1 页 专利 基于深度学习的冷冻电镜三维密度图后处理方法和装置 第 2 页 专利 基于深度学习的冷冻电镜三维密度图后处理方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:58:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。