行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210685018.4 (22)申请日 2022.06.15 (71)申请人 天津市国瑞数码安全系统股份有限 公司 地址 300392 天津市西青区华苑产业区海 泰绿色产业基地K1-1- 601室 (72)发明人 孙涛 孙中民  (74)专利代理 机构 北京秉文同创知识产权代理 事务所(普通 合伙) 11859 专利代理师 陈少丽 孙富利 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称 一种场景划分和内容检测的方法和系统 (57)摘要 本发明提供一种场景划分和内容检测的方 法和系统, 通过提取多媒体数据中的多种特征, 生成第一向量矩阵, 将其输入到状态链模型, 得 到显性特征分布区域, 进而确定出需要的隐性特 征分布区域的语义特征集合, 将所述第一向量矩 阵和所述语义特征集合输入计算函数, 同时引入 状态链模型的概率密度参数, 计算确定出不同场 景划分的分界线, 实现精确地分段内容检测。 权利要求书1页 说明书3页 附图1页 CN 115019235 A 2022.09.06 CN 115019235 A 1.一种场景划分和内容检测的方法, 其特 征在于, 所述方法包括: 接收采集终端发送的多媒体数据, 从中提取出视觉特征、 声音特征和文本特征, 将所述 视觉特征、 声音特征和文本特 征按照预设的规则生成第一向量矩阵; 将所述第一向量矩阵输入到状态链模型, 根据预设的概率密度函数, 确定所述多媒体 数据对应的显性特征分布 区域, 得出可能的隐性特征分布 区域, 提取所述可能的隐性特征 分布区域中的多个第二向量矩阵, 分解所述第二向量矩阵得到隐性特 征; 语义分析上述 隐性特征, 得到多个待定语义特征, 并计算所述多个待定语义特征之间 的相关度, 去除其中相关度低于阈值的待定语义特征, 确定所述多媒体数据对应的语义特 征集合; 将所述第一向量矩阵和所述语义特征集合输入计算函数, 同时引入状态链模型的概率 密度参数, 得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式, 经 由神经网络模 型计算该 条件概率公式, 计算得到最优的第二向量矩阵; 根据所述最优的第二向量矩阵之间的分布情况, 确定不同场景划分的分界线, 根据所 述分界线将多媒体数据划分为不同的场景段, 依 次进行语义分析, 得到对应不同场景段 的 语义标签; 根据所述语义标签, 调用不同的内容检测算法, 对所述语义标签对应的场景段进行内 容检测。 2.根据权利要求1所述的方法, 其特征在于: 所述语义分析还包括聚类操作, 对 同一类 的场景段集中分析。 3.根据权利要求2所述的方法, 其特征在于: 所述接收采集终端发送的多媒体数据流包 括对所述多媒体数据流的编解码。 4.根据权利要求3所述的方法, 其特 征在于: 所述语义分析采用神经网络模型。 5.一种场景划分和内容检测的系统, 其特 征在于, 所述系统包括处 理器以及存 储器: 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据所述程序代码中的指令执行实现权利要求1 ‑4任一项所述的方 法。 6.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质用于存储程序代 码, 所述程序代码用于执 行实现权利要求1 ‑4任一项所述的方法。权 利 要 求 书 1/1 页 2 CN 115019235 A 2一种场景划分和内容检测的方 法和系统 技术领域 [0001]本申请涉及网络多媒体领域, 尤其涉及一种场景划分和内容检测的方法和系统。 背景技术 [0002]现有网络中存在大量场景信息、 非常丰富的视频数据, 一段视频中常常剪辑有多 个完全不同的场景, 在不同场景中检测视频内容是否合法, 需要调用不同的检测算法, 给 处 理环节带来了大量的负担, 增加了运算量。 同时, 能否准确划分出不同场景的边界线, 也是 提高检测精度的重要点。 [0003]因此, 急需一种针对性的场景划分和内容检测的 的方法和系统。 发明内容 [0004]本发明的目的在于提供一种场景划分和内容检测的方法和系统, 通过提取多媒体 数据中的多种特征, 生成第一向量矩阵, 将其输入到状态链模型, 得到显性特征分布区域, 进而确定出需要的 隐性特征分布区域的语义特征集合, 将所述第一向量矩阵和所述语义特 征集合输入计算函数, 同时引入状态链模型 的概率密度参数, 计算确定出不同场景划分的 分界线, 实现精确地分段内容检测。 [0005]第一方面, 本申请提供一种场景划分和内容检测的方法, 所述方法包括: [0006]接收采集终端发送的多媒体数据, 从中提取出视觉特征、 声音特征和文本特征, 将 所述视觉特征、 声音特征和文本特 征按照预设的规则生成第一向量矩阵; [0007]将所述第一向量矩阵输入到状态链模型, 根据预设的概率密度函数, 确定所述多 媒体数据对应的显性特征分布 区域, 得出可能的隐性特征分布 区域, 提取所述可能的隐性 特征分布区域中的多个第二向量矩阵, 分解所述第二向量矩阵得到隐性特 征; [0008]语义分析上述隐性特征, 得到多个待定语义特征, 并计算所述多个待定语义特征 之间的相关度, 去除其中相关度低于阈值的待定语义特征, 确定所述多媒体数据对应的语 义特征集合; [0009]将所述第一向量矩阵和所述语义特征集合输入计算函数, 同时引入状态链模型的 概率密度参数, 得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式, 经 由神经网 络模型计算该 条件概率公式, 计算得到最优的第二向量矩阵; [0010]根据所述最优的第二向量矩阵之间的分布情况, 确定不 同场景划分的分界线, 根 据所述分界线将多媒体数据划分为不同的场景段, 依 次进行语义分析, 得到对应不同场景 段的语义标签; [0011]根据所述语义标签, 调用不 同的内容检测算法, 对所述语义标签对应 的场景段进 行内容检测。 [0012]结合第一方面, 在第一方面第一种可能的实现方式中, 所述语义分析还包括聚类 操作, 对同一类的场景 段集中分析。 [0013]结合第一方面, 在第一方面第二种可能的实现方式中, 所述接收采集终端发送的说 明 书 1/3 页 3 CN 115019235 A 3

.PDF文档 专利 一种场景划分和内容检测的方法和系统

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种场景划分和内容检测的方法和系统 第 1 页 专利 一种场景划分和内容检测的方法和系统 第 2 页 专利 一种场景划分和内容检测的方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:53:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。