专利一种场景划分和内容检测的方法和系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210685018.4 (22)申请日 2022.06.15 (71)申请人天津市国瑞数码安全系统股份有限公司地址 300392 天津市西青区华苑产业区海泰绿色产业基地K1-1- 601室 (72)发明人孙涛　孙中民　 (74)专利代理机构北京秉文同创知识产权代理事务所(普通合伙) 11859 专利代理师陈少丽　孙富利 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称一种场景划分和内容检测的方法和系统 (57)摘要本发明提供一种场景划分和内容检测的方法和系统，通过提取多媒体数据中的多种特征，生成第一向量矩阵，将其输入到状态链模型，得到显性特征分布区域，进而确定出需要的隐性特征分布区域的语义特征集合，将所述第一向量矩阵和所述语义特征集合输入计算函数，同时引入状态链模型的概率密度参数，计算确定出不同场景划分的分界线，实现精确地分段内容检测。权利要求书1页说明书3页附图1页 CN 115019235 A 2022.09.06 CN 115019235 A 1.一种场景划分和内容检测的方法，其特征在于，所述方法包括：接收采集终端发送的多媒体数据，从中提取出视觉特征、声音特征和文本特征，将所述视觉特征、声音特征和文本特征按照预设的规则生成第一向量矩阵；将所述第一向量矩阵输入到状态链模型，根据预设的概率密度函数，确定所述多媒体数据对应的显性特征分布区域，得出可能的隐性特征分布区域，提取所述可能的隐性特征分布区域中的多个第二向量矩阵，分解所述第二向量矩阵得到隐性特征；语义分析上述隐性特征，得到多个待定语义特征，并计算所述多个待定语义特征之间的相关度，去除其中相关度低于阈值的待定语义特征，确定所述多媒体数据对应的语义特征集合；将所述第一向量矩阵和所述语义特征集合输入计算函数，同时引入状态链模型的概率密度参数，得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式，经由神经网络模型计算该条件概率公式，计算得到最优的第二向量矩阵；根据所述最优的第二向量矩阵之间的分布情况，确定不同场景划分的分界线，根据所述分界线将多媒体数据划分为不同的场景段，依次进行语义分析，得到对应不同场景段的语义标签；根据所述语义标签，调用不同的内容检测算法，对所述语义标签对应的场景段进行内容检测。 2.根据权利要求1所述的方法，其特征在于：所述语义分析还包括聚类操作，对同一类的场景段集中分析。 3.根据权利要求2所述的方法，其特征在于：所述接收采集终端发送的多媒体数据流包括对所述多媒体数据流的编解码。 4.根据权利要求3所述的方法，其特征在于：所述语义分析采用神经网络模型。 5.一种场景划分和内容检测的系统，其特征在于，所述系统包括处理器以及存储器：所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；所述处理器用于根据所述程序代码中的指令执行实现权利要求1 ‑4任一项所述的方法。 6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行实现权利要求1 ‑4任一项所述的方法。权　利　要　求　书 1/1 页 2 CN 115019235 A 2一种场景划分和内容检测的方法和系统技术领域 [0001]本申请涉及网络多媒体领域，尤其涉及一种场景划分和内容检测的方法和系统。背景技术 [0002]现有网络中存在大量场景信息、非常丰富的视频数据，一段视频中常常剪辑有多个完全不同的场景，在不同场景中检测视频内容是否合法，需要调用不同的检测算法，给处理环节带来了大量的负担，增加了运算量。同时，能否准确划分出不同场景的边界线，也是提高检测精度的重要点。 [0003]因此，急需一种针对性的场景划分和内容检测的的方法和系统。发明内容 [0004]本发明的目的在于提供一种场景划分和内容检测的方法和系统，通过提取多媒体数据中的多种特征，生成第一向量矩阵，将其输入到状态链模型，得到显性特征分布区域，进而确定出需要的隐性特征分布区域的语义特征集合，将所述第一向量矩阵和所述语义特征集合输入计算函数，同时引入状态链模型的概率密度参数，计算确定出不同场景划分的分界线，实现精确地分段内容检测。 [0005]第一方面，本申请提供一种场景划分和内容检测的方法，所述方法包括： [0006]接收采集终端发送的多媒体数据，从中提取出视觉特征、声音特征和文本特征，将所述视觉特征、声音特征和文本特征按照预设的规则生成第一向量矩阵； [0007]将所述第一向量矩阵输入到状态链模型，根据预设的概率密度函数，确定所述多媒体数据对应的显性特征分布区域，得出可能的隐性特征分布区域，提取所述可能的隐性特征分布区域中的多个第二向量矩阵，分解所述第二向量矩阵得到隐性特征； [0008]语义分析上述隐性特征，得到多个待定语义特征，并计算所述多个待定语义特征之间的相关度，去除其中相关度低于阈值的待定语义特征，确定所述多媒体数据对应的语义特征集合； [0009]将所述第一向量矩阵和所述语义特征集合输入计算函数，同时引入状态链模型的概率密度参数，得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式，经由神经网络模型计算该条件概率公式，计算得到最优的第二向量矩阵； [0010]根据所述最优的第二向量矩阵之间的分布情况，确定不同场景划分的分界线，根据所述分界线将多媒体数据划分为不同的场景段，依次进行语义分析，得到对应不同场景段的语义标签； [0011]根据所述语义标签，调用不同的内容检测算法，对所述语义标签对应的场景段进行内容检测。 [0012]结合第一方面，在第一方面第一种可能的实现方式中，所述语义分析还包括聚类操作，对同一类的场景段集中分析。 [0013]结合第一方面，在第一方面第二种可能的实现方式中，所述接收采集终端发送的说　明　书 1/3 页 3 CN 115019235 A 3

专利 一种场景划分和内容检测的方法和系统

专利一种场景划分和内容检测的方法和系统