一种场景划分和内容检测的方法和系统技术方案

技术编号:34856034 阅读:15 留言:0更新日期:2022-09-08 07:57
本发明专利技术提供一种场景划分和内容检测的方法和系统,通过提取多媒体数据中的多种特征,生成第一向量矩阵,将其输入到状态链模型,得到显性特征分布区域,进而确定出需要的隐性特征分布区域的语义特征集合,将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,计算确定出不同场景划分的分界线,实现精确地分段内容检测。实现精确地分段内容检测。实现精确地分段内容检测。

【技术实现步骤摘要】
一种场景划分和内容检测的方法和系统


[0001]本申请涉及网络多媒体领域,尤其涉及一种场景划分和内容检测的方法和系统。

技术介绍

[0002]现有网络中存在大量场景信息、非常丰富的视频数据,一段视频中常常剪辑有多个完全不同的场景,在不同场景中检测视频内容是否合法,需要调用不同的检测算法,给处理环节带来了大量的负担,增加了运算量。同时,能否准确划分出不同场景的边界线,也是提高检测精度的重要点。
[0003]因此,急需一种针对性的场景划分和内容检测的的方法和系统。

技术实现思路

[0004]本专利技术的目的在于提供一种场景划分和内容检测的方法和系统,通过提取多媒体数据中的多种特征,生成第一向量矩阵,将其输入到状态链模型,得到显性特征分布区域,进而确定出需要的隐性特征分布区域的语义特征集合,将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,计算确定出不同场景划分的分界线,实现精确地分段内容检测。
[0005]第一方面,本申请提供一种场景划分和内容检测的方法,所述方法包括:
[0006]接收采集终端发送的多媒体数据,从中提取出视觉特征、声音特征和文本特征,将所述视觉特征、声音特征和文本特征按照预设的规则生成第一向量矩阵;
[0007]将所述第一向量矩阵输入到状态链模型,根据预设的概率密度函数,确定所述多媒体数据对应的显性特征分布区域,得出可能的隐性特征分布区域,提取所述可能的隐性特征分布区域中的多个第二向量矩阵,分解所述第二向量矩阵得到隐性特征
[0008]语义分析上述隐性特征,得到多个待定语义特征,并计算所述多个待定语义特征之间的相关度,去除其中相关度低于阈值的待定语义特征,确定所述多媒体数据对应的语义特征集合;
[0009]将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式,经由神经网络模型计算该条件概率公式,计算得到最优的第二向量矩阵;
[0010]根据所述最优的第二向量矩阵之间的分布情况,确定不同场景划分的分界线,根据所述分界线将多媒体数据划分为不同的场景段,依次进行语义分析,得到对应不同场景段的语义标签;
[0011]根据所述语义标签,调用不同的内容检测算法,对所述语义标签对应的场景段进行内容检测。
[0012]结合第一方面,在第一方面第一种可能的实现方式中,所述语义分析还包括聚类操作,对同一类的场景段集中分析。
[0013]结合第一方面,在第一方面第二种可能的实现方式中,所述接收采集终端发送的
多媒体数据流包括对所述多媒体数据流的编解码。
[0014]结合第一方面,在第一方面第三种可能的实现方式中,所述语义分析采用神经网络模型。
[0015]第二方面,本申请提供一种场景划分和内容检测的系统,所述系统包括处理器以及存储器:
[0016]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0017]所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。
[0018]第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。
[0019]有益效果
[0020]本专利技术提供一种场景划分和内容检测的方法和系统,由于通过状态链模型,确定出需要的语义特征集合,输入计算函数,同时引入状态链模型的概率密度参数,计算确定出不同场景划分的分界线,从而可以实现精确地分段内容检测,不同的场景段分别调用不同的内容检测算法,提高了检测精度,也减少了运算量。
附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本专利技术方法的流程图。
具体实施方式
[0023]下面结合附图对本专利技术的优选实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。
[0024]图1为本申请提供的一种场景划分和内容检测的方法的流程图,包括:
[0025]接收采集终端发送的多媒体数据,从中提取出视觉特征、声音特征和文本特征,将所述视觉特征、声音特征和文本特征按照预设的规则生成第一向量矩阵;
[0026]将所述第一向量矩阵输入到状态链模型,根据预设的概率密度函数,确定所述多媒体数据对应的显性特征分布区域,得出可能的隐性特征分布区域,提取所述可能的隐性特征分布区域中的多个第二向量矩阵,分解所述第二向量矩阵得到隐性特征;
[0027]语义分析上述隐性特征,得到多个待定语义特征,并计算所述多个待定语义特征之间的相关度,去除其中相关度低于阈值的待定语义特征,确定所述多媒体数据对应的语义特征集合;
[0028]将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式,经由神经网络模型计算该条件概率公式,计算得到最优的第二向量矩阵;
[0029]根据所述最优的第二向量矩阵之间的分布情况,确定不同场景划分的分界线,根据所述分界线将多媒体数据划分为不同的场景段,依次进行语义分析,得到对应不同场景
段的语义标签;
[0030]根据所述语义标签,调用不同的内容检测算法,对所述语义标签对应的场景段进行内容检测。
[0031]在一些优选实施例中,所述语义分析还包括聚类操作,对同一类的场景段集中分析。
[0032]在一些优选实施例中,所述接收采集终端发送的多媒体数据流包括对所述多媒体数据流的编解码。
[0033]在一些优选实施例中,所述语义分析采用神经网络模型。
[0034]本申请提供一种场景划分和内容检测的系统,所述系统包括:所述系统包括处理器以及存储器:
[0035]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0036]所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。
[0037]本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所有实施例中任一项所述的方法。
[0038]具体实现中,本专利技术还提供一种计算机存储介质,其中,该计算机存储介质可以存储有程序,该程序执行时可包括本专利技术各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称:ROM)或随机存储记忆体(简称:RAM)等。
[0039]本领域的技术人员可以清楚地了解到本专利技术实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本专利技术实施例中的技术方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种场景划分和内容检测的方法,其特征在于,所述方法包括:接收采集终端发送的多媒体数据,从中提取出视觉特征、声音特征和文本特征,将所述视觉特征、声音特征和文本特征按照预设的规则生成第一向量矩阵;将所述第一向量矩阵输入到状态链模型,根据预设的概率密度函数,确定所述多媒体数据对应的显性特征分布区域,得出可能的隐性特征分布区域,提取所述可能的隐性特征分布区域中的多个第二向量矩阵,分解所述第二向量矩阵得到隐性特征;语义分析上述隐性特征,得到多个待定语义特征,并计算所述多个待定语义特征之间的相关度,去除其中相关度低于阈值的待定语义特征,确定所述多媒体数据对应的语义特征集合;将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,得到所述第二向量矩阵到所述第一向量矩阵的条件概率公式,经由神经网络模型计算该条件概率公式,计算得到最优的第二向量矩阵;根据所述最优的第二向量矩阵之间的分布情况,确定不同场景划分的分界线,根据所述分界线将...

【专利技术属性】
技术研发人员:孙涛孙中民
申请(专利权)人:天津市国瑞数码安全系统股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1