一种事件检测方法及装置制造方法及图纸

技术编号:34574202 阅读:21 留言:0更新日期:2022-08-17 13:06
本申请涉及图像信息处理技术领域,特别涉及一种事件检测方法及装置,用于解决现有技术中目标信息识别不准确导致事件检测结果准确率低的问题。该方法为:识别待检测视频中的事件,获得所述事件的事件类型;根据所述事件类型确定所述待检测视频中事件的事件位置,所述事件位置包括所述事件的事件发生区域以及电子围栏区域;事件发生区域用于表征事件发生在采集设备所拍摄空间的三维空间位置,电子围栏区域为在事件发生区域基础上扩大设定大小的区域;根据所述待检测视频中的所述事件发生区域,识别所述事件的参与对象,并根据所述待检测视频中的所述电子围栏区域,识别所述事件的目击对象。目击对象。目击对象。

【技术实现步骤摘要】
一种事件检测方法及装置


[0001]本申请涉及图像信息处理
,尤其涉及一种事件检测方法及装置。

技术介绍

[0002]随着当前社会对社会治安、城市大脑等智能化技术的重视,对于监控视频画面中的事件理解或检测变得尤为重要。目前对于事件检测方法是通过目标确定事件的,即先确定待检视频包括的所有目标信息,进而通过视频包括的所有目标信息确定待检测视频中的事件。然而视频包括的目标信息中,有些目标是与事件检测无关的,因此通过目标确定事件的检测方法一定程度上降低了事件的检测效率。此外,当目标信息识别不准确时,会导致事件检测结果的准确率降低。

技术实现思路

[0003]本申请实施例提供了一种事件检测方法及装置,用以解决现有技术中目标信息识别不准确导致事件检测结果准确率低的问题。
[0004]第一方面,本申请实施例提供了一种事件检测方法,包括:识别待检测视频中的事件,获得所述事件的事件类型;根据所述事件类型确定所述待检测视频中事件的事件位置,所述事件位置包括所述事件的事件发生区域以及电子围栏区域;所述事件发生区域用于表征所述事件发生在采集设备所拍摄空间的三维空间位置,所述电子围栏区域为在所述事件发生区域基础上扩大设定大小的区域;根据所述待检测视频中的所述事件发生区域,识别所述事件的参与对象,并根据所述待检测视频中的所述电子围栏区域,识别所述事件的目击对象。
[0005]基于上述方案,用事件确定目标而非用目标确定事件,可以筛选事件的参与对象和与事件目击对象,为事件调查与分析提供可靠依据。对事件发生后电子围栏区域内的目标进行识别,筛选参与对象或目击对象,可以减少目标检测的工作量,并提高事件检测的检测效率。此外,只对事件位置进行检测,可以提高目标检测的检测精度。
[0006]一种可能的实现方式中,所述方法还包括:确定所述待检测视频中事件的时间边界,所述时间边界用于表述所述待检测视频中所发生事件的起始时间和结束时间;所述根据所述事件类型确定所述待检测视频中事件的事件位置,包括:根据所述时间边界确定所述待检测视频中的视频段;根据所述事件类型确定所述视频段中所述事件的事件位置。
[0007]基于上述方案,在进行事件检测时,可以直接获得事件的起始时间与结束时间,并通过事件类型、事件的起始时间与结束时间可以进一步确定事件位置。
[0008]一种可能的实现方式中,所述识别待检测视频中的事件,以及确定所述待检测视频中所述事件的时间边界,包括:将所述待检测视频作为第一神经网络的输入,以通过所述第一神经网络输出所述事件类型以及所述时间边界;所述根据所述事件类型确定所述待检测视频中事件的事件位置,包括:将所述待检测视频、所述事件类型以及所述时间边界作为第二神经网络的输入,以通过所述第二神经网络输出所述事件位置;所述根据所述待检测
视频中的所述事件发生区域,识别所述事件的参与对象,并根据所述待检测视频中的所述电子围栏区域,识别所述事件的目击对象,包括:将所述待检测视频、所述事件位置作为第三神经网络的输入,以通过所述第三神经网络输出所述事件的参与对象以及目击对象。
[0009]一种可能的实现方式中,所述事件发生区域通过所述事件发生的立方体空间映射到所述待检测视频包括的视频帧中的像素位置指示;所述事件发生区域满足如下公式所示的条件:;其中,Space用于指示所述事件发生区域,表示所述立方体空间底面的四个顶点分别映射的像素点位置,表示所述立方体空间顶面的四个顶点分别映射的像素点位置。
[0010]一种可能的实现方式中,所述电子围栏区域为以所述立方体空间底面的中心点为中心,对所述底面等比例放大设定倍数后得到的区域。
[0011]基于上述方案,在事件检测时可以直接确定待检测视频所发生事件的事件发生区域以及电子围栏区域,进而可以通过在区域内进行目标检测,降低了目标检测的计算量,提高了目标检测的检测效率。
[0012]一种可能的实现方式中,所述第一神经网络、所述第二神经网络以及所述第三神经网络构成神经网络模型,所述神经网络模型是基于训练样本集训练得到的;所述训练样本集包括多个视频以及所述多个视频分别对应的视频理解结果和目标检测结果,第一视频的视频理解结果包括所述第一视频中所发生事件的事件类型、时间边界、事件发生区域和电子围栏区域,所述第一视频为所述多个视频中的任一视频,所述第一视频的目标检测结果包括所述第一视频中所发生事件的参与对象和目击对象。
[0013]一种可能的实现方式中,所述方法还包括:通过如下方式训练所述神经网络模型:将所述第一视频输入所述第一神经网络,以通过所述第一神经网络输出所述第一视频中所发生事件的预测事件类型和预测时间边界,根据所述预测事件类型与所述训练样本集中所述第一视频所对应的事件类型之间的损失,以及所述预测时间边界与所述训练样本集中所述第一视频对应的时间边界之间的损失确定第一损失值;将所述第一视频、所述预测事件类型以及所述预测时间边界输入所述第二神经网络,以通过所述第二神经网络输出预测事件发生区域和预测电子围栏区域,根据所述预测事件发生区域与所述训练样本集中所述第一视频所对应的事件发生区域之间的损失,以及所述预测电子围栏区域与所述训练样本集中所述第一视频所对应的电子围栏区域之间的损失确定第二损失值;将所述第一视频、所述预测事件发生区域和所述预测电子围栏区域输入第三神经网络,以通过所述第三神经网络输出预测参与对象和预测目击对象,根据所述预测参与对象与所述训练样本集中所述第一视频所发生事件的参与对象之间的损失,以及所述预测目击对象与所述训练样本集中所述第一视频所发生事件的目击对象之间的损失确定第三损失值;对所述第一损失值、所述第二损失值和所述第三损失值进行加权获得第四损失值;
根据所述第四损失值分别对所述第一神经网络的网络参数、所述第二神经网络的网络参数以及所述第三神经网络的网络参数进行调整,以得到所述神经网络模型。
[0014]基于上述方案,在网络结构上采用相互融合的方式,各个神经网络之间相互约束,可以提高事件检测的准确率。
[0015]一种可能的实现方式中,所述方法还包括:输出事件检测结果,所述事件检测结果包括所述事件类型、所述时间边界、所述事件位置、所述参与对象和所述目击对象。
[0016]第二方面,本申请实施例提供了一种事件检测装置,包括:第一识别模块,用于识别待检测视频中的事件,获得所述事件的事件类型;第一处理模块,用于根据所述事件类型确定所述待检测视频中事件的事件位置,所述事件位置包括所述事件的事件发生区域以及电子围栏区域;所述事件发生区域用于表征所述事件发生在采集设备所拍摄空间的三维空间位置,所述电子围栏区域为在所述事件发生区域基础上扩大设定大小的区域;第二识别模块,用于根据所述待检测视频中的所述事件发生区域,识别所述事件的参与对象,并根据所述待检测视频中的所述电子围栏区域,识别所述事件的目击对象。
[0017]一些实施例中,所述第一处理模块还用于:确定所述待检测视频中所述事件的时间边界,所述时间边界用于表述所述待检测视频中所发生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件检测方法,其特征在于,包括:识别待检测视频中的事件,获得所述事件的事件类型;根据所述事件类型确定所述待检测视频中事件的事件位置,所述事件位置包括所述事件的事件发生区域以及电子围栏区域;所述事件发生区域用于表征所述事件发生在采集设备所拍摄空间的三维空间位置,所述电子围栏区域为在所述事件发生区域基础上扩大设定大小的区域;根据所述待检测视频中的所述事件发生区域,识别所述事件的参与对象,并根据所述待检测视频中的所述电子围栏区域,识别所述事件的目击对象。2.如权利要求1所述的方法,其特征在于,所述方法还包括:确定所述待检测视频中所述事件的时间边界,所述时间边界用于表述所述待检测视频中发生所述事件的起始时间和结束时间;所述根据所述事件类型确定所述待检测视频中事件的事件位置,包括:根据所述时间边界确定所述待检测视频中的视频段;根据所述事件类型确定所述视频段中所述事件的事件位置。3.如权利要求2所述的方法,其特征在于,所述识别待检测视频中的事件,以及确定所述待检测视频中所述事件的时间边界,包括:将所述待检测视频作为第一神经网络的输入,以通过所述第一神经网络输出所述事件类型以及所述时间边界;所述根据所述事件类型确定所述待检测视频中事件的事件位置,包括:将所述待检测视频、所述事件类型以及所述时间边界作为第二神经网络的输入,以通过所述第二神经网络输出所述事件位置;所述根据所述待检测视频中的所述事件发生区域,识别所述事件的参与对象,并根据所述待检测视频中的所述电子围栏区域,识别所述事件的目击对象,包括:将所述待检测视频、所述事件位置作为第三神经网络的输入,以通过所述第三神经网络输出所述事件的参与对象以及目击对象。4.如权利要求3所述的方法,其特征在于,所述事件发生区域通过所述事件发生的立方体空间映射到所述待检测视频包括的视频帧中的像素位置指示;所述事件发生区域满足如下公式所示的条件:;其中,Space用于指示所述事件发生区域,表示所述立方体空间底面的四个顶点分别映射的像素点位置,表示所述立方体空间顶面的四个顶点分别映射的像素点位置。5.如权利要求4所述的方法,其特征在于,所述电子围栏区域为以所述立方体空间底面的中心点为中心,对所述底面等比例放大设定倍数后得到的区域。6.如权利要求3

5任一项所述的方法,其特征在于,所述第一神经网络、所述第二神经网络以及所述第三神经网络构成神经网络模型,所述神经网络模型是基于训练样本集训练得到的;所述训练样本集包括多个视频以及所述多个视频分别对应的视频理解结果和目标检
测结果,第一视频的视频理解结果包括所述第一视频中所发生事件的事件类型、时间边界、事件发生区域和电子围栏区域,所述第一视频为所述多个视频中的任一视频,所述第一视频的目标检测结果包括所述第一视频中所...

【专利技术属性】
技术研发人员:刘智辉余言勋杜治江牛中彬黄宇杨雪峰
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1