异常视频的识别方法及其装置、电子设备及存储介质制造方法及图纸

技术编号:38901907 阅读:8 留言:0更新日期:2023-09-22 14:20
本发明专利技术公开了一种异常视频的识别方法及其装置、电子设备及存储介质,涉及人工智能领域,其中,该识别方法包括:接收目标视频,并对目标视频进行处理,得到视频帧数组,对视频帧数组中的每个视频帧进行特征提取,得到目标视频的视频特征,对视频特征进行扩充,得到M个增强片段特征,基于视频特征以及增强片段特征,确定目标视频的异常分数,并在异常分数大于预设异常阈值的情况下,确定目标视频为异常视频。本发明专利技术解决了相关技术中识别异常视频的准确性较低的技术问题。确性较低的技术问题。确性较低的技术问题。

【技术实现步骤摘要】
异常视频的识别方法及其装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,具体而言,涉及一种异常视频的识别方法及其装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展和进步,使得金融机构业务正在向智能化、轻型化和社区化过渡,金融机构网点将具有面积小、人员少、成本低、业态灵活和多渠道融合等特点。随着金融机构网点社区化进程的建设,越来越多不同角色的用户进入网点享受服务,除了办理传统业务的用户外,还会有不同职业、不同年龄阶段的用户进入网点享受社区化服务。而逐渐轻型化建设的网点在应对突发异常情况时,会存在应对人员不足、采取措施不专业等问题。
[0003]提前对异常情况进行识别,并向员工进行相应的提示和预警,可以提高金融机构网点对异常情况的应急应对能力。手动监控和分析每一台监控摄像头是极其耗费人力和时间的。因此,迫切需要开发智能视频监控系统来自动完成各种视频监控任务,例如,目标检测和重新识别、动作识别、视频摘要以及异常检测。视频异常检测是作为智能视频监控系统的重要组成部分,可以用来识别监控视频中的突发事件。
[0004]相关技术中,基于深度学习的视频异常行为识别将视频转换为单帧的图像并提取每帧图像之间的光流信息以此作为神经网络的两个输入,并使用神经网络提取图像的空间信息和运动信息,在获得视频的空间信息和运动信息后,再使用长短时记忆网络(Long Short

Term Memory Network,简称LSTM)、卷积神经网络(Convolutional Neural Network,简称CNN)或实时多域卷积神经网络(Real

Time Multi

Domain Convolutional Neural Network,简称RT

MDNet)等对行为进行分类,以此来实现对正常行为和异常行为的分类与识别。
[0005]然而,相关技术中需要依赖正常事件和异常事件作为输入,来构造、训练和验证人工智能模型。由于现实环境中异常事件的模糊性和稀缺性,准确界定正常事件与异常事件之间的界限是不可行的。因此,相关技术中的机器学习模型在实现异常事件的预测和检测时受制于异常事件的稀缺性很难得到完整的训练。由于异常事件的零星发生,为完全训练模型收集足够的异常事件是一项艰巨的任务。
[0006]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0007]本专利技术实施例提供了一种异常视频的识别方法及其装置、电子设备及存储介质,以至少解决相关技术中识别异常视频的准确性较低的技术问题。
[0008]根据本专利技术实施例的一个方面,提供了一种异常视频的识别方法,包括:接收目标视频,并对所述目标视频进行处理,得到视频帧数组,其中,所述视频帧数组包括:N个视频帧,N为正整数;对所述视频帧数组中的每个所述视频帧进行特征提取,得到所述目标视频
的视频特征;对所述视频特征进行扩充,得到M个增强片段特征,其中,M为正整数;基于所述视频特征以及所述增强片段特征,确定所述目标视频的异常分数,并在所述异常分数大于预设异常阈值的情况下,确定所述目标视频为异常视频。
[0009]可选地,所述识别方法还包括:构建初始识别模型,其中,所述初始识别模型的结构包括:预设编码器、预设监督模块、预设对比学习模块,所述预设编码器用于处理输入的视频,得到数组;所述预设监督模块用于处理输入的所述数组,得到视频特征;所述预设对比学习模块用于处理输入的所述视频特征,得到所述视频的预测值;采集历史时间段内的历史视频集合,得到训练数据,其中,所述训练数据包括:L个正常视频样本、至少一个异常视频样本,L为正整数,所述正常视频样本对应有第一真值,所述异常视频样本对应有第二真值;采用所述训练数据训练所述初始识别模型,直到目标损失值在经过预设次数计算后都为相同的值且预测误差小于预设误差阈值,得到训练完成的预设识别模型,其中,目标损失值是通过目标损失函数计算得到的,所述预测误差是视频样本的真值与预测值之间的绝对差值,所述视频样本包括:正常视频样本、异常视频样本,所述预设识别模型用于识别输入的视频是否为异常视频。
[0010]可选地,在采用所述训练数据训练所述初始识别模型的过程中,还包括:基于所述异常视频样本,进行异常样本扩充,得到K个异常样本,其中,K为正整数,K与L相等,所述异常样本用于扩充所述训练数据,所述异常样本对应有第三真值;基于所述正常视频样本的所述第一真值、第一预测值以及所述异常样本的所述第三真值、第二预测值,采用所述目标损失函数计算所述目标损失值,其中,所述第一预测值是所述初始识别模型对所述正常视频样本的处理结果值,所述第二预测值是所述初始识别模型对所述异常样本的处理结果值;基于所述正常视频样本的所述第一真值、所述第一预测值以及所述异常样本的所述第三真值、所述第二预测值,采用预设峰值信噪比计算所述预测误差。
[0011]可选地,在采用所述目标损失函数计算所述目标损失值之前,还包括:构建第一损失函数、第二损失函数、第三损失函数;基于预设参数、所述第一损失函数、所述第二损失函数以及所述第三损失函数,构建所述目标损失函数。
[0012]可选地,所述第一损失函数通过以下方式构建:基于所述视频样本中每个所述视频帧的宽度与高度、所述视频样本的所述真值以及所述预测值,构建预设强度函数;基于所述视频样本中每个所述视频帧的宽度与高度、所述视频样本的所述真值以及所述预测值、第一参数以及第二参数,构建预设梯度函数,其中,所述第一参数以及所述第二参数是预先设置的参数;基于所述预设强度函数以及所述预设梯度函数,构建所述第一损失函数。
[0013]可选地,所述第二损失函数通过以下方式构建:确定所述视频样本的样本数量以及类别数量;提取每个所述视频样本的视频特征,其中,所述视频特征对应有预设编码;构建与所述视频特征对应的归一化变量;基于所述样本数量、所述类别数量、所述预设编码以及所述归一化变量,构建所述第二损失函数。
[0014]可选地,所述第三损失函数通过以下方式构建:确定所述正常视频样本、所述异常样本之间的内积;基于所述样本数量、所述类别数量、第三参数以及所述内积,构建所述第三损失函数。
[0015]可选地,基于所述视频特征以及所述增强片段特征,确定所述目标视频的异常分数的步骤,包括:确定所述视频特征中每一个所述视频帧的预测值,其中,所述视频特征对
应有视频类型,所述视频类型对应有比值分数,所述视频类型是通过预设识别模型识别得到的;基于所有所述预测值,确定第一分数;确定每两个所述增强片段特征之间的相似度值,并基于所有所述相似度值,确定第二分数;基于所述第一分数、所述第二分数以及第三分数,确定所述目标视频的所述异常分数,其中,所述第三分数是所述视频特征对应的所述比值分数。
[0016]根据本专利技术实施例的另一方面,还提供了一种异常视频的识别装置,包括:接收单元,用于接收目标视频,并对所述目标视频进行处理,得到视频帧数组本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常视频的识别方法,其特征在于,包括:接收目标视频,并对所述目标视频进行处理,得到视频帧数组,其中,所述视频帧数组包括:N个视频帧,N为正整数;对所述视频帧数组中的每个所述视频帧进行特征提取,得到所述目标视频的视频特征;对所述视频特征进行扩充,得到M个增强片段特征,其中,M为正整数;基于所述视频特征以及所述增强片段特征,确定所述目标视频的异常分数,并在所述异常分数大于预设异常阈值的情况下,确定所述目标视频为异常视频。2.根据权利要求1所述的识别方法,其特征在于,所述识别方法还包括:构建初始识别模型,其中,所述初始识别模型的结构包括:预设编码器、预设监督模块、预设对比学习模块,所述预设编码器用于处理输入的视频,得到数组;所述预设监督模块用于处理输入的所述数组,得到视频特征;所述预设对比学习模块用于处理输入的所述视频特征,得到所述视频的预测值;采集历史时间段内的历史视频集合,得到训练数据,其中,所述训练数据包括:L个正常视频样本、至少一个异常视频样本,L为正整数,所述正常视频样本对应有第一真值,所述异常视频样本对应有第二真值;采用所述训练数据训练所述初始识别模型,直到目标损失值在经过预设次数计算后都为相同的值且预测误差小于预设误差阈值,得到训练完成的预设识别模型,其中,目标损失值是通过目标损失函数计算得到的,所述预测误差是视频样本的真值与预测值之间的绝对差值,所述视频样本包括:正常视频样本、异常视频样本,所述预设识别模型用于识别输入的视频是否为异常视频。3.根据权利要求2所述的识别方法,其特征在于,在采用所述训练数据训练所述初始识别模型的过程中,还包括:基于所述异常视频样本,进行异常样本扩充,得到K个异常样本,其中,K为正整数,K与L相等,所述异常样本用于扩充所述训练数据,所述异常样本对应有第三真值;基于所述正常视频样本的所述第一真值、第一预测值以及所述异常样本的所述第三真值、第二预测值,采用所述目标损失函数计算所述目标损失值,其中,所述第一预测值是所述初始识别模型对所述正常视频样本的处理结果值,所述第二预测值是所述初始识别模型对所述异常样本的处理结果值;基于所述正常视频样本的所述第一真值、所述第一预测值以及所述异常样本的所述第三真值、所述第二预测值,采用预设峰值信噪比计算所述预测误差。4.根据权利要求3所述的识别方法,其特征在于,在采用所述目标损失函数计算所述目标损失值之前,还包括:构建第一损失函数、第二损失函数、第三损失函数;基于预设参数、所述第一损失函数、所述第二损失函数以及所述第三损失函数,构建所述目标损失函数。5.根据权利要求4所述的识别方法,其特征在于,所述第一损失函数通过以下方式构建:基于所述视频样本中每个所述视频帧的...

【专利技术属性】
技术研发人员:陈志金李一樊王旭蒋宏伟
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1