一种视频的识别方法、系统、电子设备以及存储介质技术方案

技术编号：36085512 阅读：11 留言：0更新日期：2022-12-24 11:00

本申请实施例提供一种视频的识别方法、装置、电子设备以及存储介质，对采集到的视频信号进行音视频分离，分别获取音频信号和视频信号；其中所述视频信号包括待验证对象；对所述音频信号和所述视频信号进行特征提取，获得所述音频信号对应的音频特征和所述视频信号对应的视频特征；将所述音频特征和所述视频特征输入预先训练好的神经网络中，获得所述神经网络输出的识别结果；其中，所述识别结果用于表征所述视频信号是否为所述待验证对象在中介指导下完成。本技术方案可以实现对于人脸识别的对象是否在中介指导下完成的情况进行判断。的对象是否在中介指导下完成的情况进行判断。的对象是否在中介指导下完成的情况进行判断。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频的识别方法、系统、电子设备以及存储介质

[0001]本申请涉及人脸识别领域，具体而言，设计一种视频的识别方法、系统、电子设备以及存储介质。

技术介绍

[0002]在金融行业中，常涉及到个人信息的验证，因此人脸识别技术被广泛应用。在现有技术中，对于人脸识别的真伪性问题，其关注的重点在于人脸识别的图像是否是真人，以及是否是同一个人。
[0003]在当前技术中，人脸识别并未关注人脸识别的人是否是处于自然状态下而进行自愿的人脸识别，所谓自然状态下的人脸识别是指并非是在利益相关的中介人士的诱导下进行非本意的人脸识别。现有技术对于人脸识别的真伪性判断较为简单。

技术实现思路

[0004]本申请实施例的目的在于提供一种视频的识别方法，用以解决现有技术中人脸识别无法判断被识别人是否自愿而不是在中介诱导下进行识别的技术问题。
[0005]为了实现上述目的，本申请实施例所提供的技术方案如下所示：
[0006]第一方面，本申请实施例提供一种视频的识别方法，对采集到的音视频信号进行音视频分离，分别获取音频信号和视频信号；其中所述视频信号包括待验证对象；对所述音频信号和所述视频信号进行特征提取，获得所述音频信号对应的音频特征和所述视频信号对应的视频特征；将所述音频特征和所述视频特征输入预先训练好的神经网络中，获得所述神经网络输出的识别结果；其中，所述识别结果用于表征所述视频信号是否为所述待验证对象在中介指导下完成。本技术方案可以实现对于人脸识别的对象是否在中介指导下完成的情况进行判断。
...

【技术保护点】

【技术特征摘要】
1.一种视频的识别方法，其特征在于，包括：对采集到的音视频信号进行音视频分离，分别获取音频信号和视频信号；其中所述视频信号包括待验证对象；对所述音频信号和所述视频信号进行特征提取，获得所述音频信号对应的音频特征和所述视频信号对应的视频特征；将所述音频特征和所述视频特征输入预先训练好的神经网络中，获得所述神经网络输出的识别结果；其中，所述识别结果用于表征所述视频信号是否为所述待验证对象在中介指导下完成。2.根据权利要求1所述的方法，其特征在于，所述音频特征包括所述音频信号中说话人的数量和/或是否包含第一关键词；所述视频特征包括以下至少一项：拍摄角度特征、面部特征和拍摄场景特征。3.根据权利要求2所述的方法，其特征在于，所述对所述音频信号进行特征提取，包括：对所述音频信号进行截取，获得多个音频段；将所述多个音频段进行分类，并根据分类结果确定所述音频信号中说话人的数量；和/或，将所述音频信号中的语音进行识别并转化为文本，并对所述文本进行关键字识别。4.根据权利要求2所述的方法，其特征在于，所述待验证对象为人脸；所述对所述视频信号进行特征提取包括：对所述视频信号进行分帧，获得多帧图像信号；对所述图像信号进行特征提取，获得所述拍摄角度特征、面部特征和拍摄场景特征。5.根据权利要求4所述的方法，其特征在于，所述对所述图像信号进行特征提取，获得所述拍摄角度特征，包括：对所述图像信号进行人脸角度特征提取，获得所述图像信号中人脸的俯角、偏角和滚角；根据所述俯角、所述偏角和所述滚角判断所述人脸是否正对屏幕；和/或，对所述图像信号进行拍摄角度识别，判断所述拍摄角度是否是自拍角度。6.根据权利要求4所述的方法，其特征在于，所述对所述图像信号进行特征提取，获得所述面部特征，包括：获取所述图像信号中的眼部区域和嘴部区域；对所述眼部区域进行特征提取，判断眼部注意力是否集中于屏幕；和/或，对所述嘴部区域进行特征提取，判断嘴部是否...

【专利技术属性】
技术研发人员：王小东，朱羽，吕文勇，周智杰，廖浩，
申请(专利权)人：成都新希望金融信息有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人