一种视频文件的检测方法、装置及计算设备制造方法及图纸

技术编号：42620701 阅读：27 留言：0更新日期：2024-09-06 01:25

本申请公开了一种视频文件的检测方法、装置及计算设备。其中，方法包括：对待检测视频文件进行模态分离得到图像数据和音频数据，并将音频数据转换为对应的文本数据；提取图像数据的图像特征、音频数据的音频特征和文本数据的文本特征；图像特征、音频特征和文本特征中的至少一项通过多个不同卷积层层数的卷积神经网络模型提取得到；分别根据图像特征、音频特征和文本特征分别得到图像检测结果、音频检测结果和文本检测结果；根据图像检测结果、音频检测结果和文本检测结果得到待检测视频文件的检测结果。通过采用不同卷积层层数的神经网络模型提取图像特征、音频数据的音频特征和文本数据，可避免对应的特征丢失，提高视频文件的检测效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，特别是涉及一种视频文件的检测方法、装置及计算设备。

技术介绍

1、随着智能手机的普及、网络技术，例如无线网络的日益成熟，越来越多的移动用户选择通过移动用户终端以无线方式进行上网。然而，现有的无线语音通话和短信交流方式已经不能满足人们的需求，视频语音聊天业务越来越被人们所青睐。但是视频语音聊天的视频文件中可能会包括伪造信息，所以需要对视频文件进行检测。

2、视频语音聊天的视频文件包括图像数据、音频数据和文本数据。相关技术中，通常针对图像数据、音频数据或文本数据中的一种对视频文件进行检测并得到检测结果，并且在进行特征提取时，通常采用特定卷积层层数的神经网络模型提取图像特征、音频特征或文本特征，导致图像特征、音频特征或文本特征部分丢失，进而导致视频文件的检测精度降低。

技术实现思路

1、基于上述问题，本申请提供了一种视频文件的检测方法、装置及计算设备，提高视频文件的检测精度。

2、本申请实施例公开了如下技术方案：

3、第一方面，本申请实施例提...

【技术保护点】

1.一种视频文件的检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述提取所述图像数据的图像特征、所述音频数据的音频特征和所述文本数据的文本特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述卷积层的层数包括一层和多层，所述通过多个不同卷积层层数的卷积神经网络模型分别对所述图像数据进行特征提取，得到对应的所述音频数据的第一音频特征，包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述音频特征和/或所述文本特征通过多个不同卷积层层数的卷积神经网络模型提取得到，通过RetinaFace的人脸检测架构提取所...

【技术特征摘要】

1.一种视频文件的检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述提取所述图像数据的图像特征、所述音频数据的音频特征和所述文本数据的文本特征，包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述音频特征和/或所述文本特征通过多个不同卷积层层数的卷积神经网络模型提取得到，通过retinaface的人脸检测架构提取所述图像数据的图像特征。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述图像特征和/或所述...

【专利技术属性】
技术研发人员：吴晓姝，陈闯，李凡，揭志鹏，
申请(专利权)人：东软集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人