一种视频数据处理方法、计算机设备及可读存储介质技术

技术编号：28980069 阅读：13 留言：0更新日期：2021-06-23 09:27

本申请实施例公开了一种视频数据处理方法、计算机设备及可读存储介质，涉及区块链技术及人工智能中视频处理技术，其中，方法包括：从视频数据中获取关键帧图像；基于字符检测模型识别关键帧图像的关键图像特征，对关键图像特征进行字符区域特征匹配，确定关键帧图像中的字符区域；基于图像识别模型对字符区域进行特征提取，根据提取的特征从字符区域中识别关键帧图像的字符数据，将字符数据与字符数据库进行匹配，得到字符区域的字符检测结果；若字符检测结果为字符数据与字符数据库匹配的结果，则获取与字符数据匹配的目标字符串，将目标字符串的数据类别确定为视频数据的视频类别。采用本申请实施例，可以提高数据检测的效率及准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频数据处理方法、计算机设备及可读存储介质
本申请涉及视频处理
，尤其涉及一种视频数据处理方法、计算机设备及可读存储介质。
技术介绍
用户可以录制视频数据并将视频数据上传至社交平台，以便于其他用户查看互动。一些社交平台为保护原创用户的版权，通过在用户上传的视频数据中添加水印，以避免非法用户恶意盗取他人原创视频进行上传。因此，通过对用户上传的视频数据进行检测，从而确定视频数据中是否包括水印，以此判断上传该视频数据是否侵犯他人版权是亟待解决的问题。现有视频数据检测的方法一般是只针对视频数据中的特定位置，例如左上角、左下角、右上角以及右下角位置进行检测确定视频数据中是否包含水印，由于该种方式只针对视频数据的特定位置进行了检测，导致数据检测的准确性较低。
技术实现思路
本申请实施例提供一种视频数据处理方法、计算机设备及可读存储介质，可以提高数据检测的准确性及效率。本申请实施例一方面提供一种视频数据处理方法，包括：从组成视频数据的至少两个视频帧图像中获取关键帧图像；基于字符检测模型识别该关键帧图像的关键图像特征，对该关键图像特征进行字符区域特征匹配，确定该关键帧图像中的字符区域；基于图像识别模型对该字符区域进行特征提取，根据提取到的特征从该字符区域中识别该关键帧图像的字符数据，将该关键帧图像的字符数据与字符数据库进行字符匹配，得到该关键帧图像中的字符区域的字符检测结果；若该字符检测结果为该字符数据与该字符数据库匹配的结果，则从该字符数据库中获取与该字...

【技术保护点】
1.一种视频数据处理方法，其特征在于，包括：/n从组成视频数据的至少两个视频帧图像中获取关键帧图像；/n基于字符检测模型识别所述关键帧图像的关键图像特征，对所述关键图像特征进行字符区域特征匹配，确定所述关键帧图像中的字符区域；/n基于图像识别模型对所述字符区域进行特征提取，根据提取到的特征从所述字符区域中识别所述关键帧图像的字符数据，将所述关键帧图像的字符数据与字符数据库进行字符匹配，得到所述关键帧图像中的字符区域的字符检测结果；/n若所述字符检测结果为所述字符数据与所述字符数据库匹配的结果，则从所述字符数据库中获取与所述字符数据匹配的目标字符串，将所述目标字符串对应的数据类别确定为所述视频数据所属的视频类别。/n

【技术特征摘要】
1.一种视频数据处理方法，其特征在于，包括：
从组成视频数据的至少两个视频帧图像中获取关键帧图像；
基于字符检测模型识别所述关键帧图像的关键图像特征，对所述关键图像特征进行字符区域特征匹配，确定所述关键帧图像中的字符区域；
基于图像识别模型对所述字符区域进行特征提取，根据提取到的特征从所述字符区域中识别所述关键帧图像的字符数据，将所述关键帧图像的字符数据与字符数据库进行字符匹配，得到所述关键帧图像中的字符区域的字符检测结果；
若所述字符检测结果为所述字符数据与所述字符数据库匹配的结果，则从所述字符数据库中获取与所述字符数据匹配的目标字符串，将所述目标字符串对应的数据类别确定为所述视频数据所属的视频类别。

2.根据权利要求1所述的方法，其特征在于，所述从组成视频数据的至少两个视频帧图像中获取关键帧图像，包括：
将所述至少两个视频帧图像中的第i个视频帧图像与第(i+1)个视频帧图像进行图像特征匹配，得到所述第i个视频帧图像与所述第(i+1)个视频帧图像之间的相似度；i为正整数；
若所述第i个视频帧图像与所述第(i+1)个视频帧图像之间的相似度小于所述视频相似阈值，则将所述第(i+1)个视频帧图像确定为所述视频数据的关键帧图像，将所述第(i+1)个视频帧图像与第(i+2)个视频帧图像进行图像特征匹配，得到所述第(i+1)个视频帧图像与所述第(i+2)个视频帧图像之间的相似度；
若所述第i个视频帧图像与所述第(i+1)个视频帧图像之间的相似度大于或等于视频相似阈值，则将所述第(i+1)个视频帧图像与所述第(i+2)个视频帧图像进行图像特征匹配，得到所述第(i+1)个视频帧图像与所述第(i+2)个视频帧图像之间的相似度；
直至所述第(i+2)个视频帧图像为所述至少两个视频帧图像的最后一个视频帧图像时，得到所述视频数据的关键帧图像。

3.根据权利要求1所述的方法，其特征在于，所述基于字符检测模型识别所述关键帧图像的关键图像特征，对所述关键图像特征进行字符区域特征匹配，确定所述关键帧图像中的字符区域，包括：
基于所述字符检测模型中的卷积层对所述关键帧图像进行特征提取，得到所述关键帧图像的关键图像特征；
对所述关键图像特征进行特征拼接，得到所述关键帧图像对应的拼接特征图像；所述拼接特征图像中的像素点的像素值用于表示对应关键帧图像中的像素点为字符的概率；
获取所述拼接特征图像中每个像素值所属的概率范围，根据所述每个像素值所属的概率范围生成概率图像及字符边框图像；
对所述概率图像及所述字符边框图像进行特征融合，生成融合字符图像，基于所述融合字符图像确定所述关键帧图像中的字符区域。

4.根据权利要求1所述的方法，其特征在于，所述基于图像识别模型对所述字符区域进行特征提取，根据提取到的特征从所述字符区域中识别所述关键帧图像的字符数据，包括：
基于所述图像识别模型中的卷积层对所述字符区域进行特征提取，得到所述字符区域对应的卷积特征，对所述字符区域对应的卷积特征进行序列化处理，得到所述字符区域对应的特征序列；
基于所述图像识别模型中的循环层对所述特征序列进行识别处理，确定所述特征序列对应的序列字符特征；
基于所述图像识别模型中...

【专利技术属性】
技术研发人员：尚焱，李松南，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人