一种视频数据处理方法、计算机设备及可读存储介质技术

技术编号:28980069 阅读:13 留言:0更新日期:2021-06-23 09:27
本申请实施例公开了一种视频数据处理方法、计算机设备及可读存储介质,涉及区块链技术及人工智能中视频处理技术,其中,方法包括:从视频数据中获取关键帧图像;基于字符检测模型识别关键帧图像的关键图像特征,对关键图像特征进行字符区域特征匹配,确定关键帧图像中的字符区域;基于图像识别模型对字符区域进行特征提取,根据提取的特征从字符区域中识别关键帧图像的字符数据,将字符数据与字符数据库进行匹配,得到字符区域的字符检测结果;若字符检测结果为字符数据与字符数据库匹配的结果,则获取与字符数据匹配的目标字符串,将目标字符串的数据类别确定为视频数据的视频类别。采用本申请实施例,可以提高数据检测的效率及准确性。

【技术实现步骤摘要】
一种视频数据处理方法、计算机设备及可读存储介质
本申请涉及视频处理
,尤其涉及一种视频数据处理方法、计算机设备及可读存储介质。
技术介绍
用户可以录制视频数据并将视频数据上传至社交平台,以便于其他用户查看互动。一些社交平台为保护原创用户的版权,通过在用户上传的视频数据中添加水印,以避免非法用户恶意盗取他人原创视频进行上传。因此,通过对用户上传的视频数据进行检测,从而确定视频数据中是否包括水印,以此判断上传该视频数据是否侵犯他人版权是亟待解决的问题。现有视频数据检测的方法一般是只针对视频数据中的特定位置,例如左上角、左下角、右上角以及右下角位置进行检测确定视频数据中是否包含水印,由于该种方式只针对视频数据的特定位置进行了检测,导致数据检测的准确性较低。
技术实现思路
本申请实施例提供一种视频数据处理方法、计算机设备及可读存储介质,可以提高数据检测的准确性及效率。本申请实施例一方面提供一种视频数据处理方法,包括:从组成视频数据的至少两个视频帧图像中获取关键帧图像;基于字符检测模型识别该关键帧图像的关键图像特征,对该关键图像特征进行字符区域特征匹配,确定该关键帧图像中的字符区域;基于图像识别模型对该字符区域进行特征提取,根据提取到的特征从该字符区域中识别该关键帧图像的字符数据,将该关键帧图像的字符数据与字符数据库进行字符匹配,得到该关键帧图像中的字符区域的字符检测结果;若该字符检测结果为该字符数据与该字符数据库匹配的结果,则从该字符数据库中获取与该字符数据匹配的目标字符串,将该目标字符串对应的数据类别确定为该视频数据所属的视频类别。本申请实施例另一方面提供一种视频数据处理方法,包括:从组成样本视频数据的至少两个样本视频帧图像中获取样本关键帧图像,获取该样本关键帧图像中的样本区域标签;基于初始字符检测模型识别该样本关键帧图像的样本关键图像特征,对该样本关键图像特征进行字符区域特征匹配,确定该样本关键帧图像中的样本字符区域;基于该样本字符区域与该样本区域标签生成第一损失函数,基于该第一损失函数对该初始字符检测模型进行训练,生成字符检测模型。本申请实施例一方面提供一种视频数据处理装置,包括:图像获取模块,用于从组成视频数据的至少两个视频帧图像中获取关键帧图像;字符识别模块,用于基于字符检测模型识别该关键帧图像的关键图像特征,对该关键图像特征进行字符区域特征匹配,确定该关键帧图像中的字符区域;字符匹配模块,用于基于图像识别模型对该字符区域进行特征提取,根据提取到的特征从该字符区域中识别该关键帧图像的字符数据,将该关键帧图像的字符数据与字符数据库进行字符匹配,得到该关键帧图像中的字符区域的字符检测结果;类别确定模块,用于若该字符检测结果为该字符数据与该字符数据库匹配的结果,则从该字符数据库中获取与该字符数据匹配的目标字符串,将该目标字符串对应的数据类别确定为该视频数据所属的视频类别。可选的,该图像获取模块,包括:图像匹配单元,用于将该至少两个视频帧图像中的第i个视频帧图像与第(i+1)个视频帧图像进行图像特征匹配,得到该第i个视频帧图像与该第(i+1)个视频帧图像之间的相似度;i为正整数;第一图像确定单元,用于若该第i个视频帧图像与该第(i+1)个视频帧图像之间的相似度小于该视频相似阈值,则将该第(i+1)个视频帧图像确定为该视频数据的关键帧图像,将该第(i+1)个视频帧图像与第(i+2)个视频帧图像进行图像特征匹配,得到该第(i+1)个视频帧图像与该第(i+2)个视频帧图像之间的相似度;第二图像确定单元,用于若该第i个视频帧图像与该第(i+1)个视频帧图像之间的相似度大于或等于视频相似阈值,则将该第(i+1)个视频帧图像与该第(i+2)个视频帧图像进行图像特征匹配,得到该第(i+1)个视频帧图像与该第(i+2)个视频帧图像之间的相似度;直至该第(i+2)个视频帧图像为该至少两个视频帧图像的最后一个视频帧图像时,得到该视频数据的关键帧图像。该字符识别模块,包括:特征提取单元,用于基于该字符检测模型中的卷积层对该关键帧图像进行特征提取,得到该关键帧图像的关键图像特征;特征拼接单元,用于对该关键图像特征进行特征拼接,得到该关键帧图像对应的拼接特征图像;该拼接特征图像中的像素点的像素值用于表示对应关键帧图像中的像素点为字符的概率;图像确定单元,用于获取该拼接特征图像中每个像素值所属的概率范围,根据该每个像素值所属的概率范围生成概率图像及字符边框图像;区域确定单元,用于对该概率图像及该字符边框图像进行特征融合,生成融合字符图像,基于该融合字符图像确定该关键帧图像中的字符区域。该字符匹配模块,包括:序列获取单元,用于基于该图像识别模型中的卷积层对该字符区域进行特征提取,得到该字符区域对应的卷积特征,对该字符区域对应的卷积特征进行序列化处理,得到该字符区域对应的特征序列;循环处理单元,用于基于该图像识别模型中的循环层对该特征序列进行识别处理,确定该特征序列对应的序列字符特征;特征转换单元,用于基于该图像识别模型中的转录层对该序列字符特征进行特征转换,得到该关键帧图像的字符数据。可选的,该视频数据中关键帧图像的数量为N个;N为正整数;该字符匹配模块,包括:字符组合单元,用于对该视频数据中的N个关键帧图像的字符数据进行组合,得到组合字符数据;分词确定单元,用于对该组合字符数据进行分词处理,确定该视频数据对应的M个分词字符数据;M为正整数;字符匹配单元,用于将该视频数据对应的M个分词字符数据分别与该字符数据库进行字符匹配,得到k个匹配字符串及该k个匹配字符串分别对应的匹配数量;该匹配数量用于表示该M个分词字符数据中与匹配字符串相匹配的字符数据的数量;k为正整数;结果确定单元,用于若存在该匹配数量大于匹配阈值的匹配字符串,则确定该字符检测结果为该字符数据与该字符数据库匹配的结果;字符确定单元,用于将该匹配数量大于匹配阈值的匹配字符串确定为与该字符数据匹配的目标字符串。可选的,该装置还包括:数据响应模块,用于响应用户终端针对该视频数据的上传请求;数据提示模块,用于若该视频数据所属的视频类别属于标记视频类别,则向该用户终端发送数据上传异常提示;该数据上传异常提示包括视频数据所属的视频类别;数据上传模块,用于若该视频数据所属的视频类别不属于该标记视频类别,则将该视频数据上传至应用程序中。本申请实施例一方面提供另一种视频数据处理装置,包括:区域标签获取模块,用于从组成样本视频数据的至少两个样本视频帧图像中获取样本关键帧图像,获取该样本关键帧图像中的样本区域标签;样本区域确定模块,用于基于初始字符检测模型识别该样本关键帧图像的样本关键图像特征,对该样本关键图像特征进行字符区域特征匹配,确定该样本关键帧图像中的样本字符区域;检测模型生成模块本文档来自技高网...

【技术保护点】
1.一种视频数据处理方法,其特征在于,包括:/n从组成视频数据的至少两个视频帧图像中获取关键帧图像;/n基于字符检测模型识别所述关键帧图像的关键图像特征,对所述关键图像特征进行字符区域特征匹配,确定所述关键帧图像中的字符区域;/n基于图像识别模型对所述字符区域进行特征提取,根据提取到的特征从所述字符区域中识别所述关键帧图像的字符数据,将所述关键帧图像的字符数据与字符数据库进行字符匹配,得到所述关键帧图像中的字符区域的字符检测结果;/n若所述字符检测结果为所述字符数据与所述字符数据库匹配的结果,则从所述字符数据库中获取与所述字符数据匹配的目标字符串,将所述目标字符串对应的数据类别确定为所述视频数据所属的视频类别。/n

【技术特征摘要】
1.一种视频数据处理方法,其特征在于,包括:
从组成视频数据的至少两个视频帧图像中获取关键帧图像;
基于字符检测模型识别所述关键帧图像的关键图像特征,对所述关键图像特征进行字符区域特征匹配,确定所述关键帧图像中的字符区域;
基于图像识别模型对所述字符区域进行特征提取,根据提取到的特征从所述字符区域中识别所述关键帧图像的字符数据,将所述关键帧图像的字符数据与字符数据库进行字符匹配,得到所述关键帧图像中的字符区域的字符检测结果;
若所述字符检测结果为所述字符数据与所述字符数据库匹配的结果,则从所述字符数据库中获取与所述字符数据匹配的目标字符串,将所述目标字符串对应的数据类别确定为所述视频数据所属的视频类别。


2.根据权利要求1所述的方法,其特征在于,所述从组成视频数据的至少两个视频帧图像中获取关键帧图像,包括:
将所述至少两个视频帧图像中的第i个视频帧图像与第(i+1)个视频帧图像进行图像特征匹配,得到所述第i个视频帧图像与所述第(i+1)个视频帧图像之间的相似度;i为正整数;
若所述第i个视频帧图像与所述第(i+1)个视频帧图像之间的相似度小于所述视频相似阈值,则将所述第(i+1)个视频帧图像确定为所述视频数据的关键帧图像,将所述第(i+1)个视频帧图像与第(i+2)个视频帧图像进行图像特征匹配,得到所述第(i+1)个视频帧图像与所述第(i+2)个视频帧图像之间的相似度;
若所述第i个视频帧图像与所述第(i+1)个视频帧图像之间的相似度大于或等于视频相似阈值,则将所述第(i+1)个视频帧图像与所述第(i+2)个视频帧图像进行图像特征匹配,得到所述第(i+1)个视频帧图像与所述第(i+2)个视频帧图像之间的相似度;
直至所述第(i+2)个视频帧图像为所述至少两个视频帧图像的最后一个视频帧图像时,得到所述视频数据的关键帧图像。


3.根据权利要求1所述的方法,其特征在于,所述基于字符检测模型识别所述关键帧图像的关键图像特征,对所述关键图像特征进行字符区域特征匹配,确定所述关键帧图像中的字符区域,包括:
基于所述字符检测模型中的卷积层对所述关键帧图像进行特征提取,得到所述关键帧图像的关键图像特征;
对所述关键图像特征进行特征拼接,得到所述关键帧图像对应的拼接特征图像;所述拼接特征图像中的像素点的像素值用于表示对应关键帧图像中的像素点为字符的概率;
获取所述拼接特征图像中每个像素值所属的概率范围,根据所述每个像素值所属的概率范围生成概率图像及字符边框图像;
对所述概率图像及所述字符边框图像进行特征融合,生成融合字符图像,基于所述融合字符图像确定所述关键帧图像中的字符区域。


4.根据权利要求1所述的方法,其特征在于,所述基于图像识别模型对所述字符区域进行特征提取,根据提取到的特征从所述字符区域中识别所述关键帧图像的字符数据,包括:
基于所述图像识别模型中的卷积层对所述字符区域进行特征提取,得到所述字符区域对应的卷积特征,对所述字符区域对应的卷积特征进行序列化处理,得到所述字符区域对应的特征序列;
基于所述图像识别模型中的循环层对所述特征序列进行识别处理,确定所述特征序列对应的序列字符特征;
基于所述图像识别模型中...

【专利技术属性】
技术研发人员:尚焱李松南
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1