数据处理方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:31561895 阅读:14 留言:0更新日期:2021-12-25 10:43
本申请公开了一种数据处理方法、装置、存储介质及计算机设备。其中,该方法包括:获取待处理视频数据的目标分段数据,目标分段数据包括关键帧;识别关键帧的类型,得到第一识别结果;确定待处理视频数据中的其他分段数据,其中,其他分数据为待处理视频数据中除目标分段数据之外的至少一个分段数据;依据其他分段数据对第一识别结果进行修正,得到第二识别结果,其中,该第二识别结果用于指示目标分段数据的类型。本申请解决了现有技术对视频的类型识别结果不准确的技术问题。识别结果不准确的技术问题。识别结果不准确的技术问题。

【技术实现步骤摘要】
数据处理方法、装置、存储介质及计算机设备


[0001]本申请涉及计算机领域,具体而言,涉及一种数据处理方法、装置、存储介质及计算机设备。

技术介绍

[0002]在视频理解领域,自动识别视频中的人物、物体、场景等是视频结构化的关键技术。场景是视频信息中非常重要的一个维度,其在后续的视频生产中可用于封面图的生成和商业广告的插入。由于视频存量巨大,且剧集类的视频时长又很长,人工筛选的工作量非常繁重。因此,常用的方法是利用深度学习训练基于图像的场景识别类型器,对视频逐帧进行场景识别。
[0003]但是,基于单帧图像的判别方法存在着一定的局限性。首先,视频单帧处理的效率较低。更重要的,由于图像的视角有限,在进行场景识别时经常存在判断歧义的情况,不容易识别当前图像到底属于哪种场景。比如酒店房间和家庭卧室这两个场景相似性很高,很多情况下较难判断到底属于卧室还是酒店房间。再比如,如果图片中只出现了一个人坐在沙发上,通过仅有的信息很难判断是属于客厅还是演播厅。
[0004]针对上述现有技术对视频的类型识别结果不准确的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种数据处理方法、装置、存储介质及计算机设备,以至少解决现有技术对视频的类型识别结果不准确的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种数据处理方法,包括:获取待处理视频数据的目标分段数据,所述目标分段数据包括关键帧;识别所述关键帧的类型,得到第一识别结果;确定所述待处理视频数据中的其他分段数据,其中,所述其他分数据为所述待处理视频数据中除所述目标分段数据之外的至少一个分段数据;依据所述其他分段数据对所述第一识别结果进行修正,得到第二识别结果,其中,该第二识别结果用于指示所述目标分段数据的类型。
[0007]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取待处理多媒体数据的目标分段数据,其中,所述目标分段数据为对所述多媒体数据进行分段处理后得到的分段数据;识别所述目标分段数据的类型,得到第一识别结果;依据所述多媒体数据中其他分段数据的类型识别结果,对所述第一识别结果进行修正,得到第二识别结果,其中,所述其他分段数据为与所述目标分段数据关联的分段数据。
[0008]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取待处理音频数据的目标分段数据,其中,所述目标分段数据为对所述音频数据进行分段处理后得到的分段数据;对所述目标分段数据的类型进行识别,得到所述目标分段数据的第一识别结果;依据所述音频数据中其他分段数据的类型,对所述第一识别结果进行修正,得到第二识
别结果,其中,所述其他分段数据为与所述目标分段数据关联的分段数据。
[0009]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取待处理文本数据的目标分段数据,其中,所述目标分段数据为对所述文本数据进行分段处理后得到的分段数据;对所述目标分段数据的类型进行识别,得到所述目标分段数据的第一识别结果;依据所述文本数据中其他分段数据的类型,对所述第一识别结果进行修正,得到第二识别结果,其中,所述其他分段数据为与所述目标分段数据关联的分段数据。
[0010]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取待处理图像序列的目标分段数据,其中,所述目标分段数据为对所述图像序列数据进行分段处理后得到的分段数据;对所述目标分段数据的类型进行识别,得到所述目标分段数据的第一识别结果;依据所述图像序列数据中其他分段数据的类型,对所述第一识别结果进行修正,得到第二识别结果,其中,所述其他分段数据为与所述目标分段数据关联的分段数据。
[0011]根据本申请实施例的另一方面,还提供了一种数据处理装置,包括:获取模块,用于获取待处理视频数据的目标分段数据,所述目标分段数据包括关键帧;识别模块,用于识别所述关键帧的类型,得到第一识别结果;确定模块,用于确定所述待处理视频数据中的其他分段数据,其中,所述其他分数据为所述待处理视频数据中除所述目标分段数据之外的至少一个分段数据;修正模块,用于依据所述其他分段数据对所述第一识别结果进行修正,得到第二识别结果,其中,该第二识别结果用于指示所述目标分段数据的类型。
[0012]根据本申请实施例的另一个方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的数据处理方法。
[0013]根据本申请实施例的另一方面,还提供了一种计算设备,包括:处理器;以及存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:获取待处理视频数据的目标分段数据,所述目标分段数据包括关键帧;识别所述关键帧的类型,得到第一识别结果;确定所述待处理视频数据中的其他分段数据,其中,所述其他分数据为所述待处理视频数据中除所述目标分段数据之外的至少一个分段数据;依据所述其他分段数据对所述第一识别结果进行修正,得到第二识别结果,其中,该第二识别结果用于指示所述目标分段数据的类型。
[0014]在本申请实施例中,获取待处理视频数据,将待处理视频数据划分为多个分段数据,并确定各分段数据的关键帧,再选取待处理视频数据中的目标分段数据,并识别目标分段数据所对应关键帧的类型,得到第一识别结果,然后基于待处理视频数据中其他分段数据的类型,对基于目标分段数据的关键帧所识别出的第一识别结果进行修正,得到目标分段数据的第二识别结果,达到了基于多个分段数据的类型识别结果,共同确定目标分段数据的类型的目的,从而实现了对待处理视频数据中的类型进行准确识别的技术效果,进而解决了现有技术对视频的类型识别结果不准确的技术问题。
附图说明
[0015]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0016]图1示出了一种用于实现数据处理方法的计算机终端的硬件结构框图;
[0017]图2是根据本申请实施例的一种数据处理方法的流程图一;
[0018]图3a是根据本申请实施例的一种场景(即类型)识别系统的示意图;
[0019]图3b是根据本申请实施例的一种场景(即类型)识别的系统执行步骤的示意图;
[0020]图4是根据本申请实施例的一种数据处理方法的流程图二;
[0021]图5是根据本申请实施例的一种数据处理方法的流程图三;
[0022]图6是根据本申请实施例的一种数据处理方法的流程图四;
[0023]图7是根据本申请实施例的一种数据处理方法的流程图五;
[0024]图8是根据本申请实施例的一种数据处理装置的示意图一;
[0025]图9是根据本申请实施例的一种数据处理装置的示意图二;
[0026]图10是根据本申请实施例的一种数据处理装置的示意图三;
[0027]图11是根据本申请实施例的一种数据处理装置的示意图四;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待处理视频数据的目标分段数据,所述目标分段数据包括关键帧;识别所述关键帧的类型,得到第一识别结果;确定所述待处理视频数据中的其他分段数据,其中,所述其他分数据为所述待处理视频数据中除所述目标分段数据之外的至少一个分段数据;依据所述其他分段数据对所述第一识别结果进行修正,得到第二识别结果,其中,该第二识别结果用于指示所述目标分段数据的类型。2.根据权利要求1所述的方法,其特征在于,所述类型包括:所述关键帧的场景;识别所述关键帧的类型之前,所述方法还包括:确定所述关键帧所属的景别;判断所述景别是否为目标类型;在所述景别为所述目标类型时,确定允许对所述关键帧的场景进行识别;在所述景别不是所述目标类型时,确定拒绝对所述关键帧的场景进行识别。3.根据权利要求2所述的方法,其特征在于,确定所述关键帧所属的景别,包括:确定所述关键帧所对应的画面中目标对象的尺寸在所述画面中所占的比例;确定所述比例所属的取值范围;确定所述取值范围对应的景别,并将所述取值范围对应的景别作为所述关键帧所属的景别。4.根据权利要求1所述的方法,其特征在于,识别所述关键帧的类型,包括:将所述关键帧对应的图像输入至神经网络模型进行分析,得到所述第一识别结果,其中,所述神经网络模型为采用多组类型标注数据训练得到的。5.根据权利要求1所述的方法,其特征在于,确定所述待处理视频数据中的其他分段数据,包括:确定所述待处理视频数据中位于所述目标分段数据之前的N个分段数据,其中,N为正整数;依据所述其他分段数据对所述第一识别结果进行修正,包括:确定所述N个分段数据所属的类型;依据所述N个分段数据的类型之间的关联关系,对所述第一识别结果进行修正。6.根据权利要求5所述的方法,其特征在于,依据所述N个分段数据的类型之间的关联关系,对所述第一识别结果进行修正,包括:依据所述N个分段数据的类型之间的关联关系确定所述目标分段数据所属的参考类型;依据所述目标分段数据所属的参考类型对所述第一识别结果进行修正。7.根据权利要求6所述的方法,其特征在于,依据所述N个分段数据的类型之间的关联关系确定所述目标分段数据所属的参考类型,包括:确定所述N个分段数据的类型,得到多个类型;确定所述多个类型所属的公共类型;依据所述公共类型与所述多个类型之间的从属关系确定所述目标分段数据所属的参考类型。8.根据权利要求1所述的方法,其特征在于,获取待处理视频数据的目标分段数据包括:
采用镜头边界检测技术对所述待处理视频数据进行分镜处理,得到多个镜头数据;从所述多个镜头数据中确定所述目标分段数据。9.根据权利要求1所述的方法,其特征在于,确定所述待处理视频数据中的其他分段数据之前,所述方法还包括:向目标对象展示所述第一识别结果;接收所述目标对象依据所述第一识别结果反馈的反馈信息;在所述反馈信息指示所述第一识别结果所指示的类型为无效类型时,触发所述其他分段数据。10.一种数据处理方法...

【专利技术属性】
技术研发人员:刘紫琼唐铭谦
申请(专利权)人:水利部信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1