视频的处理方法及装置制造方法及图纸

技术编号:38910770 阅读:20 留言:0更新日期:2023-09-25 09:27
本发明专利技术实施例提供了一种视频的处理方法及装置,包括:按照第一时间间隔在录制的视频文件中获取第一目标视频帧;对第一目标视频帧进行文字识别,得到第一目标视频帧的文字识别结果;在第一目标视频帧的文字识别结果满足预设条件的情况下,在视频文件中确定目标视频片段;按照第二时间间隔在目标视频片段中获取第二目标视频帧,并对第二目标视频帧进行文字识别,得到第二目标视频帧的文字识别结果。通过本发明专利技术解决了对视频进行文字识别效率低的问题,进而达到了提高对视频中文字识别效率的效果。果。果。

【技术实现步骤摘要】
视频的处理方法及装置


[0001]本专利技术实施例涉视频处理领域,具体而言,涉及一种视频的处理方法及装置。

技术介绍

[0002]相关领域中,在对生活场景中拍摄的视频中的文字信息可以被合理利用。例如,安防监控视频里的大量视频中带有文字信息,该文字信息被合理利用可以提高监控的安全性。
[0003]OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,录像和OCR结合可以拓展出大量的应用场景。通过OCR技术可以提高检索和查看视频中文字信息的效率。但是若对视频中每帧图像都使用OCR技术进行文字识别,存在浪费资源和效率低的问题。
[0004]针对上述问题,目前尚未存在有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种视频的处理方法及装置,以至少解决相关技术中对视频进行文字识别效率低的问题。
[0006]根据本专利技术的一个实施例,提供了一种视频的处理方法,包括:按照第一时间间隔在录制的视频文件中获取第一目标视频帧;对所述第一目标视频帧进行文字识别,得到所述第一目标视频帧的文字识别结果;在所述第一目标视频帧的文字识别结果满足预设条件的情况下,在所述视频文件中确定目标视频片段,其中,所述目标视频片段包括所述视频文件中位于所述目标视频帧之前的视频帧,和/或,所述目标视频片段包括所述视频文件中位于所述目标视频帧之后的视频帧;按照第二时间间隔在所述目标视频片段中获取第二目标视频帧,并对所述第二目标视频帧进行文字识别,得到所述第二目标视频帧的文字识别结果。
[0007]在一个示例性实施例中,所述按照第一时间间隔在录制的视频文件中获取第一目标视频帧,包括:当所述第一时间间隔到达时,在所述视频文件中获取第i个关键帧,其中,i大于或等于1,所述第一目标视频帧包括所述第i个关键帧,所述第一时间间隔是目标时间间隔的整数倍,所述目标时间间隔是所述视频文件中相邻两个关键帧的时间间隔。
[0008]在一个示例性实施例中,在所述第一目标视频帧的文字识别结果满足预设条件的情况下,在所述视频文件中确定目标视频片段,包括:在所述第i个关键帧满足所述预设条件的情况下,在所述视频文件中确定第i

N个关键帧、所述第i个关键帧,以及位于所述第i

N个关键帧和所述第i个关键帧之间的视频帧为所述目标视频片段,其中,N为大于或等于1的整数,第0个关键帧是所述视频文件中的起始帧;或者,在所述第i个关键帧满足所述预设条件的情况下,在所述视频文件中确定第i

N个关键帧、所述第i+M个关键帧,以及位于所述第i

N个关键帧和所述第i+M个关键帧之间的视频帧为所述目标视频片段,其中,M为大于或
等于1的整数;或者,在所述第i个关键帧满足所述预设条件的情况下,在所述视频文件中确定第i个关键帧、所述第i+M个关键帧,以及位于所述第i个关键帧和所述第i+M个关键帧之间的视频帧为所述目标视频片段。
[0009]在一个示例性实施例中,按照第二时间间隔在所述目标视频片段中获取第二目标视频帧,并对所述第二目标视频帧进行文字识别,得到所述第二目标视频帧的文字识别结果,包括:当所述第二时间间隔到达时,在所述目标视频片段中获取第j个关键帧,其中,所述j为大于或等于1的整数,所述第二目标视频帧包括所述第j个关键帧,所述第二时间间隔是所述目标时间间隔的整数倍,所述第二时间间隔大于所述第一时间间隔,或者,所述第二时间间隔小于所述第一时间间隔。
[0010]在一个示例性实施例中,在所述第一目标视频帧的文字识别结果满足预设条件的情况下,在所述视频文件中确定目标视频片段,包括:在所述第一目标视频帧的文字识别结果表示所述第一目标视频帧中文字的数量大于或等于预设阈值的情况下,在所述视频文件中确定所述目标视频片段;或者,在所述第一目标视频帧的文字识别结果表示所述第一目标视频帧中存在关键字的情况下,在所述视频文件中确定所述目标视频片段;或者,在所述第一目标视频帧的文字识别结果表示所述第一目标视频帧中关键字的数量大于或等于预设阈值的情况下,在所述视频文件中确定所述目标视频片段。
[0011]在一个示例性实施例中,按照第一时间间隔在录制的视频文件中获取第一目标视频帧,包括:检测文字识别系统当前是否存在空闲能力;在所述文字识别系统存在所述空闲能力的情况下,按照第一时间间隔在录制的视频文件中获取第一目标视频帧。
[0012]在一个示例性实施例中,在所述得到所述第一目标视频帧的文字识别结果之后,所述方法还包括:确定所述第一目标视频帧在所述视频文件中出现的时刻,得到第一目标时刻;将所述第一目标视频帧的文字识别结果和所述第一目标时刻关联存储在数据库。
[0013]在一个示例性实施例中,在所述得到所述第一目标视频帧的文字识别结果之后,所述方法还包括:在所述第一目标视频帧的文字识别结果中存在关键字的情况下,将所述关键字、所述第一目标视频帧的文字识别结果和所述第一目标时刻关联存储在数据库;使用所述关键字对所述视频文件进行标记。
[0014]在一个示例性实施例中,在所述得到所述第二目标视频帧的文字识别结果之后,所述方法还包括:确定所述第二目标视频帧在所述视频文件中出现的时刻,得到第二目标时刻;将所述第二目标视频帧的文字识别结果和所述第二目标时刻关联存储在数据库。
[0015]在一个示例性实施例中,在所述得到所述第二目标视频帧的文字识别结果之后,所述方法还包括:所述第二目标视频帧的文字识别结果中存在关键字的情况下,将所述关键字、所述第二目标视频帧的文字识别结果和所述第二目标时刻关联存储在数据库;使用所述关键字对所述视频文件进行标记。
[0016]在一个示例性实施例中,对所述第一目标视频帧进行文字识别,得到所述第一目标视频帧的文字识别结果,包括:通过光学字符识别对所述第一目标视频帧进行文字识别,得到所述第一目标视频帧的文字识别结果;对所述第二目标视频帧进行文字识别,得到所述第二目标视频帧的文字识别结果,包括:通过光学字符识别对所述第二目标视频帧进行文字识别,得到所述第二目标视频帧的文字识别结果。
[0017]根据本专利技术的另一个实施例,提供了一种视频的处理装置,包括:获取模块,用于
按照第一时间间隔在录制的视频文件中获取第一目标视频帧;第一识别模块,用于对所述第一目标视频帧进行文字识别,得到所述第一目标视频帧的文字识别结果;确定模块,用于在所述第一目标视频帧的文字识别结果满足预设条件的情况下,在所述视频文件中确定目标视频片段,其中,所述目标视频片段包括所述视频文件中位于所述目标视频帧之前的视频帧,和/或,所述目标视频片段包括所述视频文件中位于所述目标视频帧之后的视频帧;第二识别模块,用于按照第二时间间隔在所述目标视频片段中获取第二目标视频帧,并对所述第二目标视频帧进行文字识别,得到所述第二目标视本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频的处理方法,其特征在于,包括:按照第一时间间隔在录制的视频文件中获取第一目标视频帧;对所述第一目标视频帧进行文字识别,得到所述第一目标视频帧的文字识别结果;在所述第一目标视频帧的文字识别结果满足预设条件的情况下,在所述视频文件中确定目标视频片段,其中,所述目标视频片段包括所述视频文件中位于所述目标视频帧之前的视频帧,和/或,所述目标视频片段包括所述视频文件中位于所述目标视频帧之后的视频帧;按照第二时间间隔在所述目标视频片段中获取第二目标视频帧,并对所述第二目标视频帧进行文字识别,得到所述第二目标视频帧的文字识别结果。2.根据权利要求1所述的方法,其特征在于,所述按照第一时间间隔在录制的视频文件中获取第一目标视频帧,包括:当所述第一时间间隔到达时,在所述视频文件中获取第i个关键帧,其中,i大于或等于1,所述第一目标视频帧包括所述第i个关键帧,所述第一时间间隔是目标时间间隔的整数倍,所述目标时间间隔是所述视频文件中相邻两个关键帧的时间间隔。3.根据权利要求2所述的方法,其特征在于,在所述第一目标视频帧的文字识别结果满足预设条件的情况下,在所述视频文件中确定目标视频片段,包括:在所述第i个关键帧满足所述预设条件的情况下,在所述视频文件中确定第i

N个关键帧、所述第i个关键帧,以及位于所述第i

N个关键帧和所述第i个关键帧之间的视频帧为所述目标视频片段,其中,N为大于或等于1的整数,第0个关键帧是所述视频文件中的起始帧;或者,在所述第i个关键帧满足所述预设条件的情况下,在所述视频文件中确定第i

N个关键帧、第i+M个关键帧,以及位于所述第i

N个关键帧和所述第i+M个关键帧之间的视频帧为所述目标视频片段,其中,M为大于或等于1的整数;或者在所述第i个关键帧满足所述预设条件的情况下,在所述视频文件中确定第i个关键帧、所述第i+M个关键帧,以及位于所述第i个关键帧和所述第i+M个关键帧之间的视频帧为所述目标视频片段。4.根据权利要求2所述的方法,其特征在于,按照第二时间间隔在所述目标视频片段中获取第二目标视频帧,并对所述第二目标视频帧进行文字识别,得到所述第二目标视频帧的文字识别结果,包括:当所述第二时间间隔到达时,在所述目标视频片段中获取第j个关键帧,其中,j为大于或等于1的整数,所述第二目标视频帧包括所述第j个关键帧,所述第二时间间隔是所述目标时间间隔的整数倍,所述第二时间间隔大于所述第一时间间隔,或者,所...

【专利技术属性】
技术研发人员:潘晓峰
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1