视频光学字符识别系统方法及系统技术方案

技术编号:28872817 阅读:59 留言:0更新日期:2021-06-15 23:06
本申请公开了一种精简视频光学字符识别有效结果方法及系统,方法包括:视频文件获取步骤:获取至少一个视频文件;文本信息计算步骤:通过文本信息汉明计算装置对文本信息进行计算;图片帧应用步骤:通过图片帧OCR应用装置对图片帧进行应用;图片帧结果保存步骤:通过图片帧OCR结果保存装置对图片帧结果进行保存;结果汇总步骤:通过视频所有图片帧OCR结果汇总装置对图片帧处理结果进行汇总。本发明专利技术能够精简视频OCR结果,提高OCR结果的信息密度,舍弃冗余信息。

【技术实现步骤摘要】
视频光学字符识别系统方法及系统
本专利技术属于视频光学字符识别领域,具体涉及一种通过汉明距离和字符数精简视频光学字符识别有效结果的方法及系统。
技术介绍
视频是以一定码率和算法把大量音视频信息组织保存的,对视频的OCR应用,实际是对视频的每帧图像分别应用ocr算法,并将所有图片的ocr结果重新组织;视频的OCR结果为该视频所有图片帧OCR结果的全集;现有的技术通常只是简单汇总所有图片帧的结果;每个视频内都有有大量的相似帧图片,这些相似图片重复计算浪费计算性能,同时文本结果也有大量的重复,降低了视频的OCR文本结果的信息密度;这个方案会图片帧做相似度检测,相似度较高的图片,不再重复计算。现有技术的缺点:图片帧相似度计算减少了重复计算,但仍然会有大量重复的文本,对独立的静态图像有较好的效果,但对像字幕显示这一类的前后有时间关系的图像,因为只是字幕的变更,图片大概率是相似的,粗暴的只应用图片相似度,会导致字幕的不准确。
技术实现思路
为解决上述技术问题本申请实施例提供了一种视频光学字符识别方法及系统。本专利技术提供了一种视频光学字符识别方法,其中,包括:视频文件获取步骤:获取至少一个视频文件;图片帧计算步骤:对所述视频文件进行计算获得图片帧;文本信息计算步骤:对所述图片帧进行计算获得图片帧文本信息;图片帧结果保存步骤:对所述图片帧文本信息进行保存;结果汇总步骤:对所述图片帧文本信息进行汇总。上述视频光学字符识别方法,其中,所述图片帧计算步骤包括,根据所述视频文件逐帧或提取关键帧计算以提取的所述图片帧。上述视频光学字符识别方法,其中,所述文本信息计算步骤包括:提取步骤:从所述图片帧中提取当前图片帧和所述当前图片帧的前一图片帧;计算步骤:对所述当前图片帧和所述前一图片帧进行计算对应地获得当前图片帧文本信息和前一图片帧文本信息;计算相似度步骤:对所述当前图片帧文本信息和前一图片帧文本信息进行计算获得相似度;判断步骤:对所述相似度进行判断并输出判断结果。上述视频光学字符识别方法,其中,所述判断步骤包括:若所述相似度大于一固定值,且所述当前图片帧文本信息的字符数大于前一图片帧文本信息的字符数时输出第一判断结果;若所述相似度大于所述固定值,且所述当前图片帧文本信息的字符数小于或等于前一图片帧文本信息的字符数时输出第二判断结果;若所述相似度小于所述固定值,输出第三判断结果。上述视频光学字符识别方法,其中,所述图片帧结果保存步骤包括:根据所述第一判断结果舍弃所述前一图片帧文本信息,保留所述当前图片帧文本信息进行存储;根据所述第二判断结果舍弃所述当前图片帧文本信息,保留所述前一图片帧文本信息进行存储;根据所述第三判断结果,保留所述当前图片帧文本信息和前一图片帧文本信息进行存储。本专利技术还包括一种视频光学字符识别系统,其中,包括:视频文件获取装置,获取至少一个视频文件;文本信息汉明计算装置,对所述视频文件进行计算获得图片帧;图片帧OCR应用装置,对所述图片帧进行计算获得图片帧文本信息;图片帧OCR结果保存装置,对所述图片帧文本信息进行保存;视频所有图片帧OCR结果汇总装置,对所述图片帧文本信息进行汇总。上述视频光学字符识别系统,其中,所述文本信息汉明计算装置根据所述视频文件逐帧或提取关键帧计算以提取的所述图片帧。上述视频光学字符识别系统,其中,所述图片帧OCR应用装置包括:提取单元:从所述图片帧中提取当前图片帧和所述当前图片帧的前一图片帧;计算单元:分别对所述当前图片帧和所述前一图片帧进行计算对应地获得当前图片帧文本信息和前一图片帧文本信息;所述文本信息汉明计算装置包括:计算相似度单元:对所述当前图片帧文本信息和前一图片帧文本信息进行计算获得相似度;判断单元:对所述相似度进行判断并输出判断结果。上述视频光学字符识别系统,其中,若所述相似度计算结果大于一固定值,且所述当前图片帧文本信息的字符数大于前一图片帧文本信息的字符数时所述判断单元输出第一判断结果;若所述相似度计算结果大于所述固定值,且所述当前图片帧文本信息的字符数小于或等于前一图片帧文本信息的字符数时所述判断单元输出第二判断结果;若所述相似度计算结果小于所述固定值,所述判断单元输出第三判断结果。上述视频光学字符识别系统,其中,所述图片帧OCR结果保存装置根据所述第一判断结果舍弃所述前一图片帧文本信息,保留所述当前图片帧文本信息进行存储;所述图片帧OCR结果保存装置根据所述第二判断结果舍弃所述当前图片帧文本信息,保留所述前一图片帧文本信息进行存储;所述图片帧OCR结果保存装置根据所述第三判断结果,保留所述当前图片帧文本信息和前一图片帧文本信息进行存储。本专利技术的有益效果在于:提供了一种精简视频光学字符识别有效结果方法及系统,能够精简视频OCR结果,提高OCR结果的信息密度,舍弃冗余信息。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是视频光学字符识别方法的流程图;图2是图1中步骤S2的分步骤流程图;图3是本专利技术的视频光学字符识别系统的结构示意图;图4是根据本专利技术实施例的计算机设备的框架图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的
技术实现思路
的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属
内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本文档来自技高网
...

【技术保护点】
1.一种视频光学字符识别方法,其特征在于,包括:/n视频文件获取步骤:获取至少一个视频文件;/n图片帧计算步骤:对所述视频文件进行计算获得图片帧;/n文本信息计算步骤:对所述图片帧进行计算获得图片帧文本信息;/n图片帧结果保存步骤:对所述图片帧文本信息进行保存;/n结果汇总步骤:对所述图片帧文本信息进行汇总。/n

【技术特征摘要】
1.一种视频光学字符识别方法,其特征在于,包括:
视频文件获取步骤:获取至少一个视频文件;
图片帧计算步骤:对所述视频文件进行计算获得图片帧;
文本信息计算步骤:对所述图片帧进行计算获得图片帧文本信息;
图片帧结果保存步骤:对所述图片帧文本信息进行保存;
结果汇总步骤:对所述图片帧文本信息进行汇总。


2.如权利要求1所述的视频光学字符识别方法,其特征在于,所述图片帧计算步骤包括,根据所述视频文件逐帧或提取关键帧计算以提取的所述图片帧。


3.如权利要求2所述的视频光学字符识别方法,其特征在于,所述文本信息计算步骤包括:
提取步骤:从所述图片帧中提取当前图片帧和所述当前图片帧的前一图片帧;
计算步骤:对所述当前图片帧和所述前一图片帧进行计算对应地获得当前图片帧文本信息和前一图片帧文本信息;
计算相似度步骤:对所述当前图片帧文本信息和前一图片帧文本信息进行计算获得相似度;
判断步骤:对所述相似度进行判断并输出判断结果。


4.如权利要求3所述的视频光学字符识别方法,其特征在于,所述判断步骤包括:若所述相似度大于一固定值,且所述当前图片帧文本信息的字符数大于前一图片帧文本信息的字符数时输出第一判断结果;
若所述相似度大于所述固定值,且所述当前图片帧文本信息的字符数小于或等于前一图片帧文本信息的字符数时输出第二判断结果;
若所述相似度小于所述固定值,输出第三判断结果。


5.如权利要求4所述的视频光学字符识别方法,其特征在于,所述图片帧结果保存步骤包括:
根据所述第一判断结果舍弃所述前一图片帧文本信息,保留所述当前图片帧文本信息进行存储;
根据所述第二判断结果舍弃所述当前图片帧文本信息,保留所述前一图片帧文本信息进行存储;
根据所述第三判断结果,保留所述当前图片帧文本信息和前一图片帧文本信息进行存储。


6.一种视频光学字符识别系统,其特征在于,包括:视频文件获取装置,获取至少...

【专利技术属性】
技术研发人员:崔大鹏
申请(专利权)人:北京秒针人工智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1