视频光学字符识别系统方法及系统技术方案

技术编号：28872817 阅读：59 留言：0更新日期：2021-06-15 23:06

本申请公开了一种精简视频光学字符识别有效结果方法及系统，方法包括：视频文件获取步骤：获取至少一个视频文件；文本信息计算步骤：通过文本信息汉明计算装置对文本信息进行计算；图片帧应用步骤：通过图片帧OCR应用装置对图片帧进行应用；图片帧结果保存步骤：通过图片帧OCR结果保存装置对图片帧结果进行保存；结果汇总步骤：通过视频所有图片帧OCR结果汇总装置对图片帧处理结果进行汇总。本发明专利技术能够精简视频OCR结果，提高OCR结果的信息密度，舍弃冗余信息。

全部详细技术资料下载

【技术实现步骤摘要】
视频光学字符识别系统方法及系统
本专利技术属于视频光学字符识别领域，具体涉及一种通过汉明距离和字符数精简视频光学字符识别有效结果的方法及系统。
技术介绍
视频是以一定码率和算法把大量音视频信息组织保存的，对视频的OCR应用，实际是对视频的每帧图像分别应用ocr算法，并将所有图片的ocr结果重新组织；视频的OCR结果为该视频所有图片帧OCR结果的全集；现有的技术通常只是简单汇总所有图片帧的结果；每个视频内都有有大量的相似帧图片，这些相似图片重复计算浪费计算性能，同时文本结果也有大量的重复，降低了视频的OCR文本结果的信息密度；这个方案会图片帧做相似度检测，相似度较高的图片，不再重复计算。现有技术的缺点：图片帧相似度计算减少了重复计算，但仍然会有大量重复的文本，对独立的静态图像有较好的效果，但对像字幕显示这一类的前后有时间关系的图像，因为只是字幕的变更，图片大概率是相似的，粗暴的只应用图片相似度，会导致字幕的不准确。
技术实现思路
为解决上述技术问题本申请实施例提供了一种视频光学字符识别方法及系统。本专利技术提供了一种视频光学字符识别方法，其中，包括：视频文件获取步骤：获取至少一个视频文件；图片帧计算步骤：对所述视频文件进行计算获得图片帧；文本信息计算步骤：对所述图片帧进行计算获得图片帧文本信息；图片帧结果保存步骤：对所述图片帧文本信息进行保存；结果汇总步骤：对所述图片帧文本信息进行汇总。上述视频光学字符识别方法，其中，所述图片帧计算步骤包括，根...

【技术保护点】
1.一种视频光学字符识别方法，其特征在于，包括：/n视频文件获取步骤：获取至少一个视频文件；/n图片帧计算步骤：对所述视频文件进行计算获得图片帧；/n文本信息计算步骤：对所述图片帧进行计算获得图片帧文本信息；/n图片帧结果保存步骤：对所述图片帧文本信息进行保存；/n结果汇总步骤：对所述图片帧文本信息进行汇总。/n

【技术特征摘要】
1.一种视频光学字符识别方法，其特征在于，包括：
视频文件获取步骤：获取至少一个视频文件；
图片帧计算步骤：对所述视频文件进行计算获得图片帧；
文本信息计算步骤：对所述图片帧进行计算获得图片帧文本信息；
图片帧结果保存步骤：对所述图片帧文本信息进行保存；
结果汇总步骤：对所述图片帧文本信息进行汇总。

2.如权利要求1所述的视频光学字符识别方法，其特征在于，所述图片帧计算步骤包括，根据所述视频文件逐帧或提取关键帧计算以提取的所述图片帧。

3.如权利要求2所述的视频光学字符识别方法，其特征在于，所述文本信息计算步骤包括：
提取步骤：从所述图片帧中提取当前图片帧和所述当前图片帧的前一图片帧；
计算步骤：对所述当前图片帧和所述前一图片帧进行计算对应地获得当前图片帧文本信息和前一图片帧文本信息；
计算相似度步骤：对所述当前图片帧文本信息和前一图片帧文本信息进行计算获得相似度；
判断步骤：对所述相似度进行判断并输出判断结果。

4.如权利要求3所述的视频光学字符识别方法，其特征在于，所述判断步骤包括：若所述相似度大于一固定值，且所述当前图片帧文本信息的字符数大于前一图片帧文本信息的字符数时输出第一判断结果；
若所述相似度大于所述固定值，且所述当前图片帧文本信息的字符数小于或等于前一图片帧文本信息的字符数时输出第二判断结果；
若所述相似度小于所述固定值，输出第三判断结果。

5.如权利要求4所述的视频光学字符识别方法，其特征在于，所述图片帧结果保存步骤包括：
根据所述第一判断结果舍弃所述前一图片帧文本信息，保留所述当前图片帧文本信息进行存储；
根据所述第二判断结果舍弃所述当前图片帧文本信息，保留所述前一图片帧文本信息进行存储；
根据所述第三判断结果，保留所述当前图片帧文本信息和前一图片帧文本信息进行存储。

6.一种视频光学字符识别系统，其特征在于，包括：视频文件获取装置，获取至少...

【专利技术属性】
技术研发人员：崔大鹏，
申请(专利权)人：北京秒针人工智能科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人