一种视频字幕OCR识别的自动校正方法技术

技术编号：13295800 阅读：39 留言：0更新日期：2016-07-09 13:53

本发明专利技术公开了一种视频字幕OCR识别的自动校正方法，包括以下步骤：S1.获取带字幕的原始视频图像，并对该原始视频图像进行二值化处理得到二值化图像；S2.分别对原始视频图像和二值化图像进行光学字符识别，得到多个参考识别结果；S3.根据所述多个参考识别结果获取最优识别结果。本发明专利技术能够智能的从多种视频文字识别结果中选取最优识别结果呈现给用户。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及光学字符识别
，特别是涉及一种视频字幕OCR识别的自动校正方法。
技术介绍
现有的视频字幕识别通常只产生一种识别结果，但是由于不同的北京、字体颜色纹理以及字体结构特征导致误识率较高；虽然现在也出现了一些视频文字识别系统通过多种引擎能够产生多种识别结果，但是这些视频文字识别系统不能智能的选取最优结果呈现给用户。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种视频字幕OCR识别的自动校正方法，能够智能的从多种视频文字识别结果中选取最优识别结果。本专利技术的目的是通过以下技术方案来实现的：一种视频字幕OCR识别的自动校正方法，包括以下步骤：S1.获取带字幕的原始视频图像，并对该原始视频图像进行二值化处理得到二值化图像；S2.分别对原始视频图像和二值化图像进行光学字符识别，得到多个参考识别结果；S3.根据所述多个参考识别结果获取最优识别结果。所述步骤S2包括以下子步骤：S21.对原始视频图像进行光学字符识别，得到第一视频识别结果和第一文档识别结果；S22.对二值化图像进行光学字符识别，得到第二视频识别结果和第二文档识别结果。所述步骤S3包括以下子步骤：S31.针对每个参考识别结果中的每个文字产生一个字幕矩形区域和一个置信度；S32.对所有字幕矩形区域进行去除噪声处理；S33.根据每个参考识别结果的置信度选取得到最可靠的参考识别结果，将该最可靠的参考识别结果作为备选识别结果，并计算该备选识别结果中文字的特征...
一种视频字幕OCR识别的自动校正方法

【技术保护点】
一种视频字幕OCR识别的自动校正方法，其特征在于：包括以下步骤：S1.获取带字幕的原始视频图像，并对该原始视频图像进行二值化处理得到二值化图像；S2.分别对原始视频图像和二值化图像进行光学字符识别，得到多个参考识别结果；S3.根据所述多个参考识别结果获取最优识别结果。

【技术特征摘要】
1.一种视频字幕OCR识别的自动校正方法，其特征在于：包括以下步骤：
S1.获取带字幕的原始视频图像，并对该原始视频图像进行二值化处理得到二值化图像；
S2.分别对原始视频图像和二值化图像进行光学字符识别，得到多个参考识别结果；
S3.根据所述多个参考识别结果获取最优识别结果。
2.根据权利要求1所述的一种视频字幕OCR识别的自动校正方法，其特征在于：所述步骤S2包括以下子步骤：
S21.对原始视频图像进行光学字符识别，得到第一视频识别结果和第一文档识别结果；
S22.对二值化图像进行光学字符识别，得到第二视频识别结果和第二文档识别结果。
3.根据权利要求1所述的一种视频字幕OCR识别的自动校正方法，其特征在于：所述步骤S3包括以下子步骤：
S31.针对每个参考识别结果中的每个文字产生一个字幕矩形区域和一个置信度；
S32.对所有字幕矩形区域进行去除噪声处理；
S33.根据每个参考识别结果的置信度选取得到最可靠的参考识别结果，将该最可靠的参考识别结果作为备选识别结果，并计算该备选识别结果中文字的特征数据；
S34.根据文字的特征数据对备选识别结果进行字幕矩形区域划分检查；
S35.结合其它所有参考识别结果，对备选识别结果中的所有字幕矩形区域逐个进行判断，得到各字幕矩形区域对应的文字的最优结果，将备选识别结果中所有字幕矩形...

【专利技术属性】
技术研发人员：谢超平，吴春中，罗明利，
申请(专利权)人：成都索贝数码科技股份有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人