一种字符识别方法及装置制造方法及图纸

技术编号：14479667 阅读：111 留言：0更新日期：2017-01-25 12:20

本发明专利技术公开了一种字符识别方法及装置，用以降低字符像素值较低对识别效果造成的影响，提高识别的准确率。所述方法包括：在视频播放过程中截取视频帧；将所述截取到的视频帧转换为灰度图；确定所述灰度图中的字符区域；当所述字符区域的像素值小于所述字符区域的相邻区域的像素值时，将所述灰度图进行反色处理；当所述字符区域的像素值大于所述字符区域的相邻区域的像素值时，确定所述字符区域中每一个字符对应的子区域；识别所述子区域中的字符。采用本发明专利技术所提供的方法，能够使字符区域的像素值大于字符区域的相邻区域的像素值，从而降低了字符像素值较低对识别效果造成的影响，提高了识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，特别涉及一种字符识别方法及装置。
技术介绍
随着各类拍摄设备的普及以及视频技术的飞速发展，互联网上的视频数量和传播速度出现了爆炸式的增长。视频中出现的字符，如视频标题、字幕等，携带大量信息，对视频内容的理解有着重要作用。现有技术中，出现了一些自动识别视频中出现的字符的技术，来提高对视频信息的收集速率。然而，受限于视频中可能出现的字符像素值较低的情况，采用现有的识别技术，识别效果并不理想。因而，如何降低字符像素值较低而对识别效果造成的影响，提高识别的准确率，是一亟待解决的技术问题。
技术实现思路
本专利技术提供一种字符识别方法及装置，用以降低字符像素值较低对识别效果造成的影响，提高识别的准确率。本专利技术提供一种字符识别方法，包括：在视频播放过程中截取视频帧；将所述截取到的视频帧转换为灰度图；确定所述灰度图中的字符区域；当所述字符区域的像素值小于所述字符区域的相邻区域的像素值时，将所述灰度图进行反色处理；当所述字符区域的像素值大于所述字符区域的相邻区域的像素值时，确定所述字符区域中每一个字符对应的子区域；识别所述子区域中的字符。本专利技术的有益效果在于：在确定灰度图中的字符区域之后，如果字符区域的像素值小于字符区域的相邻区域的像素值时，将灰度图进行反色处理，以使字符区域的像素值大于字符区域的相邻区域的像素值，从而降低了字符像素值较低对识别效果造成的影响，提高了识别的准确率。在一个实施例中，所述确定所述灰度图中的字符区域，包括：获得所述灰度图的边缘图；对所述边缘图进行二值化处理，以使所述边缘图的所有边缘的像素点都变为白色像素点；对...
一种字符识别方法及装置

【技术保护点】
一种字符识别方法，其特征在于，包括：在视频播放过程中截取视频帧；将所述截取到的视频帧转换为灰度图；确定所述灰度图中的字符区域；当所述字符区域的像素值小于所述字符区域的相邻区域的像素值时，将所述灰度图进行反色处理；当所述字符区域的像素值大于所述字符区域的相邻区域的像素值时，确定所述字符区域中每一个字符对应的子区域；识别所述子区域中的字符。

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：在视频播放过程中截取视频帧；将所述截取到的视频帧转换为灰度图；确定所述灰度图中的字符区域；当所述字符区域的像素值小于所述字符区域的相邻区域的像素值时，将所述灰度图进行反色处理；当所述字符区域的像素值大于所述字符区域的相邻区域的像素值时，确定所述字符区域中每一个字符对应的子区域；识别所述子区域中的字符。2.如权利要求1所述的方法，其特征在于，所述确定所述灰度图中的字符区域，包括：获得所述灰度图的边缘图；对所述边缘图进行二值化处理，以使所述边缘图的所有边缘的像素点都变为白色像素点；对所述边缘进行角点检测，以得到所述边缘图上存在角点信息的区域；将不存在角点信息的边缘中的白色像素点转换为黑色像素点；将剩余的白色像素点中距离小于预设距离阈值的白色像素点所在的区域进行合并；确定所述合并后的区域为字符区域。3.如权利要求2所述的方法，其特征在于，当合并后的区域为多个时，所述确定所述合并后的区域为字符区域，包括：获取各个合并后的区域的面积；确定面积大于第一面积阈值且小于第二面积阈值的合并后的区域为字符区域。4.如权利要求1所述的方法，其特征在于，在确定所述灰度图中的字符区域之后，所述方法还包括：将所述字符区域中的所有像素值进行聚类处理得到所述字符区域的所有像素值对应的两个聚类中心；获取与所述字符区域相邻的像素点的值；当与所述字符区域相邻的像素点的值与所述两个聚类中心中较大值接近时，确定所述字符区域的像素值小于所述字符区域的相邻区域的像素值；当与所述字符区域相邻的像素点的值与所述两个聚类中心中较小值接近时，确定所述字符区域的像素值大于所述字符区域的相邻区域的像素值。5.如权利要求1所述的方法，其特征在于，所述确定所述字符区域中每一个字符对应的子区域，包括：识别所述字符区域中白色像素点形成的多个连通区域；通过多个矩形框标识所述连通区域，其中，每个连通区域对应一个矩形框；将长和宽不满足预设比例阈值的相邻矩形框合并为同一矩形框；确定满足预设比例阈值的矩形框为一个字符对应的子区域。6.一种字符识别装置，其特征在于，包括：截取模块，用于在视频播放过程中截取视频帧；转换模块，将所述截取到的视频帧转换为灰度图；第一确定模块，...

【专利技术属性】
技术研发人员：刘帅，
申请(专利权)人：无锡天脉聚源传媒科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人