一种英语单词识别方法和装置制造方法及图纸

技术编号：14027116 阅读：76 留言：0更新日期：2016-11-19 09:59

本申请公开了一种英语单词识别方法和装置，该方法包括：对输入的视频图像进行笔画宽度变换；对经笔画宽度变换后输出的图像进行连通域分析，并从分析结果中筛选出是文本区域的连通域；对筛选出的连通域进行合并，得到文本行；利用光学字符识别模型对所述文本行进行识别，其中，所述光学字符识别模型的训练数据为英文字母，每个英文字母都具有多种不同腐蚀度的模板；对识别出的文本行进行语义分析，选出符合语义的文本行。本申请提高了复杂场景下英语单词识别精确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文字识别
，更具体地说，涉及一种英语单词识别方法和装置。
技术介绍
文本是计算机视觉的许多应用中的一项重要特征，视频图像中的文本往往包含着丰富的信息，将视频图像里的文本进行提取和识别，对于视频图像内容的分析、理解、信息检索等方面具有重要的意义。从视频图像中提取文字的轮廓特征是文字识别过程中的重要一环，比如说，在英语单词识别过程中，需要先提取出各英文字母的轮廓特征再加以合并以识别出整个英语单词。但由于视频图像是自然场景，在复杂场景下，其背景噪音过重，会使字母轮廓缺失难以识别从而出现英语单词漏检和识别错误，影响英语单词识别精确度。
技术实现思路
有鉴于此，本专利技术提供一种英语单词识别方法和装置，以提高复杂场景下英语单词识别精确度。一种英语单词识别方法，包括：对输入的视频图像进行笔画宽度变换；对经笔画宽度变换后输出的图像进行连通域分析，并从分析结果中筛选出是文本区域的连通域；对筛选出的连通域进行合并，得到文本行；利用光学字符识别模型对所述文本行进行识别，其中，所述光学字符识别模型的训练数据为英文字母，每个英文字母都具有多种不同腐蚀度的模板；对识别出的文本行进行语义分析，选出符合语义的文本行。其中，所述对输入图像进行笔画宽度变换，包括：将输入的视频图像解码为RGB图像；把所述RGB图像转化成灰度图；把所述灰度图转化成标准窗口小部件工具箱图像；利用Canny边缘检测算子对所述标准窗口小部件工具箱图像进行边缘检测，得到所有边缘像素点；利用sobel算子分别计算得到各边缘像素点的梯度方向；为每一个所述边缘像素点寻找与其梯度方向相反的边缘像素点，形成边...
一种英语单词识别方法和装置

【技术保护点】
一种英语单词识别方法，其特征在于，包括：对输入的视频图像进行笔画宽度变换；对经笔画宽度变换后输出的图像进行连通域分析，并从分析结果中筛选出是文本区域的连通域；对筛选出的连通域进行合并，得到文本行；利用光学字符识别模型对所述文本行进行识别，其中，所述光学字符识别模型的训练数据为英文字母，每个英文字母都具有多种不同腐蚀度的模板；对识别出的文本行进行语义分析，选出符合语义的文本行。

【技术特征摘要】
1.一种英语单词识别方法，其特征在于，包括：对输入的视频图像进行笔画宽度变换；对经笔画宽度变换后输出的图像进行连通域分析，并从分析结果中筛选出是文本区域的连通域；对筛选出的连通域进行合并，得到文本行；利用光学字符识别模型对所述文本行进行识别，其中，所述光学字符识别模型的训练数据为英文字母，每个英文字母都具有多种不同腐蚀度的模板；对识别出的文本行进行语义分析，选出符合语义的文本行。2.根据权利要求1所述的方法，其特征在于，所述对输入图像进行笔画宽度变换，包括：将输入的视频图像解码为RGB图像；把所述RGB图像转化成灰度图；把所述灰度图转化成标准窗口小部件工具箱图像；利用Canny边缘检测算子对所述标准窗口小部件工具箱图像进行边缘检测，得到所有边缘像素点；利用sobel算子分别计算得到各边缘像素点的梯度方向；为每一个所述边缘像素点寻找与其梯度方向相反的边缘像素点，形成边缘像素点对；分别计算由每一个所述边缘像素点对确定的笔画宽度值，其笔画宽度值的大小为本边缘像素对之间的欧式距离。3.根据权利要求1所述的方法，其特征在于，所述从分析结果中筛选出是文本区域的连通域，包括：从分析结果中筛选出是文本区域的连通域，筛选条件包括：连通域的笔划宽度一致；而且与要识别的英语单词的颜色相同的像素点在连通域中所占比例不低于第一预设值。4.根据权利要求1所述的方法，其特征在于，所述从分析结果中筛选出是文本区域的连通域，包括：从分析结果中筛选出是文本区域的连通域，筛选条件包括：连通域的笔划宽度一致；而且连通域的笔画方差不低于第二预设值、笔画均值不低于第三预设值且连通域宽高比不超过第四预设值。5.根据权利要求1-4中任一项所述的方法，其特征在于，所述利用光学字符识别模型对所述文本行进行识别前，还包括：利用最大类间方差二值化过滤所述文本行的背景噪音；对应的，所述利用光学字符识别模型对所述文本行进行识别，为：利用光学字符识别模型对背景噪音过滤后的文本行进行识别。6.一种英语单词识别装置，其特征在于，...

【专利技术属性】
技术研发人员：刁志敏，
申请(专利权)人：珠海迈科智能科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人