一种字符识别方法、设备及计算机可读存储介质技术

技术编号:25916261 阅读:39 留言:0更新日期:2020-10-13 10:35
本发明专利技术公开了一种字符识别方法、设备及计算机可读存储介质,所述方法包括:根据第一聚类参数对指定图像进行聚类处理,获得第一分类集合;其中,所述第一分类集合包含至少一个第一分类集;根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域;通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息;当所述置信度信息满足所述预设阈值时,根据所述分类结果确定对应所述指定图像的字符识别结果,应用本方法实施例提供的方法,能够对模糊字符进行识别,且识别准确率高。

【技术实现步骤摘要】
一种字符识别方法、设备及计算机可读存储介质
本专利技术涉及图像处理
,尤其涉及一种字符识别方法、设备及计算机可读存储介质。
技术介绍
字符识别是用于对载体上的文字字符进行识别的技术,当采用该方法对对显示屏幕上的字符进行识别时,由于外部环境、硬件条件、显示屏幕自身因素等的影响,存在字符与显示屏幕的对比度低,导致字符区域模糊,识别准确率低的问题。
技术实现思路
本专利技术实施例提供了一种字符识别方法、设备及计算机可读存储介质,具有对字符的识别准确率高。本专利技术实施例一方面提供一种字符识别方法,所述方法包括:根据第一聚类参数对指定图像进行聚类处理,获得第一分类集合;其中,所述第一分类集合包含至少一个第一分类集;根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域;通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息;当所述置信度信息满足所述预设阈值时,根据所述分类结果确定对应所述指定图像的字符识别结果。在一可实施方式中,所述方法还包括:当所述置信度信息不满足所述预设阈值时,根据与所述第一聚类参数关联的设定步进确定第二聚类参数;基于第二聚类参数对指定图像进行聚类处理,以确定第二字符区域;所述第二字符区域用于确定对应所述指定图像的字符识别结果。在一可实施方式中,在根据第一聚类参数对指定图像进行聚类处理之前,所述方法还包括:对所述指定图像进行二值化分割,获得连通域;根据预设条件对所述连通域进行筛选,以获得非字符连通域;其中,所述非字符连通域用于在所述指定图像进行聚类处理之前对指定图像进行预处理。在一可实施方式中,所述根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域,包括:根据所述先验信息确定每一个第一分类集的差异度;根据所述差异度对所有第一分类集进行排序,以确定差异度最小的第一分类集;对所述差异度最小的第一分类集进行二值化处理,获得第一字符区域。在一可实施方式中,所述通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息,包括:对所述第一字符区域进行分割变换,获得字符图像;根据插值法对所述字符图像进行尺寸调整,获得预设尺寸的字符图像;通过分类器对所述预设尺寸的字符图像进行分类,获得分类结果和置信度信息。在一可实施方式中,所述置信度信息包括当前置信度和当前聚类参数,所述预设阈值包括置信度阈值和参数阈值;相应的,当所述置信度信息满足所述预设阈值时,根据所述分类结果确定对应所述指定图像的字符识别结果,包括:当所述当前置信度满足所述置信度阈值时,将所述分类结果确定为对应所述指定图像的字符识别结果;当所述当前置信度不满足所述置信度阈值,且所述当前聚类参数满足所述参数阈值时,根据与所述当前聚类参数关联的所述设定步进确定下一轮聚类参数;当所述当前置信度不满足所述置信度阈值,且所述当前聚类参数不满足所述参数阈值时,获取当前置信度和之前的所有置信度,对所述当前置信度和之前的所有置信度进行大小排序,以将对应置信度最大的分类结果确定为对应所述指定图像的字符识别结果。本专利技术实施例另一方面提供一种字符识别设备,所述设备包括:聚类模块,用于根据第一聚类参数对指定图像进行聚类处理,获得第一分类集合;其中,所述第一分类集合包含至少一个第一分类集;筛选模块,用于根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域;分类模块,用于通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息;确定模块,用于当所述置信度信息满足所述预设阈值时,根据所述分类结果确定对应所述指定图像的字符识别结果。在一可实施方式中,所述确定模块,还用于当所述置信度信息不满足所述预设阈值时,根据与所述第一聚类参数关联的设定步进确定第二聚类参数;所述聚类模块,还用于基于第二聚类参数对指定图像进行聚类处理,以确定第二字符区域;所述第二字符区域用于确定对应所述指定图像的字符识别结果。在一可实施方式中,所述设备还包括:分割模块,用于对所述指定图像进行二值化分割,获得连通域;所述筛选模块,还用于根据预设条件对所述连通域进行筛选,以获得非字符连通域;其中,所述非字符连通域用于在所述指定图像进行聚类处理之前对指定图像进行预处理。在一可实施方式中,所述筛选模块,包括:确定子模块,用于根据所述先验信息确定每一个第一分类集的差异度;排序子模块,用于根据所述差异度对所有第一分类集进行排序,以确定差异度最小的第一分类集;处理子模块,用于对所述差异度最小的第一分类集进行二值化处理,获得第一字符区域。在一可实施方式中,所述分类模块,包括:分割子模块,用于对所述第一字符区域进行分割变换,获得字符图像;调整子模块,用于根据插值法对所述字符图像进行尺寸调整,获得预设尺寸的字符图像;分类子模块,用于通过分类器对所述预设尺寸的字符图像进行分类,获得分类结果和置信度信息。在一可实施方式中,所述置信度信息包括当前置信度和当前聚类参数,所述预设阈值包括置信度阈值和参数阈值;相应的,所述确定模块,包括:当所述当前置信度满足所述置信度阈值时,将所述分类结果确定为对应所述指定图像的字符识别结果;当所述当前置信度不满足所述置信度阈值,且所述当前聚类参数满足所述参数阈值时,根据与所述当前聚类参数关联的所述设定步进确定下一轮聚类参数;当所述当前置信度不满足所述置信度阈值,且所述当前聚类参数不满足所述参数阈值时,获取当前置信度和之前的所有置信度,对所述当前置信度和之前的所有置信度进行大小排序,以将对应置信度最大的分类结果确定为对应所述指定图像的字符识别结果。本专利技术实施例另一方面提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行上述任一项所述的字符识别方法。本专利技术实施例提供的字符识别方法、设备及计算机可读存储介质用于对指定图像中的字符进行识别,以确定指定图像中的字符对应的字符识别结果。本方法尤其适用于确定模糊图像和/或模糊字符中对应的字符识别结果,通过对指定图像进行聚类处理、根据先验信息进行筛选、分类器分类、满足置信度以获得字符识别结果,所得到的字符识别结果具有准确率高的特点。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:在附图中,相同或对应的标号表示相同或对应的部分。图1为本专利技术实施例一种字符识别方法的实现流程示意图;图2为本专利技术实施例一种字符识别方法确定第二字符区域的实现流程示意图;图3为本专利技术实施例一种字符识别方法确定字符识别结果的实现流程示意图;图4为本专利技术实施例一种字符识别方法图像预处理的实现流程示意图;图5为本专利技术实施例一种字符识别方法分类集合筛选的实现流程示意图;图6为本专利技术实施例一种字符识别设备的模块示意图。具体实施方式为使本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进本文档来自技高网...

【技术保护点】
1.一种字符识别方法,其特征在于,所述方法包括:/n根据第一聚类参数对指定图像进行聚类处理,获得第一分类集合;其中,所述第一分类集合包含至少一个第一分类集;/n根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域;/n通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息;/n当所述置信度信息满足所述预设阈值时,根据所述分类结果确定对应所述指定图像的字符识别结果。/n

【技术特征摘要】
1.一种字符识别方法,其特征在于,所述方法包括:
根据第一聚类参数对指定图像进行聚类处理,获得第一分类集合;其中,所述第一分类集合包含至少一个第一分类集;
根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域;
通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息;
当所述置信度信息满足所述预设阈值时,根据所述分类结果确定对应所述指定图像的字符识别结果。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述置信度信息不满足所述预设阈值时,根据与所述第一聚类参数关联的设定步进确定第二聚类参数;
基于第二聚类参数对指定图像进行聚类处理,以确定第二字符区域;所述第二字符区域用于确定对应所述指定图像的字符识别结果。


3.根据权利要求1或2所述的方法,其特征在于,在根据第一聚类参数对指定图像进行聚类处理之前,所述方法还包括:
对所述指定图像进行二值化分割,获得连通域;
根据预设条件对所述连通域进行筛选,以获得非字符连通域;其中,所述非字符连通域用于在所述指定图像进行聚类处理之前对指定图像进行预处理。


4.根据权利要求1或2所述的方法,其特征在于,所述根据先验信息对所述第一分类集合进行筛选,以确定第一字符区域,包括:
根据所述先验信息确定每一个第一分类集的差异度;
根据所述差异度对所有第一分类集进行排序,以确定差异度最小的第一分类集;
对所述差异度最小的第一分类集进行二值化处理,获得第一字符区域。


5.根据权利要求1或2所述的方法,其特征在于,所述通过分类器对所述第一字符区域进行分类,获得分类结果和置信度信息,包括:
对所述第一字符区域进行分割变换,获得字符图像;
根据插值法对所述字符图像进行尺寸调整,获得预设尺寸的字符图像;
通过分类器对所述预设尺寸的字符图像进行分类,获得分类结果和置信度信息。


6.根据权利要求1或2所述的方法,其特征在于,所述置信度信息包括当前置信度和当前聚类参数,所述预设阈值包括置信度阈值和参数阈值;

【专利技术属性】
技术研发人员:罗文君
申请(专利权)人:合肥联宝信息技术有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1