字符颜色识别处理方法及装置制造方法及图纸

技术编号:22001237 阅读:16 留言:0更新日期:2019-08-31 05:40
本发明专利技术公开了一种字符颜色识别处理方法及装置,其中,字符颜色识别处理方法包括:从图片中提取待识别区域;对待识别区域进行连通域分析,得到多个字符区域的外接矩形;针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。根据本发明专利技术提供的技术方案,通过对连通域分析得到的字符区域的外接矩形内像素颜色值进行聚类处理,实现了对字符区域中所包括的颜色的快速识别;通过将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对来确定字符颜色,有效地提高了字符颜色识别精度。

Character Color Recognition Processing Method and Device

【技术实现步骤摘要】
字符颜色识别处理方法及装置
本专利技术涉及图片处理
,具体涉及一种字符颜色识别处理方法及装置。
技术介绍
OCR等字符识别算法能够对图片中的字符进行自动识别。依据现有的字符识别算法,会按照位置关系将距离较近的字符组合拼接成一段字符,而对于字符的颜色,一般是直接将识别出的字符的颜色设置成黑色等预设颜色或者通过从图片中的字符部分提取颜色的方式确定字符的颜色。例如,申请公布号为CN102737241A的中国专利申请提供了一种信息处理方法,该方法根据来自字符识别处理部分的字符识别处理的结果和字符串区域图像,判定字符串区域中的字符串的字符部分的颜色,根据判定的字符颜色信息生成字符串区域颜色信息。然而,为了在图片展示时能够获得较好展示效果,大多会对图片进行抗锯齿等处理,上述处理会导致图片中字符部分的颜色值不是一个固定值,尤其是边缘位置通常利用的是差值运算生成的中间值作为颜色值,那么利用现有技术无法准确地对字符的颜色进行识别,存在着字符颜色识别精度较低的问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的字符颜色识别处理方法及装置。根据本专利技术的一个方面,提供了一种字符颜色识别处理方法,该方法包括:从图片中提取待识别区域;对待识别区域进行连通域分析,得到多个字符区域的外接矩形;针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。进一步地,该方法还包括:按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。进一步地,对待识别区域进行连通域分析,得到多个字符区域的外接矩形进一步包括:利用种子填充算法对待识别区域进行连通域分析,得到多个连通域;根据多个连通域对应的参数信息,确定多个字符区域;针对每个字符区域,获取该字符区域的外接矩形。进一步地,针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值进一步包括:从聚类元素中随机选取K个聚类元素作为K个初始聚类中心,其中K大于1;根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合;依据K个最终聚类集合,确定K个聚类颜色值。进一步地,根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合进一步包括:对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的距离;从K个初始聚类中心中选择与任一聚类元素之间的距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;计算K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;若是,则将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合;若否,则根据K个聚类中心更新K个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的距离。进一步地,在将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色之前,该方法还包括:根据外接矩形的位置参数信息,确定外接矩形的外围区域;统计外接矩形的外围区域内像素颜色值的分布情况;根据分布情况,提取在外围区域内分布最多的像素颜色值作为外围区域的背景颜色值。进一步地,将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色进一步包括:计算每个聚类颜色值与背景颜色值之间的差异度;将差异度符合预设条件的聚类颜色值确定为字符区域的字符颜色。根据本专利技术的另一方面,提供了一种字符颜色识别处理装置,该装置包括:提取模块,适于从图片中提取待识别区域;分析模块,适于对待识别区域进行连通域分析,得到多个字符区域的外接矩形;聚类模块,适于针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;比对模块,适于将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。进一步地,该装置还包括:划分模块,适于按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。进一步地,分析模块进一步适于:利用种子填充算法对待识别区域进行连通域分析,得到多个连通域;根据多个连通域对应的参数信息,确定多个字符区域;针对每个字符区域,获取该字符区域的外接矩形。进一步地,聚类模块进一步适于:从聚类元素中随机选取K个聚类元素作为K个初始聚类中心,其中K大于1;根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合;依据K个最终聚类集合,确定K个聚类颜色值。进一步地,聚类模块进一步适于:对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的距离;从K个初始聚类中心中选择与任一聚类元素之间的距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;计算K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;若是,则将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合;若否,则根据K个聚类中心更新K个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的距离。进一步地,该装置还包括:外围区域确定模块,适于根据外接矩形的位置参数信息,确定外接矩形的外围区域;统计模块,适于统计外接矩形的外围区域内像素颜色值的分布情况;背景色提取模块,适于根据分布情况,提取在外围区域内分布最多的像素颜色值作为外围区域的背景颜色值。进一步地,比对模块进一步适于:计算每个聚类颜色值与背景颜色值之间的差异度;将差异度符合预设条件的聚类颜色值确定为字符区域的字符颜色。根据本专利技术的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述字符颜色识别处理方法对应的操作。根据本专利技术的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述字符颜色识别处理方法对应的操作。根据本专利技术提供的技术方案,对图片中的待识别区域进行连通域分析,得到多个字符区域的外接矩形,通过对外接矩形内像素颜色值进行聚类处理,实现了对字符区域中所包括的颜色的快速识别;将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,能够更为准确地从多个聚类颜色值中确定出字符颜色,所确定的字符颜色能够更为准确地反映图片中字符的真实颜色,有效地提高了字符颜色识别精度。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示本文档来自技高网...

【技术保护点】
1.一种字符颜色识别处理方法,所述方法包括:从图片中提取待识别区域;对所述待识别区域进行连通域分析,得到多个字符区域的外接矩形;针对每个字符区域的外接矩形,将所述外接矩形内像素颜色值作为聚类元素,并对所述聚类元素进行聚类处理,得到多个聚类颜色值;将所述多个聚类颜色值与所述外接矩形的外围区域的背景颜色值进行比对,确定所述字符区域的字符颜色。

【技术特征摘要】
1.一种字符颜色识别处理方法,所述方法包括:从图片中提取待识别区域;对所述待识别区域进行连通域分析,得到多个字符区域的外接矩形;针对每个字符区域的外接矩形,将所述外接矩形内像素颜色值作为聚类元素,并对所述聚类元素进行聚类处理,得到多个聚类颜色值;将所述多个聚类颜色值与所述外接矩形的外围区域的背景颜色值进行比对,确定所述字符区域的字符颜色。2.根据权利要求1所述的方法,其中,所述方法还包括:按照多个字符区域的字符颜色,对所述待识别区域内的字符识别结果进行划分,得到多个字符组。3.根据权利要求1所述的方法,其中,所述对所述待识别区域进行连通域分析,得到多个字符区域的外接矩形进一步包括:利用种子填充算法对所述待识别区域进行连通域分析,得到多个连通域;根据多个连通域对应的参数信息,确定多个字符区域;针对每个字符区域,获取该字符区域的外接矩形。4.根据权利要求1所述的方法,其中,所述针对每个字符区域的外接矩形,将所述外接矩形内像素颜色值作为聚类元素,并对所述聚类元素进行聚类处理,得到多个聚类颜色值进一步包括:从所述聚类元素中随机选取K个聚类元素作为K个初始聚类中心,其中K大于1;根据所述K个初始聚类中心,对所述聚类元素进行聚类处理,确定K个最终聚类中心以及与所述K个最终聚类中心相对应的K个最终聚类集合;依据K个最终聚类集合,确定K个聚类颜色值。5.根据权利要求4所述的方法,其中,所述根据所述K个初始聚类中心,对所述聚类元素进行聚类处理,确定K个最终聚类中心以及与所述K个最终聚类中心相对应的K个最终聚类集合进一步包括:对于任一聚类元素,计算任一聚类元素与所述K个初始聚类中心之间的距离;从所述K个初始聚类中心中选择与所述任一聚类元素之间的距离最小的初始聚类中心,将所述任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;计算所述K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;若是,则将所述K...

【专利技术属性】
技术研发人员:罗光玮钱鸿强
申请(专利权)人:浙江口碑网络技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1