一种基于智能语料库的图片中不规则和有颜色文字识别系统技术方案

技术编号:36450863 阅读:20 留言:0更新日期:2023-01-25 22:47
本申请公开了一种基于智能语料库的图片中不规则和有颜色文字识别系统,涉及语言文字识别技术领域,包括以下步骤:S1、建立了完备的数据库,以支持将字拆分成其组成的偏旁和部首,若没有偏旁则无需拆分,然后通过图像识别技术,对拆分所得偏旁和部首进行识别抓取并编号,而后将编号填入数据库,使一个文字对应一个或多个编号;S2、区域性色块提取,通过图像识别技术,首先将所识别区域内的不同颜色,按照16色标准划分为多个板块,通过色差的方式进行凸出;通过区域性色块提取和区域性文字提取。该技术可对颜色较为复杂的PPT文件或其它图片文件中的文字和语句,按照不同类型或者话语进行自动提取,并按顺序将文字或语句排列和分段,大大提高了图片文字提取及转录时的便捷度。度。度。

【技术实现步骤摘要】
一种基于智能语料库的图片中不规则和有颜色文字识别系统


[0001]本专利技术属于语言文字识别
,具体是一种基于智能语料库的图片中不规则和有颜色文字识别系统。

技术介绍

[0002]文字识别是一种借助图像处理实现识读附着于实体表面上文字信息的技术,文字识别作为一种信息处理的手段具有广阔的应用背景和巨大的市场需求,在诸如阅读、翻译、文献资料的检索、信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理等方面具有十分重大的意义,而在众多识别领域中对于图片的识别是非常重要的一部分,一般图片中的颜色非常丰富,而且会有很多不规则的字体,这就增加了图片文字识别的难度。
[0003]现在市场上对于图片中不规则字体和带有颜色的文字的识别,一般是利用图像识别技术对图片中的文字直接进行提取,但因色彩、光等因素的影响,提取效果不佳,经常会有错别字或者明显的语句不通顺的情况发生,而且一般只能针对单一颜色进行识别,且不能自行对识别出来的文字进行判断,因此现在的识别系统不能满足当代人生活的需要。

技术实现思路

[0004]解决的技术问题:
[0005]针对现有技术的不足,本专利技术提供了一种基于智能语料库的图片中不规则和有颜色文字识别系统,解决了
技术介绍
中提到的问题。
[0006]技术方案:
[0007]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0008]一种基于智能语料库的图片中不规则和有颜色文字识别系统,包括以下步骤:
[0009]S1、建立数据库,将字拆分成其组成的偏旁和部首,若没有偏旁则无需拆分,接着通过图像识别技术,对拆分的偏旁和部首抓取,并对偏旁和部首进行编号,而后将编号填入数据库,使文字对应一个或多个编号;
[0010]S2、区域性色块提取,通过图像识别技术,首先将所识别区域内的不同颜色,按照16色标准划分为多个板块,通过色差的方式进行凸出,而后将凸出颜色部分的区域,进行标记;
[0011]S3、区域性文字提取,对已标记出的颜色区域,再次进行图像识别,如果该区域内颜色种类仍然为两种以上,则继续重复S2步骤,如果该区域内颜色种类为两种,则继续进行图像识别,并将识别出的图像与S1中数据库的图像进行对比;
[0012]S4、分析对比结果,如果对比结果存在于数据库,则对当前图形编号,如果对比结果不存在于数据库,则视为当前区域没有文字;
[0013]S5、整理结果,将分析对比结果进行组合,对应的编号则从数据库中,提取出完整的文字进行输出。
[0014]在一种可能的实现方式中,S1中,所述每个文字都有完整的编号。
[0015]在一种可能的实现方式中,S2中,通过图像识别技术对颜色板块进行识别扫描时,首先会从带扫描的图案最上方开始逐渐向下延伸,当同一行有多个颜色板块时,则从左至右进行图像识别,并按顺序对不同颜色的板块进行标记,例如:为颜色板块1。
[0016]在一种可能的实现方式中,S5中,在最终的文字展示时,按照颜色板块的序号进行展示,不在同一水平面上的颜色板块,则分段展示。
[0017]在一种可能的实现方式中,S5中,分析结果中,将组成一个完整字体的图形编号所对应的图形区域画“圈”,将“圈”与“圈”之间的间距作为空白对文字进行分隔。
[0018]在一种可能的实现方式中,S4中,将标记区域内的形状与数据库中的数据进行对比,对比后,当前图像相似度在90%以上,则弹出完整编号对应的字体;若相似度低于90%,则从高至低向下依次,弹出对应完整编号的字体。
[0019]在一种可能的实现方式中,S5中,当使用者主动修改字体时,系统会自动将该错字相邻的两个字体所对应的编号进行统计,以后该字再次夹在之前相邻两个字之间时,且该错字的图像识别率低于50%时,自动补入使用者之前修改的字体。
[0020]有益效果:
[0021]通过图像识别技术将文字拆分成组成文字最基础的图形,并将该图像进行编号存入数据库中,以将文字图形化、数字化,进而使文字可以通过数据库的方式进行调用,提高文字数据化的智能性;
[0022]通过区域性色块提取、区域性文字提取,可在对一些颜色较为复杂的PPT文件或其它图片文件中,按照不同类型的文字或者话语提取文字或语句,并按顺序将文字或语句排列和分段,大大提高了图片文字提取及转录时的便捷度;
[0023]通过图像辨识度分析和实验分析,规定当前图像相似度在90%以上,则弹出完整编号对应的字体;若相似度低于90%,则从高至低向下依次,弹出对应完整编号的字体,当使用者主动修改字体时,系统会自动将该错字相邻的两个字体所对应的编号进行统计,以后该字再次夹在之前相邻两个字之间时,且该错字的图像识别率低于50%时,自动补入使用者之前修改的字体,从而完善对模糊文字的填入正确率。
附图说明
[0024]图1是本专利技术的流程框图;
[0025]图2是本专利技术的系统架构图。
具体实施方式
[0026]本申请实施例通过提供一种基于智能语料库的图片中不规则和有颜色文字识别系统,解决现有技术中的问题。
[0027]本申请实施例中的技术方案为解决上述问题,总体思路如下:
[0028]如图1、2,一种基于智能语料库的图片中不规则和有颜色文字识别系统,其特征在于,包括以下步骤:
[0029]S1、建立文字偏旁部首数据库,将字拆分成其组成的偏旁和部首,若没有偏旁则无需拆分,接着通过图像识别技术,对拆分的偏旁和部首抓取,并对偏旁和部首进行编号,而
后将编号填入数据库,使一个文字对应一个或多个编号;
[0030]S2、区域性色块提取,通过图像识别技术,首先将所识别区域内的不同颜色,划分为多个颜色板块,通过色差的方式进行凸出,而后将凸出颜色部分的区域,进行标记;
[0031]S3、区域性文字提取,对已标记出的颜色区域,再次进行图像识别,如果该区域内颜色种类仍然为两种以上,则继续重复S2步骤,如果该区域内颜色种类为两种,则继续进行图像识别,并将识别出的图像与S1中数据库的图像进行对比;
[0032]S4、分析对比结果,如果对比结果存在于数据库,则对当前图形编号,如果对比结果不存在于数据库,则视为当前区域没有文字;
[0033]S5、整理结果,将分析对比结果进行组合,对应的编号则从数据库中,提取出完整的文字进行输出。
[0034]在一些示例中,S1中,所述每个文字都有完整的编号。
[0035]在一些示例中,S2中,通过图像识别技术对颜色板块进行识别扫描时,首先会从带扫描的图案最上方开始逐渐向下延伸,当同一行有多个颜色板块时,则从左至右进行图像识别,并按顺序对不同颜色的板块进行标记,例如:为颜色板块1。
[0036]在一些示例中,S5中,在最终的文字展示时,按照颜色板块的序号进行展示,不在同一水平面上的颜色板块,则分段展示。
[0037]在一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于智能语料库的图片中不规则和有颜色文字识别系统,其特征在于,包括以下步骤:S1、建立完备的文字部首偏旁数据库,将字拆分成其组成的偏旁和部首,若没有偏旁则无需拆分,接着通过图像识别技术,对拆分的偏旁和部首抓取,并对偏旁和部首进行编号,而后将编号填入数据库,使一个文字对应一个或多个编号;S2、区域性色块提取,通过图像识别技术,首先将所识别区域内的不同颜色,按照16色标准划分为多个板块,通过色差的方式进行凸出,而后将凸出颜色部分的区域,进行标记;S3、区域性文字提取,对已标记出的颜色区域,再次进行图像识别,如果该区域内颜色种类仍然为两种以上,则继续重复S2步骤,如果该区域内颜色种类为两种,则继续进行图像识别,并将识别出的图像与S1中数据库的图像进行对比;S4、分析对比结果,如果对比结果存在于数据库,则对当前图形编号,如果对比结果不存在于数据库,则视为当前区域没有文字;S5、整理结果,将分析对比结果进行组合,对应的编号则从数据库中,提取出完整的文字进行输出。2.如权利要求1所述的一种基于智能语料库的图片中不规则和有颜色文字识别系统,其特征在于:S1中,所述每个文字都有完整的编号,图像识别过程中,会将对偏旁和部首的方位记录。3.如权利要求1所述的一种基于智能语料库的图片中不规则和有颜色文字识别系统,其特征在于:S2中,通...

【专利技术属性】
技术研发人员:胥备任开文
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1