一种文字提取系统及方法技术方案

技术编号:17705755 阅读:54 留言:0更新日期:2018-04-14 18:28
本发明专利技术提供一种文字提取系统及方法,系统包括:扫描模块,用于将带有文字的背景图片进行扫描,得到待处理图像;第一提取模块,用于提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;调整模块,用于根据预设颜色值分别对第一颜色值和第二颜色值进行调整,并根据预设亮度值对第一亮度值和第二亮度值进行调整;第二提取模块,用于从调整后的待处理图像中提取出文字图像;转换模块,用于将提取出的文字图像转换为对应的文字符号。本发明专利技术能够通过将背景与文字部分的色差拉大,来进行调整,更容易提取文字部分,识别力强。

【技术实现步骤摘要】
一种文字提取系统及方法
本专利技术主要涉及信息处理
,具体涉及一种文字提取系统及方法。
技术介绍
文字识别是从图像中提取文字图像,再由文字图像转换为纯文字的过程。由于整体的背景与文字部分色差及亮度辨识度不高,现有的由图像转换文字的技术中,识别性能不佳,容易造成识别错误,需要进行二次校正,且校正起来十分麻烦,工作效率低。
技术实现思路
本专利技术针对上述技术问题的不足,提供一种文字提取系统及方法。本专利技术解决上述技术问题的技术方案如下:一种文字提取系统,包括:扫描模块,用于将带有文字的背景图片进行扫描,得到待处理图像;第一提取模块,用于提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;调整模块,用于根据预设颜色值分别对待处理图像整体的第一颜色值和待处理图像中文字部分第二颜色值进行调整,加大第一颜色值和第二颜色值的差值,并根据预设亮度值对待处理图像整体的第一亮度值和待处理图像中文字部分第二亮度值进行调整,加大第一亮度值和第二亮度值的差值;第二提取模块,用于从调整后的待处理图像中提取出文字图像;转换模块,用于将提取出的文字图像转换为对应的文字符号。本专利技术的有益效果是:通过将背景与文字部分进行细节处理,调整颜色值和亮度值使得文字部分突出,更容易提取文字部分,识别力强。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述调整模块具体用于,将第一颜色值减去预设颜色值得到新的第一颜色值,将第二颜色值加上预设颜色值得到新的第二颜色值,根据新的第一颜色值和新的第二颜色值对待处理图像进行调整;将第一亮度值减去预设亮度值得到新的第一亮度值,将第二亮度值加上预设亮度值得到新的第二亮度值,根据新的第一亮度值和新的第二亮度值对待处理图像进行调整。采用上述技术特征的有益效果为:能够拉开整体背景色与文字部分的色差值和亮度值,便于更好的识别出文字图像。进一步,所述第二提取模块具体用于,从调整后的待处理图像中对文字部分进行描边处理,得到文字轮廓,根据文字轮廓提取出文字图像。采用上述技术特征的有益效果为:由于整体背景色与文字部分的颜色及亮度进行了处理,能够使文字部分更突出,便于提取文字图像。进一步,所述转换模块具体用于,根据提取出的文字图像与预设文字库中的文字图像进行匹配,得到匹配的文字图像,通过匹配到的文字图像得到对应的文字符号。采用上述进一步的有益效果是:将抠出的文字图像与预存的文字图像进行匹配,再通过匹配到的文字图像得到对应的文字符号。本专利技术解决上述技术问题的另一技术方案如下:一种文字提取方法,包括:将带有文字的背景图片进行扫描,得到待处理图像;提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;根据预设颜色值分别对待处理图像整体的第一颜色值和待处理图像中文字部分第二颜色值进行调整,加大第一颜色值和第二颜色值的差值,并根据预设亮度值对待处理图像整体的第一亮度值和待处理图像中文字部分第二亮度值进行调整,加大第一亮度值和第二亮度值的差值;从调整后的待处理图像中提取出文字图像;将提取出的文字图像转换为对应的文字符号。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述根据预设颜色值分别对第一颜色值和第二颜色值进行调整,并根据预设亮度值对第一亮度值和第二亮度值进行调整具体包括:将第一颜色值减去预设颜色值得到新的第一颜色值,将第二颜色值加上预设颜色值得到新的第二颜色值,根据新的第一颜色值和新的第二颜色值对待处理图像进行调整;将第一亮度值减去预设亮度值得到新的第一亮度值,将第二亮度值加上预设亮度值得到新的第二亮度值,根据新的第一亮度值和新的第二亮度值对待处理图像进行调整。采用上述进一步的有益效果是:将待处理图像中的背景色与文字部分的色差增大,有利于获取文字部分的图像。进一步,所述从调整后的待处理图像中提取出文字图像具体包括:从调整后的待处理图像中对文字部分进行描边处理,得到文字轮廓,根据文字轮廓提取出文字图像。进一步,所述将提取出的文字图像转换为对应的文字符号具体包括:根据提取出的文字图像与预设文字库中的文字图像进行匹配,得到匹配的文字图像,通过匹配到的文字图像得到对应的文字符号。采用上述进一步的有益效果是:将抠出的文字图像与预存的文字图像进行匹配,再通过匹配到的文字图像得到对应的文字符号。附图说明图1为本专利技术一实施例提供的文字提取系统的模块框图;图2为本专利技术另一实施例提供的文字提取方法的方法流程图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。图1为本专利技术一实施例提供的文字提取系统的模块框图;如图1所示,一种文字提取系统,包括:扫描模块,用于将带有文字的背景图片进行扫描,得到待处理图像;第一提取模块,用于提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;调整模块,用于根据预设颜色值分别对待处理图像整体的第一颜色值和待处理图像中文字部分第二颜色值进行调整,加大第一颜色值和第二颜色值的差值,并根据预设亮度值对待处理图像整体的第一亮度值和待处理图像中文字部分第二亮度值进行调整,加大第一亮度值和第二亮度值的差值;第二提取模块,用于从调整后的待处理图像中提取出文字图像;转换模块,用于将提取出的文字图像转换为对应的文字符号。可选的,作为本专利技术的一个实施例,所述调整模块具体用于,将第一颜色值减去预设颜色值得到新的第一颜色值,将第二颜色值加上预设颜色值得到新的第二颜色值,根据新的第一颜色值和新的第二颜色值对待处理图像进行调整;将第一亮度值减去预设亮度值得到新的第一亮度值,将第二亮度值加上预设亮度值得到新的第二亮度值,根据新的第一亮度值和新的第二亮度值对待处理图像进行调整。可选的,作为本专利技术的一个实施例,所述第二提取模块具体用于,从调整后的待处理图像中对文字部分进行描边处理,得到文字轮廓,根据文字轮廓提取出文字图像。可选的,作为本专利技术的一个实施例,所述转换模块具体用于,根据提取出的文字图像与预设文字库中的文字图像进行匹配,得到匹配的文字图像,通过匹配到的文字图像得到对应的文字符号。图2为本专利技术另一实施例提供的文字提取方法的方法流程图;可选的,作为本专利技术的另一个实施例,如图2所示,一种文字提取方法,包括:将带有文字的背景图片进行扫描,得到待处理图像;提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;根据预设颜色值分别对待处理图像整体的第一颜色值和待处理图像中文字部分第二颜色值进行调整,加大第一颜色值和第二颜色值的差值,并根据预设亮度值对待处理图像整体的第一亮度值和待处理图像中文字部分第二亮度值进行调整,加大第一亮度值和第二亮度值的差值;从调整后的待处理图像中提取出文字图像;将提取出的文字图像转换为对应的文字符号。可选的,作为本专利技术的一个实施例,所述根据预设颜色值分别对第一颜色值和第二颜色值进行调整,并根据预设亮度值对第一亮度值和第二亮度值进行调整具体包括:将第一颜色值减去预设颜色值得到新的第一颜色值,将第二颜色值加上预设颜色值得到新的第二颜色值,根据新的第一颜色值和新的第二颜色值对待处理图像进行调整;将本文档来自技高网...
一种文字提取系统及方法

【技术保护点】
一种文字提取系统,其特征在于,包括:扫描模块,用于将带有文字的背景图片进行扫描,得到待处理图像;第一提取模块,用于提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;调整模块,用于根据预设颜色值分别对待处理图像整体的第一颜色值和待处理图像中文字部分第二颜色值进行调整,加大第一颜色值和第二颜色值的差值,并根据预设亮度值对待处理图像整体的第一亮度值和待处理图像中文字部分第二亮度值进行调整,加大第一亮度值和第二亮度值的差值;第二提取模块,用于从调整后的待处理图像中提取出文字图像;转换模块,用于将提取出的文字图像转换为对应的文字符号。

【技术特征摘要】
1.一种文字提取系统,其特征在于,包括:扫描模块,用于将带有文字的背景图片进行扫描,得到待处理图像;第一提取模块,用于提取待处理图像整体的第一颜色值和第一亮度值,并提取待处理图像中文字部分的第二颜色值和第二亮度值;调整模块,用于根据预设颜色值分别对待处理图像整体的第一颜色值和待处理图像中文字部分第二颜色值进行调整,加大第一颜色值和第二颜色值的差值,并根据预设亮度值对待处理图像整体的第一亮度值和待处理图像中文字部分第二亮度值进行调整,加大第一亮度值和第二亮度值的差值;第二提取模块,用于从调整后的待处理图像中提取出文字图像;转换模块,用于将提取出的文字图像转换为对应的文字符号。2.根据权利要求1所述的一种文字提取系统,其特征在于,所述调整模块具体用于,将第一颜色值减去预设颜色值得到新的第一颜色值,将第二颜色值加上预设颜色值得到新的第二颜色值,根据新的第一颜色值和新的第二颜色值对待处理图像进行调整;将第一亮度值减去预设亮度值得到新的第一亮度值,将第二亮度值加上预设亮度值得到新的第二亮度值,根据新的第一亮度值和新的第二亮度值对待处理图像进行调整。3.根据权利要求1所述的一种文字提取系统,其特征在于,所述第二提取模块具体用于,从调整后的待处理图像中对文字部分进行描边处理,得到文字轮廓,根据文字轮廓提取出文字图像。4.根据权利要求3所述的一种文字提取系统,其特征在于,所述转换模块具体用于,根据提取出的文字图像与预设文字库中的文字图像进行匹配,得到匹配的文字图像,通过匹配到的文字图像得到对应的文字符号。5.一种文字提取方法,其特征在于,...

【专利技术属性】
技术研发人员:温九江袁松平
申请(专利权)人:广西小草信息产业有限责任公司
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1