The invention relates to a multi-specification text cooperative location and extraction method, which comprises the following steps: step 110 to obtain text image data; step 120, image normalization operation; step 130, to separate image background information and foreground information to be collected; step 140, global cooperative search, to extract each text in the preset format. Block area; step 150, local optimization search, optimize the location of each text area in a small range one by one; step 160 outputs the location results of each text block, and provides them to the subsequent word segmentation and recognition module. The invention utilizes image processing, target detection, cooperative search, local optimization and other technologies to meet the requirements of formatted data acquisition, overcomes the problems of missing and error detection after some text blocks degenerate, avoids the interference of unnecessary text and noise information to the greatest extent, and improves the accuracy and accuracy of formatted text information acquisition.
【技术实现步骤摘要】
一种多规格文本协同定位和提取方法
本专利技术属于图像处理和目标检测
,具体涉及一种多规格文本协同定位和提取方法。
技术介绍
近年来,随着数字成像设备的普及和深度学习算法的广泛应用,文本识别软件不断涌现,如汉王、腾讯云识别、百度云识别等,文本识别精度不断提升。但是,这些文本识别软件是通用识别,只要图像中出现的文字都会尝试识别,除了返回识别结果和坐标位置,很难对识别结果进行分类归集,不能直接满足有格式要求的文本识别和数字化采集的应用需求。
技术实现思路
本专利技术提供一种多规格文本协同定位和提取方法以解决目前存在的文本识别软件很难对识别结果进行分类归集,不能直接满足有格式要求的文本识别和数字化采集的应用需求的问题。本专利技术的具体技术方案如下:一种多规格文本协同定位和提取方法,其特征在于,所述方法包括如下步骤:步骤110,获取文本图像数据;步骤120,图像归一化操作;图像归一化的方法包括,直线检测、旋转变换、尺度变换、亮度均衡,通过归一化操作得到大小、亮度、方向一致的文本图像;步骤130,在步骤120之后,分离图像背景信息和需要采集的前景信息;可通过色彩通道、亮度、 ...
【技术保护点】
1.一种多规格文本协同定位和提取方法,其特征在于,所述方法包括如下步骤:步骤110,获取文本图像数据;步骤120,图像归一化操作;图像归一化的方法包括,直线检测、旋转变换、尺度变换、亮度均衡,通过归一化操作得到大小、亮度、方向一致的文本图像;步骤130,在步骤120之后,分离图像背景信息和需要采集的前景信息;可通过色彩通道、亮度、颜色比例来分离背景信息和需要采集的前景信息;步骤140,全局协同搜索;在步骤130确定前景信息后,加载预先设定的格式化模板,通过全局协同搜索,得到有效信息最大化的位置,从而提取出预设格式的各个文本块区域;步骤150,局部优化搜索;在步骤140确定全 ...
【技术特征摘要】
1.一种多规格文本协同定位和提取方法,其特征在于,所述方法包括如下步骤:步骤110,获取文本图像数据;步骤120,图像归一化操作;图像归一化的方法包括,直线检测、旋转变换、尺度变换、亮度均衡,通过归一化操作得到大小、亮度、方向一致的文本图像;步骤130,在步骤120之后,分离图像背景信息和需要采集的前景信息;可通过色彩通道、亮度、颜色比例来分离背景信息和需要采集的前景信息;步骤140,全局协同搜索;在步骤130确定前景信息后,加载预先设定的格式化模板,通过全局协同搜索,得到有效信息最大化的位置,从而提取出预设格式的各个文本块区域;步骤150,局部优化搜索;在步骤140确定全局的格式文本区域后,在小范围内逐个优化各个文本块区域的位置;步骤160,输出;在步骤150局部优化搜索后,输出各个文本块,提供给后续单字切分和识别模块,文本定位和提取结束。2.根据权利要求1所述的多规格文本协同定位和提取方法,其特征在于:步骤110获取图像数据的方法可以为以下五种方法之一:方法1是用智能手机拍摄得到的图像;方法2是用扫描仪得到的图像数据;方法3是用数码相机拍摄得到的图像;方法4是打开一个预先存在的包含图像数据的文件夹,批处理该文件夹内所有的图像文件;方法5是打开一个预先存在的图像文件,读取该文件中的图像数据。3.根据权利要求1或2所述的多规格文本协同定位和提取方法,其特征在于:步骤120图像归一化...
【专利技术属性】
技术研发人员:严京旗,张成栋,李进文,罗宝娟,
申请(专利权)人:南通艾思达智能科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。