【技术实现步骤摘要】
一种发票文本检测方法
本专利技术涉及发票文本检测
,具体为一种发票文本检测方法。
技术介绍
普通发票和专用发票是日常生活中经常使用的两种发票,两者票据面上的信息模式有相同部分也存在一定的差异,如何对这两种发票中的关键文本进行准确快速的检测是票据识别技术的关键。现有方法之一是使用传统机器学习方法,如先对图像进行去噪处理,再进行灰度化,二值化,轮廓提取,形态学变换等方法确定票据位置以及文本位置,但该方法鲁棒性差、准确率低,不适合商用。现有方法之二是使用深度学习方法中的通用物体检测方法对发票文本框进行检测,如使用物体检测网络先对发票进行分类与检测,然后在检测到的发票区域再使用检测网络对文本框进行检测,该方法的准确率大大高于传统方法,但通用物体检测方法往往只能检测水平矩形框,当文本发生倾斜时,水平矩形框里会留下太多空白无效区域,给检测效果带来影响。现有方法之三是使用深度学习方法中的专用文本检测网络对发票进行文本检测,不少专用文本检测方法支持倾斜文本框检测,但这种网络往往十分臃肿,模型体积较大,对硬件要求 ...
【技术保护点】
1.一种发票文本检测方法,其特征在于:该发票文本检测方法的具体检测步骤如下:/nS1:输入图像:将需要检测发票文本的图像信息采集输入,使得输入的图像信息在显示区域内;/nS2:发票关键点检测与发票关键区域剪裁对齐:对这关键点的检测,使用但不限于用关键点检测方法或者先对关键点进行语义分割再求区域坐标均值,最终可得到关键区域的水平对齐图像;/nS3:发票文本框检测:在获得水平对齐好的图像后,使用文本检测方法对该图像文本进行检测,包括但不限于传统检测方法或深度学习检测方法;/nS4:发票分类与坐标逆映射:检测到文本框后,可以根据文本框的数目判断该发票是普票还是专票,由于普票比专票 ...
【技术特征摘要】 【专利技术属性】
1.一种发票文本检测方法,其特征在于:该发票文本检测方法的具体检测步骤如下:
S1:输入图像:将需要检测发票文本的图像信息采集输入,使得输入的图像信息在显示区域内;
S2:发票关键点检测与发票关键区域剪裁对齐:对这关键点的检测,使用但不限于用关键点检测方法或者先对关键点进行语义分割再求区域坐标均值,最终可得到关键区域的水平对齐图像;
S3:发票文本框检测:在获得水平对齐好的图像后,使用文本检测方法对该图像文本进行检测,包括但不限于传统检测方法或深度学习检测方法;
S4:发票分类与坐标逆映射:检测到文本框后,可以根据文本框的数目判断该发票是普票还是专票,由于普票比专票多一个校验码,统计检测框有6个即为专用发票,有7个则为普通发票,检测到文本框后,将文本框顶点坐标先映射回原图,在原图上再进行裁减,用之前求得投影矩阵的逆矩阵左乘坐标即可得到原图坐标,文本框顶点坐标映射回原图后,在原图上裁剪文字框;
S5:输出图像:将上述处理后的图像保存输出。
技术研发人员:张欢,李爱林,张仕洋,周先得,
申请(专利权)人:深圳市华付信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。