一种票据图像的处理方法及其相关设备技术

技术编号:38038715 阅读:18 留言:0更新日期:2023-06-30 11:05
本申请实施例属于图像处理领域,涉及一种票据图像的处理方法,包括对获取的票据图像进行文本识别,得到块集合,其中块集合包括多个文本块,每个文本块均携带有横坐标特征和纵坐标特征;从块集合中确定满足行基准规则且未排行的文本块作为行基准块,并根据纵坐标特征对与行基准块相邻且未排行的文本块进行排行处理,生成排行序列;从排行序列的目标行中将满足列基准规则的文本块作为列基准块,并根据横坐标特征对与列基准块相邻且位于目标行中未排列的文本块进行排列处理,生成排列序列;根据排行序列和排列序列生成排版数据。本申请还提供一种票据图像的处理的相关设备。本申请有效提升票据图像中信息的录入效率。效提升票据图像中信息的录入效率。效提升票据图像中信息的录入效率。

【技术实现步骤摘要】
一种票据图像的处理方法及其相关设备


[0001]本申请涉及图像处理
,尤其涉及一种票据图像的处理方法及其相关设备。

技术介绍

[0002]目前,在商务产生交易订单时,通常会产生交易订单相关的纸质和/或电子票据,为便于票据的管理,通常会将票据处理成的图像的形式进行存储;但现有的ERP系统中,这些票据图像中包含的信息通过人工录入至ERP系统中,如此不仅消耗大量的人力物力,影响供应链的管理效率。

技术实现思路

[0003]本申请实施例的目的在于提出一种票据图像的处理方法及其相关设备,以解决现有技术中人工录入票据信息的问题。
[0004]为了解决上述技术问题,本申请实施例提供一种票据图像的处理方法,采用了如下所述的技术方案:对获取的票据图像进行文本识别,得到块集合,其中所述块集合包括多个文本块,每个所述文本块均携带有横坐标特征和纵坐标特征;从所述块集合中确定满足行基准规则且未排行的所述文本块作为行基准块,并根据所述纵坐标特征对与所述行基准块相邻且未排行的所述文本块进行排行处理,生成排行序列;从所述排行序列的目标行中将满足列基准规则的所述文本块作为列基准块,并根据所述横坐标特征对与所述列基准块相邻且位于所述目标行中未排列的所述文本块进行排列处理,生成排列序列;根据所述排行序列和所述排列序列生成排版数据。
[0005]进一步的,所述从所述块集合中确定满足行基准规则且未排行的所述文本块作为行基准块的步骤包括:从所述块集合中获取所有未排行的所述文本块;根据所述行基准规则从所有未排行的所述文本块中确定目标的未排行的所述文本块作为行基准块。
[0006]进一步的,所述并根据所述纵坐标特征对与所述行基准块相邻且未排行的所述文本块进行排行处理,生成排行序列的步骤包括:将在第一预设方向与所述行基准块相邻且未排行的所述文本块作为待排行块;根据所述行基准块的纵坐标特征和所述待排行块的纵坐标特征,确定所述行基准块和所述待排行块是否位于同一行;若所述行基准块和所述待排行块位于同一行,则将所述待排行块作为已排行的所述文本块,并执行从所述块集合中获取所有未排行的所述文本块的步骤,直至所述块集合
中未有未排行的所述文本块后,将所述块集合中已排行的所述文本块汇合形成排行序列;若所述行基准块和所述待排行块未位于同一行,则执行所述将在第一预设方向与所述行基准块相邻且未排行的所述文本块作为待排行块的步骤。
[0007]进一步的,所述从所述排行序列的目标行中将满足列基准规则的所述文本块作为列基准块的步骤包括:从所述排行序列中选择目标行,其中所述目标行为所述排行序列中被选择的行,每行均包括多个所述文本块;判断所述目标行是否有未排列的所述文本块;若所述目标行有未排列的所述文本块,则根据所述列基准规则从所述目标行中选择目标的未排列的所述文本块作为待排列块,并将第二预设方向上与所述待排列块相邻且已排列的所述文本块作为列基准块。
[0008]进一步的,所述并根据所述横坐标特征对与所述列基准块相邻且位于所述目标行中未排列的所述文本块进行排列处理,生成排列序列的步骤包括:根据所述列基准块的所述横坐标特征和所述待排列块的横坐标特征,判断所述列基准块和所述待排列块是否位于同一列;若所述列基准块和所述待排列块位于同一列,则将所述待排列块作为已排列的文本块后,执行所述判断所述目标行是否有未排列的所述文本块的步骤,直至所述排行序列中未有未排列的所述文本块后,将所述排行序列中已排列的所述文本块汇合形成排列序列;若所述列基准块和所述待排列块未位于同一列,则从所述排行序列中获取已排列的行,将已排列的行中每个所述文本块分别作为对比块,根据各所述对比块对所述待排列块进行排列处理。
[0009]进一步的,所述根据各所述对比块对所述待排列块进行排列处理的步骤包括:根据所述对比块的所述横坐标特征和所述待排列块的横坐标特征,判断所述对比块和所述待排列块是否位于同一列;若所述对比块和所述待排列块位于同一列,则将所述待排列块作为已排列的文本块,执行所述判断所述目标行是否有未排列的所述文本块的步骤,直至所述排行序列中未有未排列的所述文本块后,将所述排行序列中已排列的所述文本块汇合形成排列序列;若所述对比块和所述待排列块未位于同一列,则将所述待排列块划分至所述目标行的新的列中,并将所述待排列块作为已排列的文本块后,执行所述判断所述目标行是否有未排列的所述文本块的步骤,直至所述排行序列中未有未排列的所述文本块后,将所述排行序列中已排列的所述文本块汇合形成排列序列。
[0010]进一步的,在所述判断所述目标行是否有未排列的所述文本块的步骤之后,还包括:若所述目标行未有未排列的所述文本块,则获取所述排行序列中新目标行,将所述新目标行作为所述目标行后,执行所述判断所述目标行是否有未排列的所述文本块的步骤,直至所述排行序列中所有行均未有未排列的所述文本块后,将所述排行序列中已排列的所述文本块汇合形成排列序列。
[0011]为了解决上述技术问题,本申请实施例还提供一种票据图像的处理装置,采用了
如下所述的技术方案:识别模块,用于对获取的票据图像进行文本识别,得到块集合,其中所述块集合包括多个文本块,每个所述文本块均携带有横坐标特征和纵坐标特征;第一生成模块,用于从所述块集合中确定满足行基准规则且未排行的所述文本块作为行基准块,并根据所述纵坐标特征对与所述行基准块相邻且未排行的所述文本块进行排行处理,生成排行序列;第二生成模块,用于从所述排行序列的目标行中将满足列基准规则的所述文本块作为列基准块,并根据所述横坐标特征对与所述列基准块相邻且位于所述目标行中未排列的所述文本块进行排列处理,生成排列序列;第三生成模块,用于根据所述排行序列和所述排列序列生成排版数据。
[0012]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的票据图像的处理方法的步骤。
[0013]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的票据图像的处理方法的步骤。
[0014]与现有技术相比,本申请实施例主要有以下有益效果:在对票据图像进行识别得到块集合后,根据纵坐标特征对与行基准块相邻且未排行的文本块进行排行处理,生成排行序列,并根据横坐标特征对与列基准块相邻且位于目标行中未排列的文本块进行排列处理,生成排列序列,根据排行序列和排列序列形成排版数据,使票据图像中包含的信息可通过排版数据自动录入至系统中,减少了人力物力的损耗,且提升了票据图像中信息的录入效率,也便于票据数据的管理。
附图说明
[0015]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据图像的处理方法,其特征在于,包括下述步骤:对获取的票据图像进行文本识别,得到块集合,其中所述块集合包括多个文本块,每个所述文本块均携带有横坐标特征和纵坐标特征;从所述块集合中确定满足行基准规则且未排行的所述文本块作为行基准块,并根据所述纵坐标特征对与所述行基准块相邻且未排行的所述文本块进行排行处理,生成排行序列;从所述排行序列的目标行中将满足列基准规则的所述文本块作为列基准块,并根据所述横坐标特征对与所述列基准块相邻且位于所述目标行中未排列的所述文本块进行排列处理,生成排列序列;根据所述排行序列和所述排列序列生成排版数据。2.根据权利要求1所述的票据图像的处理方法,其特征在于,所述从所述块集合中确定满足行基准规则且未排行的所述文本块作为行基准块的步骤包括:从所述块集合中获取所有未排行的所述文本块;根据所述行基准规则从所有未排行的所述文本块中确定目标的未排行的所述文本块作为行基准块。3.根据权利要求2所述的票据图像的处理方法,其特征在于,所述并根据所述纵坐标特征对与所述行基准块相邻且未排行的所述文本块进行排行处理,生成排行序列的步骤包括:将在第一预设方向与所述行基准块相邻且未排行的所述文本块作为待排行块;根据所述行基准块的纵坐标特征和所述待排行块的纵坐标特征,确定所述行基准块和所述待排行块是否位于同一行;若所述行基准块和所述待排行块位于同一行,则将所述待排行块作为已排行的所述文本块,并执行从所述块集合中获取所有未排行的所述文本块的步骤,直至所述块集合中未有未排行的所述文本块后,将所述块集合中已排行的所述文本块汇合形成排行序列;若所述行基准块和所述待排行块未位于同一行,则执行所述将在第一预设方向与所述行基准块相邻且未排行的所述文本块作为待排行块的步骤。4.根据权利要求1至3中任一项所述的票据图像的处理方法,其特征在于,所述从所述排行序列的目标行中将满足列基准规则的所述文本块作为列基准块的步骤包括:从所述排行序列中选择目标行,其中所述目标行为所述排行序列中被选择的行,每行均包括多个所述文本块;判断所述目标行是否有未排列的所述文本块;若所述目标行有未排列的所述文本块,则根据所述列基准规则从所述目标行中选择目标的未排列的所述文本块作为待排列块,并将第二预设方向上与所述待排列块相邻且已排列的所述文本块作为列基准块。5.根据权利要求4所述的票据图像的处理方法,其特征在于,所述并根据所述横坐标特征对与所述列基准块相邻且位于所述目标行中未排列的所述文本块进行排列处理,生成排列序列的步骤包括:根据所述列基准块的所述横坐标特征和所述待排列块的横坐标特征,判断所述列基准块和所述待排列块是否位于同一列;
若所述列基准块和所述待排列块位于同一列,则将所述待排列块作为已排列的文本块后,执行所述判断所述目标行是否有...

【专利技术属性】
技术研发人员:何嘉伟毛景羡杨官龙陆崇远
申请(专利权)人:湖南九立供应链有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1