文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33271221 阅读:52 留言:0更新日期:2022-04-30 23:28
本公开提供了一种文本处理方法、装置、电子设备及存储介质,涉及图像处理技术领域,尤其涉及计算机视觉领域。具体实现方案为:确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度;将多个字段中相似度大于相似度阈值的字段,确定为目标字段名;从多个字段中除目标字段名之外的M个剩余字段中,确定与目标字段名相对应的目标字段值,M≥1;以及输出目标字段名与目标字段值之间的对应关系。关系。关系。

【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质


[0001]本公开涉及图像处理
,尤其涉及计算机视觉领域,更具体地,本公开提供了一种文本处理方法、装置、电子设备、存储介质以及计算机程序产品。

技术介绍

[0002]金融、零售等行业会使用大量票据,一些数票据存在内容相似,但版面不同的情况。例如金融行业使用的银行回单,不同银行回单里包括相同字段,多种银行回单中包括“付款人”、“收款人”、“账户”等字段,但不同银行的银行回单各不相同,有时同一家银行在不同地区的多个分行所使用的银行回单也不相同。为了知晓票据涉及的业务信息,需要将大量票据中的内容进行汇总。

技术实现思路

[0003]本公开提供了一种文本处理方法、装置、电子设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面,提供了一种文本处理方法,包括确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度;将所述多个字段中相似度大于相似度阈值的字段,确定为目标字段名;从所述多个字段中除所述目标字段名之外的M个剩余字段中,确定与所述目标字段名相对应的目标字段值,其中,M≥1;以及输出所述目标字段名与所述目标字段值之间的对应关系。
[0005]根据本公开的另一方面,提供了一种文本处理装置,包括相似度确定模块、第一目标字段名确定模块、目标字段值确定模块以及输出模块。相似度确定模块用于确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度。第一目标字段名确定模块用于将所述多个字段中相似度大于相似度阈值的字段,确定为目标字段名。目标字段值确定模块用于从所述多个字段中除所述目标字段名之外的M个剩余字段中,确定与所述目标字段名相对应的目标字段值,其中,M≥1。输出模块用于输出所述目标字段名与所述目标字段值之间的对应关系。
[0006]根据本公开的另一个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的方法。
[0007]根据本公开的另一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的方法。
[0008]根据本公开的另一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的方法。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1是根据本公开实施例的文本处理方法和装置的应用场景示意图;
[0012]图2A是根据本公开实施例的文本处理方法的示意流程图;
[0013]图2B是根据本公开实施例的待处理文本图像的示意图;
[0014]图2C是根据本公开实施例的第一种分组方案涉及的总距离的示意图;
[0015]图2D是根据本公开实施例的第二种分组方案涉及的总距离的示意图;
[0016]图3是根据本公开另一实施例的文本处理方法的示意流程图。
[0017]图4A是根据本公开实施例的文本处理方法的示意原理图;
[0018]图4B是根据本公开实施例的待处理文本图像的示意图;
[0019]图5是根据本公开实施例的文本处理装置的示意结构框图;以及
[0020]图6是用来实施本公开实施例的文本处理方法的电子设备的结构框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]对图像进行文字识别,可以将图像中的待处理文本按照从上到下和从左到右的方式逐行返回,但是返回结果缺少结构信息,结构信息表示文本中涉及的字段和字段值的对应关系。
[0023]例如,识别一张进货单,返回结果中包括“产品名称”、“产品单价”、“产品数量”、“1000”、“3”等字段,但是无法根据返回结果确定“1000”和“3”两个数值中,哪一个是“产品单价”,哪一个是“产品数量”。
[0024]例如,识别一张银行票据,返回结果中包括付款人、付款人的具体姓名、账户、账户具体内容、开户行、开户行具体内容,但是无法确定各个字段之间的对应关系。
[0025]例如,识别一张火车票,返回结果中,始发站、车次、到达站由于处于同一行,且在图像中的距离较近,因此始发站、车次、到达站容易被识别为一个字段。
[0026]如果返回结构中包括结构信息,能够方便下游任务使用,例如根据产品单价和产品数量,计算产品总额。
[0027]在一种技术方案中,可以预先设置模板。在使用时,要求单据中的信息按照模板的格式来填写,从而在识别模板中的内容之后,可以根据模板的格式来确定结构信息。但是上述技术方案要求票据格式与模板格式完全相同,否则会出现识别失败的情况。此外,对于二次打印的票据,因为票据底版的内容与打印的内容会出现位置偏差,例如二次打印的内容相对于票据底版整体向上偏移,会对上述方案造成干扰,影响识别结果的准确性。
[0028]图1是根据本公开实施例的文本处理方法和装置的应用场景示意图。
[0029]需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0030]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0031]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0032]服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据待处理文本图像生成的目标字段名、目标字段值以及对应关系等)反馈给终端设备。
[0033]需要说明的是,本公开实施例所提供的文本处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的文本处理装置一般可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,包括:确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度;将所述多个字段中相似度大于相似度阈值的字段,确定为目标字段名;从所述多个字段中除所述目标字段名之外的M个剩余字段中,确定与所述目标字段名相对应的目标字段值,其中,M≥1;以及输出所述目标字段名与所述目标字段值之间的对应关系。2.根据权利要求1所述的方法,还包括,在确定为目标字段名之后:从所述多个字段中确定N个目标分组字段以及N个重复字段,其中,N≥2;以及根据所述待处理文本图像中所述N个目标分组字段的位置信息和所述N个重复字段的位置信息,对所述N个目标分组字段与所述N个重复字段进行分组,得到N个字段组,其中,所述N个字段组中的每个字段组包括一个目标分组字段和一个重复字段。3.根据权利要求2所述的方法,其中,所述根据所述待处理文本图像中所述N个目标分组字段的位置信息和所述N个重复字段的位置信息,对所述N个目标分组字段与所述N个重复字段进行分组,得到N个字段组包括:确定多个分组方案,其中,所述多个分组方案中的每个分组方案与N个候选字段组相关;针对所述每个分组方案,确定所述待处理文本图像中与所述N个候选字段组分别对应的字段距离,基于所述字段距离之和确定总距离;其中,与每个候选字段组对应的字段距离是该候选字段组中的目标分组字段和重复字段之间的距离;以及将与所述总距离最小的分组方案相关的N个候选字段组,确定为所述N个字段组。4.根据权利要求1所述的方法,其中,从所述多个字段中除所述目标字段名之外的M个剩余字段中,确定与所述目标字段名相对应的目标字段值包括:从所述M个剩余字段中,确定所述待处理文本图像中与所述目标字段名之间的距离小于或等于预定距离的字段,得到至少一个候选字段;以及根据所述目标字段名的类型和所述至少一个候选字段的类型,从所述至少一个候选字段中确定所述目标字段值。5.根据权利要求1所述的方法,还包括对所述目标字段值进行以下操作中的至少一个:根据所述目标字段值的类型,修改所述目标字段值的格式;以及在确定与同一个所述目标字段名具有对应关系的两个目标字段值分别为汉字数码和阿拉伯数字,且所述汉字数码的数值和阿拉伯数字的数值不同的情况下,利用所述汉字数码的数值修正所述阿拉伯数字的数值。6.根据权利要求1所述的方法,还包括:将所述待处理文本图像包括的多个原始字段中与所述多个预定字段名中任一预定字段名相同的字段,确定为所述目标字段名;以及将所述多个原始字段中除所述目标字段名之外的字段,确定为所述待处理文本图像包括的多个字段。7.根据权利要求1所述的方法,还包括:对所述待处理文本图像进行识别,得到多个分词;以及根据所述待处理文本图像中所述多个分词彼此之间的距离和所述多个分词中的每个
分词的语义信息,将所述多个分词中的至少两个分词组合为字段,得到所述多个字段。8.一种文本处理装置,包括:相似度确定模块,用于确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度;第一目标字段名确定模块,用于将所述多个字段中相似度大于相似度阈值的字段,确定为目标字段名;目标字段值确定模块,用于从所述多个字段中除所述目标字段名之外的M个剩余字段中,确定与所述目标字段名相对应的目标字段值,其...

【专利技术属性】
技术研发人员:向宇波王佳阳何烩烩沈俊宇苏崔聪张红光
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1