票据机构名称的识别方法技术

技术编号:39578188 阅读:13 留言:0更新日期:2023-12-03 19:28
本申请提供一种票据机构名称的识别方法

【技术实现步骤摘要】
票据机构名称的识别方法、装置、设备及介质


[0001]本申请涉及信息识别及数字医疗
,尤其涉及一种票据机构名称的识别方法

装置

设备及介质


技术介绍

[0002]随着医疗费用的持续增长以及人口老龄化日趋严重,人们对健康保障的需求日益高涨,越来越多的消费者开始意识到医疗保险的价值

医疗票据作为医疗理赔最核心的理算依据,需要录入的项目繁多

类目复杂,仅一张医疗票据就需录入
200
余项内容,同时要保证信息的完整性和准确度

因此,对于票据文本的精准识别对于医疗理赔的处理效率至关重要

[0003]目前,对于医疗票据的识别通常是通过票据扫描采集

图像处理
、OCR
识别技术等,将票据图像中票据号

日期

金额

公司名称等信息快速

准确的提取并保存

[0004]但是,在某些场景中,用户需要提取发票中的机构信息实体,与其他实体不同的是,机构信息一般会以两种方式呈现,一种是正常的文本形式以
key

value(
键值对
)
的结构出现在发票中,如医疗机构名称:北京协和医院,而另一种则是以印章形式出现

尽管目前文本检测

文本识别技术较成熟,但在实际场景中,印章识别由于文本方向多是弯曲且经常出现重叠,准确度相对不高,而普通文本识别也可能会因为重叠等原因,效果达不到预想效果

[0005]因此,如何解决目前票据机构名称的识别准确性低下成为亟待解决的技术问题


技术实现思路

[0006]本申请提供了一种票据机构名称的识别方法

装置

设备及存储介质,旨在提高票据机构名称的识别准确性

[0007]第一方面,本申请提供一种票据机构名称的识别方法,所述方法包括:
[0008]基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列;
[0009]基于第二文本识别网络,对所述目标票据中票据机构名称的文字文本区域进行特征提取,获得第二特征序列;
[0010]基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列;
[0011]基于预设的文本对齐算法,对所述融合特征序列进行对齐识别,获得所述票据机构名称

[0012]第二方面,本申请还提供一种票据机构名称的识别装置,所述票据机构名称的识别装置包括:
[0013]第一特征序列获取模块,用于基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列;
[0014]第二特征序列获取模块,用于基于第二文本识别网络,对所述目标票据中票据机构名称的文字文本区域进行特征提取,获得第二特征序列;
[0015]特征序列融合模块,用于基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列;
[0016]票据机构名称获得模块,用于基于预设的文本对齐算法,对所述融合特征序列进行对齐识别,获得所述票据机构名称

[0017]第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器

存储器

以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的票据机构名称的识别方法的步骤

[0018]第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的票据机构名称的识别方法的步骤

[0019]本申请提供一种票据机构名称的识别方法

装置

设备及存储介质,本申请方法包括基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列;基于第二文本识别网络,对所述目标票据中票据机构名称的文字文本区域进行特征提取,获得第二特征序列;基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列;基于预设的文本对齐算法,对所述融合特征序列进行对齐识别,获得所述票据机构名称

通过上述方式,通过提取目标票据中的印章文本区域以及文字文本区域中的票据机构名称的文本提取,从而获得印章文本区域和文字文本区域中的票据机构名称对应的第一特征序列和第二特征序列,便于对票据中票据机构名称的验证识别,提高票据机构名称的识别准确性;通过对第一特征序列和第二特征序列的特征融合,进一步地对于票据中票据机构名称对应特征的验证,从而提高了票据机构名称的识别准确性

附图说明
[0020]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0021]图1为本申请提供的一种票据机构名称的识别方法第一实施例的流程示意图;
[0022]图2为本申请提供的一种票据机构名称的识别方法第二实施例的流程示意图;
[0023]图3为本申请实施例提供的票据机构名称识别方法的数据处理流程示意图;
[0024]图4为本申请提供的一种票据机构名称的识别方法第三实施例的流程示意图;
[0025]图5是本申请提供的一种票据机构名称的识别装置第一实施例的结构示意图;
[0026]图6是本申请实施例提供的一种计算机设备的结构示意性框图

[0027]本申请目的的实现

功能特点及优点将结合实施例,参照附图做进一步说明

具体实施方式
[0028]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例

基于本申
请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围

[0029]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作
/
步骤,也不是必须按所描述的顺序执行

例如,有的操作
/
步骤还可以分解

组合或部分合并,因此实际执行的顺序有可能根据实际情况改变

[0030]下面结合附图,对本申请的一些实施方式作详细说明...

【技术保护点】

【技术特征摘要】
1.
一种票据机构名称的识别方法,其特征在于,所述方法包括:基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列;基于第二文本识别网络,对所述目标票据中票据机构名称的文字文本区域进行特征提取,获得第二特征序列;基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列;基于预设的文本对齐算法,对所述融合特征序列进行对齐识别,获得所述票据机构名称
。2.
根据权利要求1所述的票据机构名称的识别方法,其特征在于,所述基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列之前,还包括:获取所述目标票据的票据图片;基于文本检测算法,识别并提取所述票据图片中票据机构名称的文字文本区域;基于图像分割算法,识别并提取所述票据图片中的印章文本区域
。3.
根据权利要求1所述的票据机构名称的识别方法,其特征在于,所述第一文本识别网络包括第一文本检测子网络和特征序列提取子网络;所述基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列,包括:基于所述第一文本检测子网络,检测所述印章文本区域中所述票据机构名称的文本行,获得目标文本框;基于所述特征序列提取子网络,对所述目标文本框中的文本进行特征提取,获得所述第一特征序列
。4.
根据权利要求3所述的票据机构名称的识别方法,其特征在于,所述基于所述第一文本检测网络,检测所述印章文本区域中所述票据机构名称的文本行,获得目标文本框,包括:基于所述第一文本检测网络,提取所述场景文本区域的至少八个控制点;基于所述控制点,拟合生成所述文本行的文本框曲线,获得弯曲文本框;基于预设对齐算法,对所述弯曲文本框进行矩形变换,获得所述目标文本框
。5.
根据权利要求1所述的票据机构名称的识别方法,其特征在于,所述基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列,包括:获取所述第一特征序列的至少一个第一特征向量以及所述第二特征序列的至少一个第二特征向量;在所述第二特征向量中查询与所述第一特征向量相匹配的目标特征向量;在查询到所述第二特征向量中存在与所述第一特征向量相匹配的目标特征向量时,获取所述目标特征向量在所述第二特征序列中的目标位置,并将所述第一特征向量添加到所述第二特征序列中的目标位置的前一位置或后一位置处,直至完成所有第一特征向量的查询和插入,获得所述融合...

【专利技术属性】
技术研发人员:孙瑜尧
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1