【技术实现步骤摘要】
票据机构名称的识别方法、装置、设备及介质
[0001]本申请涉及信息识别及数字医疗
,尤其涉及一种票据机构名称的识别方法
、
装置
、
设备及介质
。
技术介绍
[0002]随着医疗费用的持续增长以及人口老龄化日趋严重,人们对健康保障的需求日益高涨,越来越多的消费者开始意识到医疗保险的价值
。
医疗票据作为医疗理赔最核心的理算依据,需要录入的项目繁多
、
类目复杂,仅一张医疗票据就需录入
200
余项内容,同时要保证信息的完整性和准确度
。
因此,对于票据文本的精准识别对于医疗理赔的处理效率至关重要
。
[0003]目前,对于医疗票据的识别通常是通过票据扫描采集
、
图像处理
、OCR
识别技术等,将票据图像中票据号
、
日期
、
金额
、
公司名称等信息快速
、
准确的提取并保存
。
[0004]但是,在某些场景中,用户需要提取发票中的机构信息实体,与其他实体不同的是,机构信息一般会以两种方式呈现,一种是正常的文本形式以
key
‑
value(
键值对
)
的结构出现在发票中,如医疗机构名称:北京协和医院,而另一种则是以印章形式出现
。
尽管目前文本检测
、
文本识别技术较成熟,但在实际场景中,印章识
【技术保护点】
【技术特征摘要】
1.
一种票据机构名称的识别方法,其特征在于,所述方法包括:基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列;基于第二文本识别网络,对所述目标票据中票据机构名称的文字文本区域进行特征提取,获得第二特征序列;基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列;基于预设的文本对齐算法,对所述融合特征序列进行对齐识别,获得所述票据机构名称
。2.
根据权利要求1所述的票据机构名称的识别方法,其特征在于,所述基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列之前,还包括:获取所述目标票据的票据图片;基于文本检测算法,识别并提取所述票据图片中票据机构名称的文字文本区域;基于图像分割算法,识别并提取所述票据图片中的印章文本区域
。3.
根据权利要求1所述的票据机构名称的识别方法,其特征在于,所述第一文本识别网络包括第一文本检测子网络和特征序列提取子网络;所述基于第一文本识别网络,对目标票据中的印章文本区域进行特征提取,获得第一特征序列,包括:基于所述第一文本检测子网络,检测所述印章文本区域中所述票据机构名称的文本行,获得目标文本框;基于所述特征序列提取子网络,对所述目标文本框中的文本进行特征提取,获得所述第一特征序列
。4.
根据权利要求3所述的票据机构名称的识别方法,其特征在于,所述基于所述第一文本检测网络,检测所述印章文本区域中所述票据机构名称的文本行,获得目标文本框,包括:基于所述第一文本检测网络,提取所述场景文本区域的至少八个控制点;基于所述控制点,拟合生成所述文本行的文本框曲线,获得弯曲文本框;基于预设对齐算法,对所述弯曲文本框进行矩形变换,获得所述目标文本框
。5.
根据权利要求1所述的票据机构名称的识别方法,其特征在于,所述基于预设的特征序列融合模块,对所述第一特征序列和所述第二特征序列进行特征融合,获得融合特征序列,包括:获取所述第一特征序列的至少一个第一特征向量以及所述第二特征序列的至少一个第二特征向量;在所述第二特征向量中查询与所述第一特征向量相匹配的目标特征向量;在查询到所述第二特征向量中存在与所述第一特征向量相匹配的目标特征向量时,获取所述目标特征向量在所述第二特征序列中的目标位置,并将所述第一特征向量添加到所述第二特征序列中的目标位置的前一位置或后一位置处,直至完成所有第一特征向量的查询和插入,获得所述融合...
【专利技术属性】
技术研发人员:孙瑜尧,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。