一种票据文本识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：37330960 阅读：16 留言：0更新日期：2023-04-21 23:08

本申请实施例属于人工智能中的票据文本识别技术领域，涉及一种票据文本识别方法，包括获取待识别的票据图像；通过预设的识别定位模型对票据图像进行文本识别；通过预设的多模态transformer模型对文本信息进行命名实体抽取；基于预设配对规则，结合多个命名实体和布局信息构建实体对的候选集；通过预设的关联判断模型对每个实体对是否存在关联进行判断；将判断结果为存在关联的实体对进行合并。本申请还提供一种票据识别装置、计算机设备及存储介质。此外，本申请还涉及区块链技术，用户的票据图像、文本信息等可存储于区块链中

全部详细技术资料下载

【技术实现步骤摘要】
一种票据文本识别方法、装置、计算机设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种票据文本识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]医疗账单是医疗保险报销必须提供的材料，医疗账单票面包含就诊人姓名、发票号、合计金额、费用项信息、统筹基金支付、就诊日期等关键字段。当前全国各地存在多种版式的医疗账单，这些关键字段所在位置及形式并不统一。即便当前国家推行电子票据，仍有相当高比例医院未接入电子发票，且各医院对电子发票“其他信息”区域的打印信息不一致。这些情况导致医保报销时录入人员需基于对业务的理解关注不同版式发票的不同信息。
[0003]医疗账单场景中的结构化识别通常有以下几种解决方案：利用OCR识别模型对医疗发票进行文本识别，基于NLP技术进行全文抽取；基于固定字段切片或固定区域，抽取所需关键字段信息；基于多个检测及分割模型，分区块进行识别与匹配；自定义大量解析模板，不同类型发票分流至对应解析流程。
[0004]然而，在实际应用过程中，经常出现如下问题：纸张较薄易折叠弯曲，导致账单同一费用项的多个信息不在同一水平线上，名称和金额等信息无法一一对应；部分字段出现换行，只能抽取到第一行的信息。
[0005]现有技术对于上述医疗票据的易折叠、部分字段换行打印等特点未做针对性优化，导致识别结果经常出现错误，使得需要人工介入的环节较多，拉长周期，同时也提高了理赔报销信息化成本。

技术实现思路

[0006]本申请实施例的目的在于提出一种票据文本识别方法、装...

【技术保护点】

【技术特征摘要】
1.一种票据文本识别方法，其特征在于，包括下述步骤：获取待识别的票据图像；通过预设的识别定位模型对所述票据图像进行文本识别，得到文本信息和对应的布局信息；通过预设的多模态transformer模型对所述文本信息进行命名实体抽取，得到对应的多个命名实体；基于预设配对规则，结合所述多个命名实体和所述布局信息构建实体对的候选集；通过预设的关联判断模型对每个所述实体对是否存在关联进行判断；将判断结果为存在关联的实体对进行合并，得到合并文本。2.根据权利要求1所述的票据文本识别方法，其特征在于，在所述通过预设的识别定位模型对所述票据图像进行文本识别的步骤之前，还包括：对所述票据图像是否存在偏转进行判断；若存在偏转，则对所述票据图像进行旋转操作，得到正向的所述票据图像。3.根据权利要求1或2所述的票据文本识别方法，其特征在于，在所述通过预设的识别定位模型对所述票据图像进行文本识别的步骤之前，还包括：将所述票据图像输入预设的语义分割模型，得到对应的掩码图；提取所述掩码图的连通域的边界，设定所述边界的最小外接矩形区域；对所述票据图像的所述矩形区域外的区域进行白色填充处理。4.根据权利要求1或2所述的票据文本识别方法，其特征在于，所述通过预设的多模态transformer模型对所述文本信息进行命名实体抽取的步骤之前，还包括：通过查询预设的同义词库，判断所述文本信息是否存在同义词；在判断存在所述同义词时，对所述文本信息进行所述同义词替换。5.根据权利要求1或2所述的票据文本识别方法，其特征在于，所述通过预设的多模态transformer模型对所述文本信息进行命名实体抽取的步骤，具体包括：将所述票据图像、所述文本信息和所述布局信息输入所述预设的多模态transformer模型进行所述命名实体抽取，得到所述多个命名实体。6.根据权利要求1或2所述的票据文本...

【专利技术属性】
技术研发人员：郭喜亚，
申请(专利权)人：平安健康保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人