一种医疗票据的处理方法以及处理系统技术方案

技术编号：34110153 阅读：18 留言：0更新日期：2022-07-12 01:12

本发明专利技术提供了一种医疗票据的处理方法以及处理系统，所述处理方法包括：将影像数据通过OCR文字识别输出票据上文本及文本框对应的位置信息，再经实体抽取对基于先验知识定义好的标签从每个文本框中抽取需要的实体要素；过采用结构化处理方法对所述实体要素进行结构化处理，以达到与票面的明细一致的结果。本发明专利技术的处理方法能够高效的针对医疗票据进行处理审核，且审核准确性较高，避免了现有技术中录单时需要采用人工的方式，也避免了错误率逐渐增加从而增加审核难度的问题发生。渐增加从而增加审核难度的问题发生。渐增加从而增加审核难度的问题发生。

全部详细技术资料下载

【技术实现步骤摘要】
一种医疗票据的处理方法以及处理系统

[0001]本专利技术涉及医疗票据处理领域，具体而言，涉及一种医疗票据的处理方法以及处理系统。

技术介绍

[0002]目前保险行业中对于理赔录单的流程普遍依靠的是人工录入与人工校验核对的方法。这种传统模式需要耗费大量的人力物力，对于长时间需要大量处理录单需求来说，持续低下的人工效率与业务增量的现实形成了很大矛盾，并且不同人员对业务的理解存在差异，很难形成规范化的理赔录单定式。因此需要采取创新性的智能化手段来提升与解决保险行业内的已知痛点，构建高效且精准度高的智能化理赔录入系统已势在必行。
[0003]在结构化数据、人工智能时代的洪流下，如何采用创新型的技术来提升传统保险行业的工作效率、提升客户体验感、降低误报率、标准化理赔等需求已然成为目前的迫切任务。
[0004]有鉴于此，特提出本专利技术。

技术实现思路

[0005]有鉴于此，本专利技术公开了一种针对医疗票据的处理方法以及处理系统，本专利技术通过采用多模态深度学习加结构化后处理的方式构建一套智能理赔录单系统，从而能够高效的针对医疗票据进行处理审核，且审核准确性较高，避免了现有技术中录单时需要采用人工的方式，也避免了错误率逐渐增加从而增加审核难度的问题发生。
[0006]具体地，本专利技术是通过以下技术方案实现的：
[0007]第一方面，本专利技术公开了一种医疗票据的处理方法，包括如下步骤：
[0008]将影像数据通过OCR文字识别输出票据上文本及文本框对应的位置信息，再经实...

【技术保护点】

【技术特征摘要】
1.一种医疗票据的处理方法，其特征在于，包括如下步骤：将影像数据通过OCR文字识别输出票据上文本及文本框对应的位置信息，再经实体抽取对基于先验知识定义好的标签从每个文本框中抽取需要的实体要素；通过采用结构化处理方法对所述实体要素进行结构化处理，以达到与票面的明细一致的结果。2.根据权利要求1所述的处理方法，其特征在于，所述结构化的处理方法包括Y阈值法，公共部分比例判断法以及竖直组斜率拼接法中的其中一种或几种的结合。3.根据权利要求2所述的处理方法，其特征在于，所述Y阈值法包括如下步骤：从所述实体要素中分离出包含标签的部分，取出包含医疗明细费用项目的条目；按照固定的位置信息的Y值设置阈值范围来获取同一行的其他所有条目；将所有条目中按照X坐标进行排序，遍历所有非费用项的条目直到遇到下个费用项截止。4.根据权利要求2所述的处理方法，其特征在于，所述公共部分比例判断法包括如下步骤：从所述实体要素中分离出包含标签的部分，取出包含医疗明细费用项目的条目，以此条目为A项，以其他某一条目为B项；对A项与B项文本的左侧边的高度和具体坐标进行计算，然后计算公共部分长度的比例；当所述公共部分长度的比例大于50％，判定B项与A项为同一行，并将B项变为A项，然后继续搜寻新的B项；将同一行的所有条目按照X坐标的升序排序，然后按照费用项标签进行切分，切分开的每个区间的若干条目组成详细的医疗明细进行输出。5.根据权利要求2所述的处理方法，其特征在于，所述竖直组斜率拼接法包括如下步骤：从所述实体要素中分离出...

【专利技术属性】
技术研发人员：王欣屹，
申请(专利权)人：金科览智科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人