医疗票据识别方法、装置、设备及存储介质制造方法及图纸

技术编号:28943044 阅读:15 留言:0更新日期:2021-06-18 21:51
本发明专利技术属于信息识别领域,公开了一种医疗票据识别方法、装置、设备及存储介质,包括获取待识别医疗票据的票据图片、票据类型和票据所属地域,确定待识别医疗票据的类别;根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;根据预设的医疗知识库,对各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果,根据预设的业务规则逻辑进行业务逻辑校验,得到各字段的最终转码识别结果;将各字段的最终转码识别结果按照预设的集成要求集成后输出,有效提升医疗票据识别的准确性和识别效率。

【技术实现步骤摘要】
医疗票据识别方法、装置、设备及存储介质
本专利技术属于信息识别领域,涉及一种医疗票据识别方法、装置、设备及存储介质。
技术介绍
在保险理赔过程中,保险公司需要用户提交理赔的各项材料,其中,最主要的材料就是用户就诊的医疗票据信息,包括但不限于发票、费用明细、病历及检查检验报告等。但是,用户一般提供的都是图片影像材料而非结构化数据,继而通过保险公司的理赔作业人员在理赔系统中录入,信息获取效率低,并且录入的结构化信息一般仅为影像中的少量信息,大部分的就诊信息都未录入信息,导致信息缺失,影响理赔结果。为了提高信息获取效率,目前一般采用OCR技术实现信息的自动获取,并且,随着OCR技术的日趋成熟,目前证照、激光打印类图片识别准确率能够达到95%以上。但是,目前的OCR技术厂商仅提供算法技术,而非整套的解决方案。同时,由于医疗票据本身一般质量都比较差,且医疗票据内的部分就诊信息比较专业领域化,导致现有OCR技术对医疗票据的识别准确率较低,一般在70%~80%左右。
技术实现思路
本专利技术的目的在于克服上述现有技术中,医本文档来自技高网...

【技术保护点】
1.一种医疗票据识别方法,其特征在于,包括:/n获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;/n根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;/n根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;/n根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻...

【技术特征摘要】
1.一种医疗票据识别方法,其特征在于,包括:
获取待识别医疗票据的票据图片、票据类型和票据所属地域,并根据票据类型和票据所属地域,确定待识别医疗票据的类别;
根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎,通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果;
根据预设的医疗知识库,对所述各字段的字段识别结果进行智能匹配转码,得到各字段的转码识别结果;
根据预设的业务规则逻辑,从各字段的转码识别结果中获取与业务规则逻辑相关联的若干转码识别结果,得到若干关联识别结果;将若干关联识别结果按照预设的业务规则逻辑组合后,进行业务逻辑校验;当若干关联识别结果不满足预设的业务规则逻辑时,业务逻辑校验未通过;否则,业务逻辑校验通过,将当前各字段的转码识别结果作为各字段的最终转码识别结果;
当业务逻辑校验未通过时,生成人工作业请求,基于人工作业请求获取若干关联识别结果对应字段的人工识别结果,将若干关联识别结果更新为人工识别结果,将各字段的转码识别结果中与关联识别结果对应的转码识别结果替换为更新后的关联识别结果,得到各字段的最终转码识别结果;
将各字段的最终转码识别结果按照预设的集成要求集成后输出。


2.根据权利要求1所述的医疗票据识别方法,其特征在于,所述根据票据类型和票据所属地域,确定待识别医疗票据的类别前,包括:
将待识别医疗票据的票据图片进行数据质控预处理、数据脱敏预处理和分割切片预处理中的至少一种。


3.根据权利要求2所述的医疗票据识别方法,其特征在于,当将待识别医疗票据的票据图片进行数据质控预处理时,所述将待识别医疗票据的票据图片进行数据质控预处理具体包括:
根据预设的票据模板,通过模糊检测算法检测待识别医疗票据的票据图片,得到票据图片的模糊程度、票据存在张数以及倾斜程度;
当票据图片的模糊程度在预设的模糊程度阈值以内时,保留当前票据图片,否则,生成人工作业请求;
当票据存在张数大于1时,将票据图片分割为仅包含单张票据的若干子票据图片;否则,保留当前票据图片;
当票据图片的倾斜程度在预设的倾斜程度阈值以内时,保留当前票据图片,否则,将票据图片进行角度旋转至票据图片的倾斜程度在倾斜程度阈值以内。


4.根据权利要求1所述的医疗票据识别方法,其特征在于,所述根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取目标OCR识别引擎具体包括:
根据待识别医疗票据的类别,从预设的若干OCR识别引擎中选取以与待识别医疗票据的类别相同类别的医疗票据的票据图片训练后的OCR识别引擎,得到目标OCR识别引擎;
所述医疗票据识别方法还包括:
将包含人工识别结果的票据图片作为训练样本,根据包含人工识别结果的票据图片对应的医疗票据的类别,对经过相同类别的医疗票据的票据图片进行训练后得到的OCR识别引擎重新进行训练。


5.根据权利要求1所述的医疗票据识别方法,其特征在于,当从预设的若干OCR识别引擎中选取的目标OCR识别引擎为两个及以上时,所述通过目标OCR识别引擎识别待识别医疗票据的票据图片,得到票据图片内各字段的字段识别结果的具体方法为:
通过各目标OCR识别引擎...

【专利技术属性】
技术研发人员:谢虹瞿城
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1