一种提高ocr识别医疗费用清单效率的预处理方法和系统技术方案

技术编号:41852000 阅读:36 留言:0更新日期:2024-06-27 18:28
一种提高ocr识别医疗费用清单效率的预处理方法和系统,该方法调用ocr文件筛选模块,对上传的文件进行格式匹配筛选,对指定格式的文件进行过滤得到识别文件对象;对过滤后得到的所述识别文件对象,采用读取文件头与已知文件头签名匹配的方法确定文件类型;调用费用清单筛选模块,根据医院既有医疗费用清单数据,计算一年中医疗费用清单的大小极值,确定医院的医疗费用清单大小范围,对超出医院医疗费用清单大小范围的文件进行过滤。本发明专利技术实现了在ocr识别前预处理,将医疗费用清单外的文件筛选掉,只将医疗费用清单文件传输给ocr识别,解决了ocr识别压力大,识别效率低的问题。

【技术实现步骤摘要】

本专利技术涉及医疗费用清单数据处理,具体涉及一种提高ocr识别医疗费用清单效率的预处理方法和系统


技术介绍

1、在商保中,一般医疗费用清单都是通过ocr识别清单内容,然后保险再根据清单内容进行数据项核准报销。

2、目前,由于用户上传的文件中,有很多不是医保结算清单的文件,导致ocr需要识别很多无关文件图片,这增加了ocr识别压力,也影响了ocr识别医疗费用清单的效率。


技术实现思路

1、为此,本专利技术提供一种提高ocr识别医疗费用清单效率的预处理方法和系统,在ocr识别前预处理,将医疗费用清单外的文件筛选掉,只将医疗费用清单文件传输给ocr识别,解决了ocr识别压力大,识别效率低的问题。

2、为了实现上述目的,本专利技术提供如下技术方案:一种提高ocr识别医疗费用清单效率的预处理方法,包括:

3、调用ocr文件筛选模块,对上传的文件进行格式匹配筛选,对指定格式的文件进行过滤得到识别文件对象;对过滤后得到的所述识别文件对象,采用读取文件头与已知文件头签名匹配的方法确定文件本文档来自技高网...

【技术保护点】

1.一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,包括:

2.根据权利要求1所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述指定格式,包括手写字体文件格式、音频文件格式、视频文件格式和加密文件格式。

3.根据权利要求2所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述手写字体文件格式包括WILL、INK、MyScript格式;所述音频文件格式包括MP3、WAV、FLAC格式;所述视频文件格式包括AVI、MP4、MOV格式;所述加密文件格式包括PDF密码保护文件、加密ZIP文件等需要密码的文件格式。

...

【技术特征摘要】

1.一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,包括:

2.根据权利要求1所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述指定格式,包括手写字体文件格式、音频文件格式、视频文件格式和加密文件格式。

3.根据权利要求2所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述手写字体文件格式包括will、ink、myscript格式;所述音频文件格式包括mp3、wav、flac格式;所述视频文件格式包括avi、mp4、mov格式;所述加密文件格式包括pdf密码保护文件、加密zip文件等需要密码的文件格式。

4.根据权利要求1所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述读取文件头是通过编程语言的文件操作功能,对文件的开头若干字节进行读取,读取后与已知的文件头签名匹配。

5.根据权利要求1所述的一种提高ocr识别医疗费用清...

【专利技术属性】
技术研发人员:李少宇谢冠超
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1