【技术实现步骤摘要】
本专利技术涉及医疗费用清单数据处理,具体涉及一种提高ocr识别医疗费用清单效率的预处理方法和系统。
技术介绍
1、在商保中,一般医疗费用清单都是通过ocr识别清单内容,然后保险再根据清单内容进行数据项核准报销。
2、目前,由于用户上传的文件中,有很多不是医保结算清单的文件,导致ocr需要识别很多无关文件图片,这增加了ocr识别压力,也影响了ocr识别医疗费用清单的效率。
技术实现思路
1、为此,本专利技术提供一种提高ocr识别医疗费用清单效率的预处理方法和系统,在ocr识别前预处理,将医疗费用清单外的文件筛选掉,只将医疗费用清单文件传输给ocr识别,解决了ocr识别压力大,识别效率低的问题。
2、为了实现上述目的,本专利技术提供如下技术方案:一种提高ocr识别医疗费用清单效率的预处理方法,包括:
3、调用ocr文件筛选模块,对上传的文件进行格式匹配筛选,对指定格式的文件进行过滤得到识别文件对象;对过滤后得到的所述识别文件对象,采用读取文件头与已知文件头签
...【技术保护点】
1.一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,包括:
2.根据权利要求1所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述指定格式,包括手写字体文件格式、音频文件格式、视频文件格式和加密文件格式。
3.根据权利要求2所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述手写字体文件格式包括WILL、INK、MyScript格式;所述音频文件格式包括MP3、WAV、FLAC格式;所述视频文件格式包括AVI、MP4、MOV格式;所述加密文件格式包括PDF密码保护文件、加密ZIP文件等需要密码的文
...
【技术特征摘要】
1.一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,包括:
2.根据权利要求1所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述指定格式,包括手写字体文件格式、音频文件格式、视频文件格式和加密文件格式。
3.根据权利要求2所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述手写字体文件格式包括will、ink、myscript格式;所述音频文件格式包括mp3、wav、flac格式;所述视频文件格式包括avi、mp4、mov格式;所述加密文件格式包括pdf密码保护文件、加密zip文件等需要密码的文件格式。
4.根据权利要求1所述的一种提高ocr识别医疗费用清单效率的预处理方法,其特征在于,所述读取文件头是通过编程语言的文件操作功能,对文件的开头若干字节进行读取,读取后与已知的文件头签名匹配。
5.根据权利要求1所述的一种提高ocr识别医疗费用清...
【专利技术属性】
技术研发人员:李少宇,谢冠超,
申请(专利权)人:云知声智能科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。