一种基于OCR识别结果的大小写金额相互演算推测方法技术

技术编号:24093656 阅读:24 留言:0更新日期:2020-05-09 09:14
本发明专利技术提供一种基于OCR识别结果的大小写金额互推演算方法及系统,涉及图像光学字符识别领域,所述方法包括以下步骤,步骤1:设置OCR软件大写金额和小写金额的字符输出限定;步骤2:OCR软件识别输入大写金额和小写金额;步骤3:对输入的大写金额和小写金额进行初始化处理;步骤4:根据初始化处理后的大写金额和小写金额互推得到最终的大写金额和小写金额。本发明专利技术通过将OCR软件识别输入的大写金额、小写金额进行互推演算处理,最大程度还原被识别图像文件上的金额信息,解决现有OCR软件对于被识别图像不清晰导致识别结果不准确的问题,提高了OCR软件的识别准确率,使其更好的被下游软件系统使用。

A method of mutual calculation of amount in upper and lower case based on OCR recognition result

【技术实现步骤摘要】
一种基于OCR识别结果的大小写金额相互演算推测方法
本专利技术涉及图像光学字符识别领域,尤其涉及一种基于OCR识别结果的大小写金额互推演算方法及系统。
技术介绍
OCR软件,指利用OCR(OpticalCharacterRecognition,光学字符识别)技术,将图片、照片、电子传真等图像上的文字内容识别提取转换为可编辑文本的软件,通过扫描仪、照相机、电子传真机等设备获取并保存图像文件,然后通过OCR软件读取、分析图像文件并通过字符识别提取字符串。目前,税票、发票、合同、基金成交单和划款指令单等各种文件在进行数字化管理时,需要OCR软件对文件固定区域图像内容进行自动识别,提取金额数字等信息。然而在利用OCR软件进行金额数据识别提取时,由于识别图像文件内容会出现模糊、错位、图像噪点等情况,OCR软件识别结果会随之出现错误,导致重要的金额数据无法完全识别,在一般场景下,OCR软件自动识别、提取的大写金额和小写金额的结果会被下游系统直接获取使用,大写金额和小写金额两者之间不会有任何的处理,导致识别的大写金额和小写金额与实际文件图像中的金额数本文档来自技高网...

【技术保护点】
1.一种基于OCR识别结果的大小写金额互推演算方法,其特征在于,所述方法包括以下步骤:/n步骤1:设置OCR软件大写金额和小写金额的字符输出限定;/n步骤2:OCR软件识别输入大写金额和小写金额;/n步骤3:对输入的大写金额和小写金额进行初始化处理;/n步骤4:根据初始化处理后的大写金额和小写金额互推演算得到最终的大写金额和小写金额。/n

【技术特征摘要】
1.一种基于OCR识别结果的大小写金额互推演算方法,其特征在于,所述方法包括以下步骤:
步骤1:设置OCR软件大写金额和小写金额的字符输出限定;
步骤2:OCR软件识别输入大写金额和小写金额;
步骤3:对输入的大写金额和小写金额进行初始化处理;
步骤4:根据初始化处理后的大写金额和小写金额互推演算得到最终的大写金额和小写金额。


2.根据权利要求1所述的基于OCR识别结果的大小写金额互推演算方法,其特征在于,所述字符输出限定设置步骤具体如下:
步骤1.1:定义大写金额和小写金额识别输出字符组合;
步骤1.2:定义占位符替代识别输出字符组合以外的字符;
步骤1.3:根据大写金额的基本属性定义大写金额的数字和单位组成,并将单位分为大单位和小单位。


3.根据权利要求1所述的基于OCR识别结果的大小写金额互推演算方法,其特征在于,所述初始化处理步骤具体如下:
步骤3.1:过滤大写金额中的非法字符,只保留数字字符、单位字符和中间未被识别的占位符;
步骤3.2:过滤小写金额中的非法字符,只保留数字字符和小数点字符。


4.根据权利要求1所述的基于OCR识别结果的大小写金额互推演算方法,其特征在于:所述大写金额和小写金额互推演算步骤具体如下:
步骤4.1:判断初始化后的大写金额是否存在单位缺失,若是,则对初始化后的大写金额进行补单位处理...

【专利技术属性】
技术研发人员:叶瑞叶凯迪陆爱亮
申请(专利权)人:上海迈弦网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1