【技术实现步骤摘要】
光学字符识别方法及装置
本专利技术涉及互联网领域,尤其涉及一种光学字符识别方法及装置。
技术介绍
目前,光学字符识别(OpticalCharacterRecognition,OCR)在多个行业广泛使用,例如银行、住宿等,在这些行业中,用户习惯将所有的票据都交给机器,让机器自动对票据的影像识别。虽然目前采用新的深度学习技术来解决票据识别率低的问题,但是仍然存在很多机器无法识别或者很难识别的票据。对于该部分票据,采用OCR技术处理后错误率非常高,现有技术一般通过专业的业务人员去校验OCR识别结果是否正确,效率低下。
技术实现思路
本专利技术提出一种光学字符识别方法,用以对光学字符进行识别,效率高,该方法包括:获得票据的当前影像数据和历史影像数据,所述历史影像数据包括光学字符识别成功的历史影像数据和光学字符识别失败的历史影像数据;将票据的当前影像数据输入至二分类模型中,判断当前影像数据是否符合预设条件,所述二分类模型是对历史影像数据进行训练获得的;在当前影像数据符合预设条件时,将当前影像 ...
【技术保护点】
1.一种光学字符识别方法,其特征在于,包括:/n获得票据的当前影像数据和历史影像数据,所述历史影像数据包括光学字符识别成功的历史影像数据和光学字符识别失败的历史影像数据;/n将票据的当前影像数据输入至二分类模型中,判断当前影像数据是否符合预设条件,所述二分类模型是对历史影像数据进行训练获得的;/n在当前影像数据符合预设条件时,将当前影像数据输入至OCR识别模型中,获得光学字符识别结果。/n
【技术特征摘要】
1.一种光学字符识别方法,其特征在于,包括:
获得票据的当前影像数据和历史影像数据,所述历史影像数据包括光学字符识别成功的历史影像数据和光学字符识别失败的历史影像数据;
将票据的当前影像数据输入至二分类模型中,判断当前影像数据是否符合预设条件,所述二分类模型是对历史影像数据进行训练获得的;
在当前影像数据符合预设条件时,将当前影像数据输入至OCR识别模型中,获得光学字符识别结果。
2.如权利要求1所述的光学字符识别方法,其特征在于,所述二分类模型采用TensorFlow或CNN训练获得。
3.如权利要求1所述的光学字符识别方法,其特征在于,还包括:
在当前影像数据不符合预设条件时,输出当前影像数据不符合预设条件的提示信息;
接收用户根据所述提示信息重新输入的票据的当前影像数据。
4.如权利要求1所述的光学字符识别方法,其特征在于,OCR识别模型包括分类器字符识别模型、字符模板匹配模型和深度学习模型中的其中一种或任意组合。
5.一种光学字符识别装置,其特征在于,包括:
数据获得模块,用于获得票据的当前影像数据和历史影像数据,所述历史影像数据包括光学字符识别成功的历史影像数据和光学字符识别失败的历...
【专利技术属性】
技术研发人员:丁平,杨春明,郭铸,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。