光学字符识别辅助方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:22565683 阅读:29 留言:0更新日期:2019-11-16 12:16
本发明专利技术涉及人工智能技术领域,提供了一种光学字符识别辅助方法、装置、计算机设备及存储介质,所述光学字符识别辅助方法包括:获取操作用户发送的待识别的目标图片;使用光学字符识别工具对目标图片中的字符信息进行字符识别,得到识别结果及识别结果对应的可信度;将可信度与预设阈值进行比较;若可信度大于等于预设阈值,则将可信度对应的识别结果确定为目标结果;若可信度小于预设阈值,则对可信度对应的识别结果进行预处理,以确定目标结果;将目标结果作为光学字符识别结果发送给操作用户。本发明专利技术的技术方案实现对光学字符识别结果进行辅助校验,进一步提高光学字符识别的准确性,保证操作用户的工作效率。

Optical character recognition assistant method, device, computer equipment and storage medium

The invention relates to the field of artificial intelligence technology, and provides an optical character recognition auxiliary method, device, computer equipment and storage medium. The optical character recognition auxiliary method includes: obtaining the target picture to be recognized sent by the operating user; using the optical character recognition tool to recognize the character information in the target picture, and obtaining the recognition result and recognition result Corresponding credibility: compare the credibility with the preset threshold; if the credibility is greater than or equal to the preset threshold, determine the recognition result corresponding to the credibility as the target result; if the credibility is less than the preset threshold, preprocess the recognition result corresponding to the credibility to determine the target result; send the target result as the optical character recognition result to the operating user. The technical scheme of the invention realizes the auxiliary verification of the optical character recognition result, further improves the accuracy of the optical character recognition, and ensures the working efficiency of the operation user.

【技术实现步骤摘要】
光学字符识别辅助方法、装置、计算机设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种光学字符识别辅助方法、装置、计算机设备及存储介质。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是指通过AI算法对图像中的文字进行识别。但由于目前的算法处理能力有限,往往识别出来的结果准确性无法达到100%或者达到使用者的需求,如果将OCR识别结果原封不动的作为参考答案发放给用户进行校验,会存在识别结果不准确的情况,从而影响用户的工作效率。
技术实现思路
本专利技术实施例提供一种光学字符识别辅助方法、装置、计算机设备及存储介质,以解决OCR识别不准确,影响用户工作效率的问题。一种光学字符识别辅助方法,包括:获取操作用户发送的待识别的目标图片,其中,所述目标图片包括字符信息;使用光学字符识别工具对所述目标图片中的字符信息进行字符识别,得到识别结果及所述识别结果对应的可信度;将所述可信度与预设阈值进行比较;若所述可信度大于等于预设阈值,则将所述可信度对应的所述识别结果确定为目标结果;若所述可信度小于预设阈值,则对所述可信度对应的所述识别结果进行预处理,以确定目标结果;将所述目标结果作为光学字符识别结果发送给所述操作用户。一种光学字符识别辅助装置,包括:第一获取模块,用于获取操作用户发送的待识别的目标图片,其中,所述目标图片包括字符信息;识别模块,用于使用光学字符识别工具对所述目标图片中的字符信息进行字符识别,得到识别结果及所述识别结果对应的可信度;第一比较模块,用于将所述可信度与预设阈值进行比较;第一比较结果模块,用于若所述可信度大于等于预设阈值,则将所述可信度对应的所述识别结果确定为目标结果;第二比较结果模块,用于若所述可信度小于预设阈值,则对所述可信度对应的所述识别结果进行预处理,以确定目标结果;发送模块,用于将所述目标结果作为光学字符识别结果发送给所述操作用户。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述光学字符识别辅助方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述光学字符识别辅助方法的步骤。上述光学字符识别辅助方法、装置、计算机设备及存储介质,通过利用OCR工具对待识别的目标图片进行识别,得到识别结果及识别结果对应的可信度,并将可信度与预设阈值进行比较,将大于等于预设阈值的可信度对应的识别结果确定为目标结果,将小于预设阈值的可信度对应的识别结果进行预处理,得到预处理后的目标结果,最后再把目标结果作为OCR识别结果发送给操作用户,从而实现对OCR识别出来的识别结果进行辅助校验,针对可信度不高的识别结果进行预处理,能够有效弥补OCR算法识别的不足,进一步提高OCR识别的准确性,保证操作用户的工作效率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的光学字符识别辅助方法的流程图;图2是本专利技术实施例提供的光学字符识别辅助方法中步骤S5的流程图;图3是本专利技术实施例提供的光学字符识别辅助方法中步骤S51的流程图;图4是本专利技术实施例提供的光学字符识别辅助方法中步骤S513的流程图;图5是本专利技术实施例提供的光学字符识别辅助方法中在第一目标结果、第二目标结果和识别结果都不相同的情况下确定目标结果的流程图;图6是本专利技术实施例提供的光学字符识别辅助方法中更新OCR识别库的流程图;图7是本专利技术实施例提供的光学字符识别辅助装置的示意图;图8是本专利技术实施例提供的计算机设备的基本机构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请提供的光学字符识别辅助方法应用于服务端,服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。在一实施例中,如图1所示,提供一种光学字符识别辅助方法,包括如下步骤:S1:获取操作用户发送的待识别的目标图片,其中,目标图片包括字符信息。在本专利技术实施例中,待识别的目标图片是指包括字符信息,且需要通过OCR工具帮助识别的图片。具体地,当操作用户在客户端中发送待识别的目标图片时,目标图片将自动保存到预设图片库中,通过对预设图片库进行检测,若检测到预设图片库中存在待识别的目标图片,则对该目标图片进行获取。其中,预设图片库是指专门用于存储待识别的目标图片的数据库。需要说明的是,当从预设图片库中获取到目标图片后,将该目标图片从预设图片库中进行删除处理。S2:使用光学字符识别工具对目标图片中的字符信息进行字符识别,得到识别结果及识别结果对应的可信度。在本专利技术实施例中,光学字符识别工具是指专门利用字符识别方法将图片中的字符形状翻译成计算机文字的工具。可信度是指OCR工具针对识别出来的识别结果设定的信赖程度,可信度越高,表示OCR识别的准确率越高。具体地,通过直接使用OCR工具识别目标图片中的字符信息,得到OCR工具识别后输出的识别结果以及该识别结果对应的可信度。例如,通过利用OCR识别工具对目标图片中的字符信息进行识别后,得到的识别结果为“ABCD”,且该识别结果对应的可信度为80%。S3:将可信度与预设阈值进行比较。具体地,根据步骤S2中得到识别结果对应的可信度,将该可信度与预设阈值进行比较。S4:若可信度大于等于预设阈值,则将可信度对应的识别结果确定为目标结果。具体地,根据步骤S3中将该可信度与预设阈值进行比较,若比较结果为可信度大于等于预设阈值,则将该可信度对应的识别结果确定为目标结果。其中,预设阈值具体可以是80%,也可以根据用户的实际需求进行设置,此处不做限制。例如,存在识别结果A,其对应的可信度为80%,预设阈值为80%,将可信度与预设阈值进行比较,由于可信度与预设阈值都为80%,故将该识别结果A确定为目标结果。S5:若可信度小于预设阈值,则对可信度对应的识别结果进行预处理,以确定目标结果。具体地,据步骤S3中将该可信度与预设阈值进行比较,若比较结果为可信度小于预设阈值,则表示该可信度对应的识别结果的准确性达不到用户设定的标准,对识别结果进行预处理,预处理的具体过程可以包括:对识别结果进行修改处理得到参考结果,再将参考结果及待识本文档来自技高网...

【技术保护点】
1.一种光学字符识别辅助方法,其特征在于,所述光学字符识别辅助方法包括:/n获取操作用户发送的待识别的目标图片,其中,所述目标图片包括字符信息;/n使用光学字符识别工具对所述目标图片中的字符信息进行字符识别,得到识别结果及所述识别结果对应的可信度;/n将所述可信度与预设阈值进行比较;/n若所述可信度大于等于预设阈值,则将所述可信度对应的所述识别结果确定为目标结果;/n若所述可信度小于预设阈值,则对所述可信度对应的所述识别结果进行预处理,以确定目标结果;/n将所述目标结果作为光学字符识别结果发送给所述操作用户。/n

【技术特征摘要】
1.一种光学字符识别辅助方法,其特征在于,所述光学字符识别辅助方法包括:
获取操作用户发送的待识别的目标图片,其中,所述目标图片包括字符信息;
使用光学字符识别工具对所述目标图片中的字符信息进行字符识别,得到识别结果及所述识别结果对应的可信度;
将所述可信度与预设阈值进行比较;
若所述可信度大于等于预设阈值,则将所述可信度对应的所述识别结果确定为目标结果;
若所述可信度小于预设阈值,则对所述可信度对应的所述识别结果进行预处理,以确定目标结果;
将所述目标结果作为光学字符识别结果发送给所述操作用户。


2.如权利要求1所述的光学字符识别辅助方法,其特征在于,所述若所述可信度小于预设阈值,则对所述可信度对应的识别结果进行预处理,以确定目标结果的步骤包括:
若所述可信度小于预设阈值,则对所述可信度对应的所述识别结果按预设修改方案进行修改处理,得到参考结果;
将所述参考结果及所述目标图片分别发送给第一目标用户和第二目标用户进行校验;
获取所述第一目标用户反馈的第一目标结果,所述第二目标用户反馈的第二目标结果;
对所述第一目标结果、所述第二目标结果和所述识别结果进行匹配;
若所述第一目标结果、所述第二目标结果和所述识别结果之中至少有两个相同,则将相同的结果确定为所述目标结果。


3.如权利要求2所述的光学字符识别辅助方法,其特征在于,所述若所述可信度小于预设阈值,则对所述可信度对应的所述识别结果按预设修改方案进行修改处理,得到参考结果的步骤包括:
若所述可信度小于预设阈值,则获取所述识别结果对应的字符个数n,其中,n为正整数;
根据所述字符个数n,生成a个随机数,其中,所述a和所述随机数均为正整数,且a∈[1,2]、所述随机数的取值范围为[1,n];
选取所述随机数的数量a对应的修改方案,以对所述识别结果进行修改处理,得到参考结果,其中,所述修改方案包括但不限于以下处理中的一种或者多种:将X与Y交换、将X替换Y、剔除X和插入X,X和Y为不同的随机数对应的字符。


4.如权利要求3所述的光学字符识别辅助方法,其特征在于,所述根据随机数的数量a,选取所述数量a对应的修改方案对所述识别结果进行修改处理,得到参考结果的步骤包括:
将所述随机数的数量a与预设数值进行比较;
若所述随机数的数量a大于预设数值,则随机采用将X与Y交换或将X替换Y的修改方案对所述识别结果进行修改处理,得到所述参考结果;
若所述随机数的数量a小于等于预设数值,则随机采用剔除X或插入X的修改方案对所述识别结果进行修改处理,得到所述参考结果。


5.如权利要求2所述的光学字符识别辅助方法,其特征在于,所述对所述第一目标结果、所述第二目标结果和所述识别结果进行匹配的步骤之后,所述光学字符识别辅助方法还包括:
若所述第一目标结果、所述第二目标结果和所述识别结果互不相同,则将所述随机数的数...

【专利技术属性】
技术研发人员:郭俊雄王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1