基于制造技术

技术编号:39733333 阅读:9 留言:0更新日期:2023-12-17 23:35
本申请揭示了一种基于

【技术实现步骤摘要】
基于OCR技术的订单预处理方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于
OCR
技术的订单预处理方法

装置

设备及介质


技术介绍

[0002]在设备安装等场景中,用户提交包含图像的订单时,首先需要基于
OCR(Optical Character Recognition,
光学字符识别
)
技术对图像进行文字识别,然后根据识别的文字提交订单

然而,在文字识别不准确时,需要用户多次更换图像进行尝试提交,增加了订单提交的复杂程度


技术实现思路

[0003]基于此,有必要针对现有技术的在文字识别不准确时,需要用户多次更换图像进行尝试提交,增加了订单提交的复杂程度的技术问题,提出了一种基于
OCR
技术的订单预处理方法

装置

设备及介质

[0004]第一方面,提供了一种基于
OCR
技术的订单预处理方法,所述方法包括:获取目标用户输入的与目标订单对应的各个目标图像及每个所述目标图像对应的描述数据;对所述目标图像进行基于所述描述数据的识别质量分类预测,得到单图像质量数据,采用
OCR
技术,对所述目标图像进行基于所述描述数据的文本识别,得到单图像初始文本;采用结合审核端的处理策略,对所述单图像质量数据小于第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到目标文本;采用自动处理策略,对所述单图像质量数据大于或等于所述第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到所述目标文本;根据所述目标订单对应的各个所述目标文本,生成订单处理请求

[0005]第二方面,提供了一种基于
OCR
技术的订单预处理装置,所述装置包括:数据获取模块,用于获取目标用户输入的与目标订单对应的各个目标图像及每个所述目标图像对应的描述数据;初级确定模块,用于对所述目标图像进行基于所述描述数据的识别质量分类预测,得到单图像质量数据,采用
OCR
技术,对所述目标图像进行基于所述描述数据的文本识别,得到单图像初始文本;第一处理模块,用于采用结合审核端的处理策略,对所述单图像质量数据小于第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到目标文本;第二处理模块,用于采用自动处理策略,对所述单图像质量数据大于或等于所述第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到
所述目标文本;请求生成模块,用于根据所述目标订单对应的各个所述目标文本,生成订单处理请求

[0006]第三方面,提供了一种计算机设备,包括存储器

处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于
OCR
技术的订单预处理方法的步骤

[0007]第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于
OCR
技术的订单预处理方法的步骤

[0008]本申请的基于
OCR
技术的订单预处理方法

装置

设备及介质,本申请的方法通过获取目标用户输入的与目标订单对应的各个目标图像及每个所述目标图像对应的描述数据,对所述目标图像进行基于所述描述数据的识别质量分类预测,得到单图像质量数据,采用
OCR
技术,对所述目标图像进行基于所述描述数据的文本识别,得到单图像初始文本,采用结合审核端的处理策略,对所述单图像质量数据小于第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到目标文本,采用自动处理策略,对所述单图像质量数据大于或等于所述第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到所述目标文本,根据所述目标订单对应的各个所述目标文本,生成订单处理请求

实现了只需用户输入与目标订单对应的各个目标图像及每个所述目标图像对应的描述数据,即可自动化进行订单的预处理,不需用户更换图像进行尝试提交,降低了订单提交的复杂程度,提高了用户的提交效率;另外,根据单图像质量数据和第一阈值的对比结果,采用不同的策略对基于
OCR
技术得到的单图像初始文本进行处理,提高目标文本的准确性

附图说明
[0009]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0010]其中:图1为一个实施例中基于
OCR
技术的订单预处理方法的应用环境图;图2为一个实施例中基于
OCR
技术的订单预处理方法的流程图;图3为一个实施例中基于
OCR
技术的订单预处理装置的结构框图;图4为一个实施例中计算机设备的结构框图

具体实施方式
[0011]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0012]本专利技术实施例提供的基于
OCR
技术的订单预处理方法,可应用在如图1的应用环境中,其中,客户端
110
通过网络与服务端
120
进行通信

[0013]服务端
120
可以通过客户端
110
获取目标用户输入的与目标订单对应的各个目标图像及每个所述目标图像对应的描述数据

服务端
120
通过对所述目标图像进行基于所述描述数据的识别质量分类预测,得到单图像质量数据,采用
OCR
技术,对所述目标图像进行基于所述描述数据的文本识别,得到单图像初始文本;采用结合审核端的处理策略,对所述单图像质量数据小于第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到目标文本;采用自动处理策略,对所述单图像质量数据大于或等于所述第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到所述目标文本;根据所述目标订单对应的各个所述目标文本,生成订单处理请求

实现了只本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于
OCR
技术的订单预处理方法,所述方法包括:获取目标用户输入的与目标订单对应的各个目标图像及每个所述目标图像对应的描述数据;对所述目标图像进行基于所述描述数据的识别质量分类预测,得到单图像质量数据,采用
OCR
技术,对所述目标图像进行基于所述描述数据的文本识别,得到单图像初始文本;采用结合审核端的处理策略,对所述单图像质量数据小于第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到目标文本;采用自动处理策略,对所述单图像质量数据大于或等于所述第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到所述目标文本;根据所述目标订单对应的各个所述目标文本,生成订单处理请求
。2.
根据权利要求1所述的基于
OCR
技术的订单预处理方法,其特征在于,所述采用自动处理策略,对所述单图像质量数据大于或等于所述第一阈值的所述目标图像对应的所述单图像初始文本进行基于所述描述数据的处理,得到所述目标文本的步骤,包括:采用所述自动处理策略,对第一文本进行基于所述描述数据的处理,得到所述目标文本,所述第一文本对应的所述单图像质量数据大于或等于所述第一阈值,并且,小于或等于第二阈值,其中,所述第二阈值大于所述第一阈值;将第二文本作为所述目标文本,所述第二文本对应的所述单图像质量数据大于所述第二阈值
。3.
根据权利要求2所述的基于
OCR
技术的订单预处理方法,其特征在于,所述采用所述自动处理策略,对第一文本进行基于所述描述数据的处理,得到所述目标文本的步骤,包括:根据所述第一文本对应的所述描述数据,对所述第一文本对应的所述目标图像进行基于字体及字号的候选字预测,得到各个第一候选字集,根据所述第一文本对应的所述描述数据,对所述第一文本进行基于上文的下一个字符预测,得到各个第二候选字集;采用遍历方式,将所述第一文本中的一个字符作为指定字符;判断指定字符是否存在目标位置对应的所述第一候选字集及所述第二候选字集中,其中,所述目标位置是所述指定字符在所述第一文本对应的所述目标图像中的位置;若是,则将所述指定字符所在目标字符;若否,根据所述第一文本和所述第一文本对应的所述描述数据,对所述目标位置进行基于上下文的预测,得到第三候选字集,根据所述目标位置对应的所述第一候选字集

所述第二候选字集及所述第三候选字集,确定替换字符,采用所述替换字符,对所述第一文本中的与所述目标位置对应的字符进行替换;在完成所述第一文本的字符的遍历之后,将所述第一文本作为所述目标文本
。4.
根据权利要求3所述的基于
OCR
技术的订单预处理方法,其特征在于,所述根据所述第一文本对应的所述描述数据,对所述第一文本对应的所述目标图像进行基于字体及字号的候选字预测,得到各个第一候选字集的步骤,包括:采用遍历方式,将所述第一文本中的缺位符作为指定符号,将所述指定符号在所述第一文本对应的所述目标图像中的位置,作为缺位位置;根据所述第一文本和所述第一文本对应的所述描述数据,对所述缺位位置进行从下文
到上文的下一个字符预测,得到第四候选字集,根据所述第一文本和所述第一文本对应的所述描述数据,对所述缺位位置进行从上文到下文的下一个字符预测,得到第五候选字集,根据所述第一文本和所述第一文本对应的所述描述数据,对所述缺位位置进行基于上下文的字符预测,得到第六候选字集;根据所述第四候选字集

所述第五候选字集和所述第六候选字集,确定缺位替换字;采用所述缺位替换字,对所述第一文本中的与所述缺位位置对应的缺位符进行替换;在完成所述第一文本的缺位符的遍历之后,对所述第一文本对应的所述目标图像进行基于字体及字号的候选字预测,得到各个所述第一候选字集
。5.
根据权利要求3所述的基于
...

【专利技术属性】
技术研发人员:刘国途蒋志广陈剑彬梁君健
申请(专利权)人:深圳市明心数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1