一种字符的确定方法、装置、电子设置和可读介质制造方法及图纸

技术编号:28499932 阅读:17 留言:0更新日期:2021-05-19 22:41
本申请提供了一种字符的确定方法、装置、电子设置和可读介质,属于识别技术领域。方法包括:将包含有第二字符的目标图片输入目标识别模型,得到目标识别模型识别出的第一字符的第一置信度,其中,第一置信度是第一字符为待预测的第二字符的概率;将第二字符的上下文信息输入语言预测模型,得到语言预测模型输出的第一字符的第二置信度,其中,第二置信度为第一字符在上下文中为第二字符的概率;根据第一置信度和第二置信度,得到第一字符为第二字符的待选置信度;选取数值最大的待选置信度对应的第一字符作为第二字符。本申请提高了字符识别的准确性。别的准确性。别的准确性。

【技术实现步骤摘要】
一种字符的确定方法、装置、电子设置和可读介质


[0001]本申请涉及识别
,尤其涉及一种字符的确定方法、装置、电子设置和可读介质。

技术介绍

[0002]OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,可以应用于车牌识别,发票识别等。
[0003]当前的字符识别方法只考虑了单个字符,有可能会出现字符识别错误的情况,字符识别率准确度低。

技术实现思路

[0004]本申请实施例的目的在于提供一种字符的确定方法、装置、电子设置和可读介质,以解决字符识别率准确度低问题。具体技术方案如下:
[0005]第一方面,提供了一种字符的确定方法,所述方法包括:
[0006]将包含有第二字符的目标图片输入目标识别模型,得到所述目标识别模型识别出的第一字符的第一置信度,其中,所述第一置信度是所述第一字符为待预测的第二字符的概率;
[0007]将所述第二字符的上下文信息输入语言预测模型,得到所述语言预测模型输出的所述第一字符的第二置信度,其中,所述第二置信度为所述第一字符在所述上下文中为所述第二字符的概率;
[0008]根据所述第一置信度和所述第二置信度,得到所述第一字符为所述第二字符的待选置信度;
[0009]选取数值最大的待选置信度对应的第一字符作为所述第二字符。
[0010]可选地,在将包含有第二字符的目标图片输入目标识别模型之前,所述方法还包括:
[0011]将包含有多个第二字符的字符图片按照字符形状分割成多个单字符图片,其中,每个单字符图片上包括一个第二字符;
[0012]将所述单字符图片进行缩放得到目标图片,其中,所述目标图片的尺寸与生成所述目标识别模型的样本图片的尺寸相同。
[0013]可选地,得到所述目标识别模型识别出的所述第一字符的第一置信度包括:
[0014]根据所述目标图片的尺寸确定所述目标图片的目标区域;
[0015]通过所述目标识别模型识别所述目标区域中各位置的图像数据,其中,不同位置对应不同的所述图像数据的权重信息;
[0016]通过各位置的图像数据得到所述第一字符的第一置信度。
[0017]可选地,在得到所述目标识别模型识别出的所述第一字符的第一置信度之前,所
述方法还包括:
[0018]将包含有第二字符的目标图片输入目标识别模型,得到所述目标识别模型输出的所述第二字符对应的各候选字符的候选概率;
[0019]按照候选概率由大到小的排列顺序,选取位于预设排位之前的候选概率对应的候选字符为所述第一字符。
[0020]可选地,将包含有第二字符的目标图片输入目标识别模型包括:
[0021]按照所述第二字符的排列顺序,将所述目标图片依次输入所述目标识别模型。
[0022]可选地,在将包含有第二字符的目标图片输入目标识别模型之前,所述方法还包括:
[0023]获取开源数据集中的样本图片和所述样本图片的置信度结果,其中,每个所述样本图片的尺寸相同,所述置信度结果用于指示所述样本图片上的样本字符为预设字符的概率;
[0024]将所述样本图片输入初始识别模型,得到所述初始识别模型输出的所述样本字符的识别结果,其中,所述识别结果用于指示所述样本图片上的样本字符为预设字符的概率;
[0025]在所述识别结果与所述置信度结果不同的情况下,调整所述初始识别模型中的参数,得到目标识别模型,其中,所述目标识别模型中所述置信度结果与所述识别结果相同。
[0026]第二方面,提供了一种字符的确定装置,所述装置包括:
[0027]第一输入模块,用于将包含有第二字符的目标图片输入目标识别模型,得到所述目标识别模型识别出的第一字符的第一置信度,其中,所述第一置信度是所述第一字符为待预测的第二字符的概率;
[0028]第二输入模块,用于将所述第二字符的上下文信息输入语言预测模型,得到所述语言预测模型输出的所述第一字符的第二置信度,其中,所述第二置信度为所述第一字符在所述上下文中为所述第二字符的概率;
[0029]得到模块,用于根据所述第一置信度和所述第二置信度,得到所述第一字符为所述第二字符的待选置信度;
[0030]选取模块,用于选取数值最大的待选置信度对应的第一字符作为所述第二字符。
[0031]可选地,所述装置还包括:
[0032]分割模块,用于将包含有多个第二字符的字符图片按照字符形状分割成多个单字符图片,其中,每个单字符图片上包括一个第二字符;
[0033]缩放模块,用于将所述单字符图片进行缩放得到目标图片,其中,所述目标图片的尺寸与生成所述目标识别模型的样本图片的尺寸相同。
[0034]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0035]存储器,用于存放计算机程序;
[0036]处理器,用于执行存储器上所存放的程序时,实现任一所述的方法步骤。
[0037]第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现任一所述的方法步骤。
[0038]本申请实施例有益效果:
[0039]本申请实施例提供了一种字符的确定方法,服务器将包含有第二字符的目标图片
输入目标识别模型,得到目标识别模型识别出的第一字符的第一置信度,然后将第二字符的上下文信息输入语言预测模型,得到语言预测模型输出的第一字符的第二置信度,并根据第一置信度和第二置信度,得到第一字符为第二字符的待选置信度,最后选取数值最大的待选置信度对应的第一字符作为第二字符。在本申请中,服务器不仅通过ocr进行字符识别,还通过字符的上下文进行字符识别,并将两种方式得到的识别结果进行相加,选取概率最大的字符作为待预测的字符,提高了字符识别的准确性。
[0040]当然,实施本申请的任一产品或方法并不一定需要同时达到以上的所有优点。
附图说明
[0041]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0042]图1为本申请实施例提供的一种字符的确定方法硬件环境示意图;
[0043]图2为本申请实施例提供的一种字符的确定的方法流程图;
[0044]图3为本申请实施例提供的一种字符的确定装置的结构示意图;
[0045]图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0046]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符的确定方法,其特征在于,所述方法包括:将包含有第二字符的目标图片输入目标识别模型,得到所述目标识别模型识别出的第一字符的第一置信度,其中,所述第一置信度是所述第一字符为待预测的第二字符的概率;将所述第二字符的上下文信息输入语言预测模型,得到所述语言预测模型输出的所述第一字符的第二置信度,其中,所述第二置信度为所述第一字符在所述上下文中为所述第二字符的概率;根据所述第一置信度和所述第二置信度,得到所述第一字符为所述第二字符的待选置信度;选取数值最大的待选置信度对应的第一字符作为所述第二字符。2.根据权利要求1所述的方法,其特征在于,在将包含有第二字符的目标图片输入目标识别模型之前,所述方法还包括:将包含有多个第二字符的字符图片按照字符形状分割成多个单字符图片,其中,每个单字符图片上包括一个第二字符;将所述单字符图片进行缩放得到目标图片,其中,所述目标图片的尺寸与生成所述目标识别模型的样本图片的尺寸相同。3.根据权利要求1所述的方法,其特征在于,得到所述目标识别模型识别出的所述第一字符的第一置信度包括:根据所述目标图片的尺寸确定所述目标图片的目标区域;通过所述目标识别模型识别所述目标区域中各位置的图像数据,其中,不同位置对应不同的所述图像数据的权重信息;通过各位置的图像数据得到所述第一字符的第一置信度。4.根据权利要求1所述的方法,其特征在于,在得到所述目标识别模型识别出的所述第一字符的第一置信度之前,所述方法还包括:将包含有第二字符的目标图片输入目标识别模型,得到所述目标识别模型输出的所述第二字符对应的各候选字符的候选概率;按照候选概率由大到小的排列顺序,选取位于预设排位之前的候选概率对应的候选字符为所述第一字符。5.根据权利要求1所述的方法,其特征在于,将包含有第二字符的目标图片输入目标识别模型包括:按照所述第二字符的排列顺序,将所述目标图片依次输入所述目标识别模型。6.根据权利要求1所述的方法,其特征在于,在将包含有第二字符的目标图片输入目标识别模型之前,所述方法还包括:获取开源数据集中的样本图片和所述样本...

【专利技术属性】
技术研发人员:柯友运李梦林
申请(专利权)人:北京秒针人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1