语种识别方法、装置、终端设备及计算机可读存储介质制造方法及图纸

技术编号:23853557 阅读:58 留言:0更新日期:2020-04-18 09:54
本申请适用于终端人工智能领域以及对应的计算机视觉技术领域,提供了一种语种识别方法、装置、终端设备及计算机可读存储介质,所述方法包括:获取待识别文本行图像,所述待识别文本行图像包括待识别文本;将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,所述语种识别模型用于根据所述待识别文本行图像,确定所述待识别文本的语种,若所述语种为包括多种语种的语系语种,则根据所述待识别文本的语言规律,将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。基于语言规律识别语种,避免了相同或相似字符的二义性导致识别不准确的问题,提高了语种识别的准确率。

Language identification method, device, terminal equipment and computer readable storage medium

【技术实现步骤摘要】
语种识别方法、装置、终端设备及计算机可读存储介质
本申请属于人工智能(ArtificialIntelligence,AI)及计算机视觉
,尤其涉及一种语种识别方法、装置、终端设备及计算机可读存储介质。
技术介绍
随着文字识别技术的不断发展,在对文字进行识别的过程中,不但可以对中文进行识别,还可以对其他语种的文字进行识别。为了提高对不同语种的文字识别的准确度,可以先对待识别文字对应的语种进行识别。相关技术中,可以通过滑窗的方式对文本行图像进行采样,得到多个图像块,并将多个图像块输入卷积神经网络进行识别,得到多个图像块对应的语种,最后识别得到的数量最多的语种作为文本行图像所对应的语种。然而,对于使用相同或相似字符的语种,采用上述方式进行识别会得到大量的二义性图像,影响语种识别的准确率。
技术实现思路
本申请实施例提供了一种语种识别方法、装置、终端设备及计算机可读存储介质,可以提高文本行图像中语种识别的准确率。第一方面,本申请实施例提供了一种语种识别方法,包括:获取待识别文本行图像,所述待识别文本行图像包括待识别文本;将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,所述语种识别模型用于根据所述待识别文本行图像,确定所述待识别文本的语种,若所述语种为包括多种语种的语系语种,则根据所述待识别文本的语言规律,将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。在第一方面的第一种可能的实现方式中,所述语种识别模型包括语种分类网络和卷积网络;所述将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,包括:将所述待识别文本行图像输入所述语种分类网络,得到所述待识别文本的特征信息,所述特征信息用于指示所述待识别文本的语种;若所述语种为包括多种语种的语系语种,将所述特征信息输入所述卷积网络,确定所述待识别文本的语言规律,并从所述语系语种中选取与所述语言规律相匹配的语种作为所述待识别文本的语种。在第一方面的第二种可能的实现方式中,在所述将所述待识别文本行图像输入训练后的语种识别模型之前,所述方法还包括:将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络,得到所述样本文本行图像中样本文本的样本特征信息,所述样本特征信息用于指示所述样本文本的语种;若所述样本文本的语种不是语系语种,根据预设的第一损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第一损失值;若所述样本文本的语种是语系语种,将所述样本特征信息输入所述初始语种识别模型的初始卷积网络,从所述语系语种中选取与所述样本文本的语言规律相匹配的语种,作为所述样本文本的语种;根据预设的第二损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第二损失值;当所述第一损失值或所述第二损失值不满足预设条件时,调整所述初始语种识别模型的模型参数,并返回执行将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络,得到所述样本文本行图像中样本文本的样本特征信息的步骤以及后续步骤;当所述第一损失值和所述第二损失值均满足所述预设条件时,停止训练所述初始语种识别模型,并将所述第一损失值和所述第二损失值均满足所述预设条件时的初始语种识别模型作为所述语种识别模型。基于第一方面的第二种可能的实现方式,在第三种可能的实现方式中,在所述将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络之前,所述方法还包括:获取历史样本集合,所述历史样本集合包括所述样本文本行图像和与每个所述样本文本行图像对应的文本标识;根据预设码表将各个所述文本标识转换为语种编码,得到由所述样本文本行图像和与每个所述样本文本行图像对应的语种编码所组成的样本集合,所述码表包括多个语种,每个所述语种中的每个字符对应至少一个语种编码。基于第一方面的第二种可能的实现方式,在第四种可能的实现方式中,所述根据预设的第一损失函数计算所述样本文本的语种类别包括的语种和所述样本文本的实际语种之间的第一损失值,包括:根据连续时序分类损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第一损失值;相应的,所述根据预设的第二损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第二损失值,包括:根据归一化指数损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第二损失值。在第一方面的第五种可能的实现方式中,所述语种识别模型的语种分类网络用于识别所述待识别文本中每个所述字符的语种,并将数量最多的语种作为所述待识别文本的语种。第二方面,本申请实施例提供了一种语种识别装置,包括:图像获取模块,用于获取待识别文本行图像,所述待识别文本行图像包括待识别文本;识别模块,用于将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,所述语种识别模型用于根据所述待识别文本行图像,确定所述待识别文本的语种,若所述语种为包括多种语种的语系语种,则根据所述待识别文本的语言规律,将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。在第二方面的第一种可能的实现方式中,所述语种识别模型包括语种分类网络和卷积网络;所述识别模块,还用于将所述待识别文本行图像输入所述语种分类网络,得到所述待识别文本的特征信息,所述特征信息用于指示所述待识别文本的语种;若所述语种为包括多种语种的语系语种,将所述特征信息输入所述卷积网络,确定所述待识别文本的语言规律,并从所述语系语种中选取与所述语言规律相匹配的语种作为所述待识别文本的语种。在第二方面的第二种可能的实现方式中,所述装置还包括:第一训练模块,用于将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络,得到所述样本文本行图像中样本文本的样本特征信息,所述样本特征信息用于指示所述样本文本的语种;第一计算模块,用于若所述样本文本的语种不是语系语种,根据预设的第一损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第一损失值;第二训练模块,用于若所述样本文本的语种是语系语种,将所述样本特征信息输入所述初始语种识别模型的初始卷积网络,从所述语系语种中选取与所述样本文本的语言规律相匹配的语种,作为所述样本文本的语种;第二计算模块,用于根据预设的第二损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第二损失值;调整模块,用于当所述第一损失值或所述第二损失值不满足预设条件时,调整所述初始语种识别模型的模型参数,并返回执行将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络,得到所述样本文本行图像中样本文本的样本特征信息的步骤以及后续步骤;确定模块,用于当所述第一损失值和所述第二损失值均满足所述预设条件时,停止训练所述初始语种识别模型,并将所述第一损失值和所述第二损失值均满足所述预设条件时的本文档来自技高网...

【技术保护点】
1.一种语种识别方法,其特征在于,包括:/n获取待识别文本行图像,所述待识别文本行图像包括待识别文本;/n将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,所述语种识别模型用于根据所述待识别文本行图像,确定所述待识别文本的语种,若所述语种为包括多种语种的语系语种,则根据所述待识别文本的语言规律,将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。/n

【技术特征摘要】
1.一种语种识别方法,其特征在于,包括:
获取待识别文本行图像,所述待识别文本行图像包括待识别文本;
将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,所述语种识别模型用于根据所述待识别文本行图像,确定所述待识别文本的语种,若所述语种为包括多种语种的语系语种,则根据所述待识别文本的语言规律,将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。


2.如权利要求1所述的方法,其特征在于,所述语种识别模型包括语种分类网络和卷积网络;
所述将所述待识别文本行图像输入训练后的语种识别模型,得到所述待识别文本的语种,包括:
将所述待识别文本行图像输入所述语种分类网络,得到所述待识别文本的特征信息,所述特征信息用于指示所述待识别文本的语种;
若所述语种为包括多种语种的语系语种,将所述特征信息输入所述卷积网络,确定所述待识别文本的语言规律,并从所述语系语种中选取与所述语言规律相匹配的语种作为所述待识别文本的语种。


3.如权利要求1所述的方法,其特征在于,在所述将所述待识别文本行图像输入训练后的语种识别模型之前,所述方法还包括:
将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络,得到所述样本文本行图像中样本文本的样本特征信息,所述样本特征信息用于指示所述样本文本的语种;
若所述样本文本的语种不是语系语种,根据预设的第一损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第一损失值;
若所述样本文本的语种是语系语种,将所述样本特征信息输入所述初始语种识别模型的初始卷积网络,从所述语系语种中选取与所述样本文本的语言规律相匹配的语种,作为所述样本文本的语种;
根据预设的第二损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第二损失值;
当所述第一损失值或所述第二损失值不满足预设条件时,调整所述初始语种识别模型的模型参数,并返回执行将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络,得到所述样本文本行图像中样本文本的样本特征信息的步骤以及后续步骤;
当所述第一损失值和所述第二损失值均满足所述预设条件时,停止训练所述初始语种识别模型,并将所述第一损失值和所述第二损失值均满足所述预设条件时的初始语种识别模型作为所述语种识别模型。


4.如权利要求3所述的方法,其特征在于,在所述将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络之前,所述方法还包括:
获取历史...

【专利技术属性】
技术研发人员:蒲勇飞罗俊颜朱丽飞王志远施烈航黄健超
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1