语种识别方法、装置、终端设备及计算机可读存储介质制造方法及图纸

技术编号：23853557 阅读：58 留言：0更新日期：2020-04-18 09:54

本申请适用于终端人工智能领域以及对应的计算机视觉技术领域，提供了一种语种识别方法、装置、终端设备及计算机可读存储介质，所述方法包括：获取待识别文本行图像，所述待识别文本行图像包括待识别文本；将所述待识别文本行图像输入训练后的语种识别模型，得到所述待识别文本的语种，所述语种识别模型用于根据所述待识别文本行图像，确定所述待识别文本的语种，若所述语种为包括多种语种的语系语种，则根据所述待识别文本的语言规律，将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。基于语言规律识别语种，避免了相同或相似字符的二义性导致识别不准确的问题，提高了语种识别的准确率。

Language identification method, device, terminal equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语种识别方法、装置、终端设备及计算机可读存储介质
本申请属于人工智能(ArtificialIntelligence，AI)及计算机视觉
，尤其涉及一种语种识别方法、装置、终端设备及计算机可读存储介质。
技术介绍
随着文字识别技术的不断发展，在对文字进行识别的过程中，不但可以对中文进行识别，还可以对其他语种的文字进行识别。为了提高对不同语种的文字识别的准确度，可以先对待识别文字对应的语种进行识别。相关技术中，可以通过滑窗的方式对文本行图像进行采样，得到多个图像块，并将多个图像块输入卷积神经网络进行识别，得到多个图像块对应的语种，最后识别得到的数量最多的语种作为文本行图像所对应的语种。然而，对于使用相同或相似字符的语种，采用上述方式进行识别会得到大量的二义性图像，影响语种识别的准确率。
技术实现思路
本申请实施例提供了一种语种识别方法、装置、终端设备及计算机可读存储介质，可以提高文本行图像中语种识别的准确率。第一方面，本申请实施例提供了一种语种识别方法，包括：获取待识别文本行图像，所述待识别文本行图像包括待识别文本；将所述待识别文本行图像输入训练后的语种识别模型，得到所述待识别文本的语种，所述语种识别模型用于根据所述待识别文本行图像，确定所述待识别文本的语种，若所述语种为包括多种语种的语系语种，则根据所述待识别文本的语言规律，将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。在第一方面的第一种可能的实现方式中，所述语种识别模...

【技术保护点】
1.一种语种识别方法，其特征在于，包括：/n获取待识别文本行图像，所述待识别文本行图像包括待识别文本；/n将所述待识别文本行图像输入训练后的语种识别模型，得到所述待识别文本的语种，所述语种识别模型用于根据所述待识别文本行图像，确定所述待识别文本的语种，若所述语种为包括多种语种的语系语种，则根据所述待识别文本的语言规律，将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。/n

【技术特征摘要】
1.一种语种识别方法，其特征在于，包括：
获取待识别文本行图像，所述待识别文本行图像包括待识别文本；
将所述待识别文本行图像输入训练后的语种识别模型，得到所述待识别文本的语种，所述语种识别模型用于根据所述待识别文本行图像，确定所述待识别文本的语种，若所述语种为包括多种语种的语系语种，则根据所述待识别文本的语言规律，将所述语系语种中与所述语言规律对应的语种作为所述待识别文本的语种。

2.如权利要求1所述的方法，其特征在于，所述语种识别模型包括语种分类网络和卷积网络；
所述将所述待识别文本行图像输入训练后的语种识别模型，得到所述待识别文本的语种，包括：
将所述待识别文本行图像输入所述语种分类网络，得到所述待识别文本的特征信息，所述特征信息用于指示所述待识别文本的语种；
若所述语种为包括多种语种的语系语种，将所述特征信息输入所述卷积网络，确定所述待识别文本的语言规律，并从所述语系语种中选取与所述语言规律相匹配的语种作为所述待识别文本的语种。

3.如权利要求1所述的方法，其特征在于，在所述将所述待识别文本行图像输入训练后的语种识别模型之前，所述方法还包括：
将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络，得到所述样本文本行图像中样本文本的样本特征信息，所述样本特征信息用于指示所述样本文本的语种；
若所述样本文本的语种不是语系语种，根据预设的第一损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第一损失值；
若所述样本文本的语种是语系语种，将所述样本特征信息输入所述初始语种识别模型的初始卷积网络，从所述语系语种中选取与所述样本文本的语言规律相匹配的语种，作为所述样本文本的语种；
根据预设的第二损失函数计算所述样本文本的语种和所述样本文本的实际语种之间的第二损失值；
当所述第一损失值或所述第二损失值不满足预设条件时，调整所述初始语种识别模型的模型参数，并返回执行将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络，得到所述样本文本行图像中样本文本的样本特征信息的步骤以及后续步骤；
当所述第一损失值和所述第二损失值均满足所述预设条件时，停止训练所述初始语种识别模型，并将所述第一损失值和所述第二损失值均满足所述预设条件时的初始语种识别模型作为所述语种识别模型。

4.如权利要求3所述的方法，其特征在于，在所述将样本集合中的样本文本行图像输入初始语种识别模型的初始语种分类网络之前，所述方法还包括：
获取历史...

【专利技术属性】
技术研发人员：蒲勇飞，罗俊颜，朱丽飞，王志远，施烈航，黄健超，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人