一种图像语种识别方法及其相关设备技术

技术编号：31508637 阅读：31 留言：0更新日期：2021-12-22 23:43

本申请公开了一种图像语种识别方法及其相关设备，该方法包括：在获取到待处理图像之后，先根据该待处理图像的文本检测结果，从该待处理图像中提取N个待使用文本图像；再确定该第n个待使用文本图像的语种提取特征和该第n个待使用文本图像的视觉提取特征；其中，n为正整数，n≤N，N为正整数；然后，根据该第n个待使用文本图像的语种提取特征和该第n个待使用文本图像的视觉提取特征，确定该第n个待使用文本图像的图像提取特征；其中，n为正整数，n≤N，N为正整数；最后，根据N个待使用文本图像的图像提取特征，确定该待处理图像的语种识别结果，以使该语种识别结果能够准确地表示出该待处理图像所属语种。处理图像所属语种。处理图像所属语种。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像语种识别方法及其相关设备

[0001]本申请涉及图像处理
，尤其涉及一种图像语种识别方法及其相关设备。

技术介绍

[0002]在一些应用场景下，需要判断一个携带有字符信息的图像数据属于哪一个语种。例如，若一个图像数据携带有大量的汉字，则该图像数据所属语种为中文；若一个图像数据携带有大量的英文单词时，则该图像数据所属语种为英语；
……
。
[0003]然而，如何识别一个图像数据所属语种是一项亟待解决的技术问题。

技术实现思路

[0004]为了解决上述技术问题，本申请提供了一种图像语种识别方法及其相关设备，能够准确地识别出一个图像数据所属语种。
[0005]为了实现上述目的，本申请实施例提供的技术方案如下：
[0006]本申请实施例提供一种图像语种识别方法，所述方法包括：
[0007]在获取到待处理图像之后，根据所述待处理图像的文本检测结果，从所述待处理图像中提取N个待使用文本图像；其中，N为正整数；
[0008]确定所述第n个待使用文本图像的...

【技术保护点】

【技术特征摘要】
1.一种图像语种识别方法，其特征在于，所述方法包括：在获取到待处理图像之后，根据所述待处理图像的文本检测结果，从所述待处理图像中提取N个待使用文本图像；其中，N为正整数；确定第n个待使用文本图像的语种提取特征和所述第n个待使用文本图像的视觉提取特征；其中，n为正整数，n≤N；根据所述第n个待使用文本图像的语种提取特征和所述第n个待使用文本图像的视觉提取特征，确定所述第n个待使用文本图像的图像提取特征；其中，n为正整数，n≤N；根据所述N个待使用文本图像的图像提取特征，确定所述待处理图像的语种识别结果。2.根据权利要求1所述的方法，其特征在于，所述视觉提取特征包括字符密度特征、颜色分布特征、和图像位置特征中的至少一个。3.根据权利要求2所述的方法，其特征在于，所述第n个待使用文本图像的字符密度特征的确定过程，包括：将所述第n个待使用文本图像输入预先构建的密度特征提取模型，得到所述密度特征提取模型输出的所述第n个待使用文本图像的字符密度特征；所述第n个待使用文本图像的颜色分布特征的确定过程，包括：将所述第n个待使用文本图像输入预先构建的颜色特征提取模型，得到所述颜色特征提取模型输出的所述第n个待使用文本图像的颜色分布特征；所述第n个待使用文本图像的图像位置特征的确定过程，包括：将所述第n个待使用文本图像的位置描述信息输入预先构建的位置特征提取模型，得到所述位置特征提取模型输出的所述第n个待使用文本图像的图像位置特征。4.根据权利要求1所述的方法，其特征在于，所述第n个待使用文本图像的语种提取特征的确定过程，包括：将所述第n个待使用文本图像输入预先构建的语种特征提取模型，得到所述语种特征提取模型输出的所述第n个待使用文本图像的语种提取特征。5.根据权利要求1所述的方法，其特征在于，所述视觉提取特征包括字符密度特征、颜色分布特征、和图像位置特征；所述根据所述第n个待使用文本图像的语种提取特征和所述第n个待使用文本图像的视觉提取特征，确定所述第n个待使用文本图像的图像提取特征，包括：将所述第n个待使用文本图像的语种提取特征、所述第n个待使用文本图像的字符密度特征、所述第n个待使用文本图像的颜色分布特征、以及所述第n个待使用文本图像的图像位置特征进行拼接，得到所述第n个待使用文本图像的图像提取特征。6.根据权利要求1所述的方法，其特征在于，所述根据所述N个待使用文本图像的图像提取特征，确定所述待处理图像的语种识别结果，包括：将所述N个待使用文本图像的图像提取特征进行拼接，得到所述待处理图像的语种表征数据；将所述语种表征数据输入预先构建的图像语种识别模型，得到所述图像语种识别模型输出的所述待处理图像的语种识别结果。7.根据权利要求6所述的方法，其特征在于，所述图像语种识别模型的构建过程，包括：获取待使用样本图像和所述待使用样本图像的实际语种；
根据所述待使用样本图像的文本检测结果，确定至少一个样本文本图像和所述至少一个样本文本图像的位置描述信息；将所述至少一个样本文本图像和所述至少一个样本文本图像的位置描述信息输入待训练模型，得到所述待训练模型输出...

【专利技术属性】
技术研发人员：毛晓飞，黄灿，王长虎，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人