一种象形文字识别方法、装置、设备和介质制造方法及图纸

技术编号：35171119 阅读：157 留言：0更新日期：2022-10-12 17:35

本发明专利技术公开了一种象形文字识别方法、装置、设备和介质。该方法包括：将文字图片输入至识别模型中；通过所述识别模型的串接的至少两个特征提取单元对文字图片进行特征提取，得到目标特征；其中，所述特征提取单元包括混合感知映射单元和/或空间感知聚合单元；混合感知映射单元用于获取全局有效特征和全局关键位置特征；空间感知聚合单元用于获取局部关键细节特征；不同特征提取单元用于提取不同尺寸的特征；通过所述识别模型的分类层，对所述目标特征进行分类，确定所述文字图片对应的文字识别结果。通过本发明专利技术实施例能够在对文字图片进行特征提取后，提高特征提取结果的丰富性，从而提高识别模型对文字图片进行识别的准确率。而提高识别模型对文字图片进行识别的准确率。而提高识别模型对文字图片进行识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种象形文字识别方法、装置、设备和介质

[0001]本专利技术涉及图像识别
，尤其涉及一种象形文字识别方法、装置、设备和介质。

技术介绍

[0002]象形文字具有明显的图画特点，存在难以辨识的高相似度象形文字，相较于其他文字识别任务具有更大的难度。
[0003]目前常用的深度学习识别模型大多从网络的深度或宽度层面改进模型，使网络对语义特征的提取能力大幅度增强，但在处理具有高相似度象形文字的识别任务时，识别率较低。

技术实现思路

[0004]本专利技术提供了一种象形文字识别方法、装置、设备和介质，以提高文字图片提取的特征的丰富性，提高识别模型文字识别准确率。
[0005]根据本专利技术的一方面，提供了一种象形文字识别方法，该方法包括：
[0006]将文字图片输入至识别模型中；
[0007]通过所述识别模型的串接的至少两个特征提取单元对文字图片进行特征提取，得到目标特征；其中，所述特征提取单元包括混合感知映射单元和/或空间感知聚合单元；混合感知映射单元用于获取全局有效特征和全局关键位置特征；空间感知聚合单元用于获取局部关键细节特征；不同特征提取单元用于提取不同尺寸的特征；
[0008]通过所述识别模型的分类层，对所述目标特征进行分类，确定所述文字图片对应的文字识别结果。
[0009]根据本专利技术的另一方面，提供了一种象形文字识别装置，该装置包括：
[0010]输入模块，用于将文字图片输入至识别模型中；
[0011]目标特征获取模块，用...

【技术保护点】

【技术特征摘要】
1.一种象形文字识别方法，其特征在于，包括：将文字图片输入至识别模型中；通过所述识别模型的串接的至少两个特征提取单元对文字图片进行特征提取，得到目标特征；其中，所述特征提取单元包括混合感知映射单元和/或空间感知聚合单元；混合感知映射单元用于获取全局有效特征和全局关键位置特征；空间感知聚合单元用于获取局部关键细节特征；不同特征提取单元用于提取不同尺寸的特征；通过所述识别模型的分类层，对所述目标特征进行分类，确定所述文字图片对应的文字识别结果。2.根据权利要求1所述的方法，其特征在于，所述至少两个特征提取单元中的首个特征提取单元包括混合感知映射单元，所述至少两个特征提取单元中的其他特征提取单元包括混合感知映射单元和空间感知聚合单元；所述通过所述识别模型的串接的至少两个特征提取单元对文字图片进行特征提取，得到目标特征，包括：通过所述首个特征提取单元中的混合感知映射单元对所述文字图片进行特征提取，得到所述首个特征提取单元的中间全局特征；通过所述其他特征提取单元中的混合感知映射单元对串接的前一特征提取单元的中间全局特征进行特征提取，得到所述其他特征提取单元的中间全局特征；通过首个其他特征提取单元中的空间感知聚合单元对所述首个特征提取单元的中间全局特征进行特征提取，得到所述首个其他特征提取单元的中间局部特征；将所述首个其他特征提取单元的中间局部特征与所述首个其他特征提取单元的中间全局特征进行融合，得到所述首个其他特征提取单元的中间融合特征；通过除首个其他特征提取单元以外的其他特征提取单元中的空间感知聚合单元，对串接的前一特征提取单元的中间融合特征进行特征提取，得到除首个其他特征提取单元以外的其他特征提取单元的中间局部特征；将除首个其他特征提取单元以外的其他特征提取单元的中间局部特征与除首个其他特征提取单元以外的其他特征提取单元的中间全局特征进行融合，得到除首个其他特征提取单元以外的其他特征提取单元的中间融合特征；将末个其他特征提取单元的中间融合特征确定为目标特征。3.根据权利要求2所述的方法，其特征在于，所述通过所述首个特征提取单元中的混合感知映射单元对所述文字图片进行特征提取，得到所述首个特征提取单元的中间全局特征，包括：通过所述首个特征提取单元中的混合感知映射单元的至少一个特征提取层，对所述文字图片进行特征提取，得到第一特征图；基于通道注意力机制对所述第一特征图进行特征提取，获取所述第一特征图的全局有效特征，其中，所述通道注意力机制用于关注所述文字图片中的前景信息，并忽略所述文字图片中的背景信息；基于空间注意力机制对所述第一特征图进行特征提取，获取所述第一特征图的全局关键位置特征，其中，所述空间注意力机制用于关注所述文字图片中文字的位置，并忽略却所述文字图片中文字不在的位置；
将所述第一特征图、所述第一特征图的全局有效特征和所述第一特征图的全局关键位置特征进行融合，得到所述首个特征提取单元的第一融合特征；根据所述第一融合特征确定所述首个特征提取单元的中间全局特征。4.根据权利要求2所述的方法，其特征在于，还包括：通过所述其他特征提取单元中的池化层对所述串接的前一特征提取单元的中间全局特征进行尺寸调整，更新中间全局特征，以使更新后的中间全局特征和所述其他特征提取单元的中间局部特征的尺寸相同；所述通过所述其他特征提取单元中的混合感知映射单元对串接的前一特征提取单元的中间全局特征进行特征提取，得到...

【专利技术属性】
技术研发人员：毕晓君，骆彦龙，赵悦，
申请(专利权)人：中央民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人