一种特殊字体的互联网自动识别方法及系统技术方案

技术编号：38155843 阅读：8 留言：0更新日期：2023-07-13 09:24

本发明专利技术公开了一种特殊字体的互联网自动识别方法及系统，涉及文字识别技术领域。该方法包括：构建初始识别模型，在初始识别模型之上增加一个新的语言预测网络LPN，以得到多路复用模型；为多路复用模型构建单独的识别头去处理来自不同语言的单词，从中选择或组合预测；获取并基于多个不同语言和目标特殊字体的已标注数据集进行语言预测网络LPN和识别头的并行训练，确定多路复用模型的损失函数；利用深度学习当中的微调技术进行目标特殊字体版面数据的标注与获取，并进行版面分析模型训练，以得到目标特殊字体版面分析模型；采用目标特殊字体版面分析模型对目标特殊字体进行识别。本发明专利技术采用多路复用模型对特殊字体进行高效精准的识别。高效精准的识别。高效精准的识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种特殊字体的互联网自动识别方法及系统

[0001]本专利技术涉及文字识别
，具体而言，涉及一种特殊字体的互联网自动识别方法及系统。

技术介绍

[0002]针对一些特殊字体混合(例如蒙古文与其他多文种混合)文本识别通常可以分为三个子任务：文本检测、文种识别和文本识别。文本检测通常是理解图像中文本内容的第一阶段，期的方法通常使用由人工设计的特征或启发法组成，例如连接组件或滑动窗口，后来出现的早期的深度学习模型使用卷积网络与上述方法相结合使用。多语言场景中的文本识别通常需要文种识别来确定文本识别的语言。一旦文本通过检测被定位，该区域被认定为需要被识别的文本并进行裁剪，然后被馈送到文本识别系统以作为字符或单词序列进行识别和读取。
[0003]现有技术中一般是将上述三个子任务单独进行考虑，然后被链接在一起使用，但是这种方式存在一些不足：各个任务之间消耗的数据量过大，且容易出现对接误差；识别效率低下，识别效果不好。

技术实现思路

[0004]为了克服上述问题或者至少部分地解决上述问题，本专利技术提供一种特殊字体的互联网自动识别方法及系统，采用多路复用模型对特殊字体进行高效精准的识别。
[0005]为解决上述技术问题，本专利技术采用的技术方案为：
[0006]第一方面，本专利技术提供一种特殊字体的互联网自动识别方法，包括以下步骤：
[0007]基于Mask TextSpotter V3识别模型的检测和分割模块以及空间注意力模块构建初始识别模型，在初始识别模型之上增加一个新的语...

【技术保护点】

【技术特征摘要】
1.一种特殊字体的互联网自动识别方法，其特征在于，包括以下步骤：基于Mask TextSpotter V3识别模型的检测和分割模块以及空间注意力模块构建初始识别模型，在初始识别模型之上增加一个新的语言预测网络LPN，以得到多路复用模型；为多路复用模型构建单独的识别头去处理来自不同语言的单词，从中选择或组合预测；获取并基于多个不同语言和目标特殊字体的已标注数据集进行语言预测网络LPN和识别头的并行训练，确定多路复用模型的损失函数；利用深度学习当中的微调技术进行目标特殊字体版面数据的标注与获取，并进行版面分析模型训练，以得到目标特殊字体版面分析模型；采用目标特殊字体版面分析模型对目标特殊字体进行识别。2.根据权利要求1所述的一种特殊字体的互联网自动识别方法，其特征在于，所述语言预测网络LPN的输入为检测和分割模块的掩码集合特征。3.根据权利要求1所述的一种特殊字体的互联网自动识别方法，其特征在于，所述语言预测网络LPN的输出用于确定多路复用模型选择何种脚本的识别头。4.根据权利要求1所述的一种特殊字体的互联网自动识别方法，其特征在于，所述语言预测网络LPN包括两个2
×
2卷积层加ReLU激活函数和一个2
×
2池化层。5.根据权利要求1所述的一种特殊字体的互联网自动识别方法，其特征在于，所述利用深度学习当中的微调技术进行目标特殊字体版面数据的标注与获取，并进行版面分析模型训练，以得到目标特殊字体版面分析模型的方法包括以下步骤：录入人工标注的目标特殊字体版面数据和预置的英文版面标注数据，进行版面分析模型训练，以得到目标版面分析模型；...

【专利技术属性】
技术研发人员：胡其吐，白双成，
申请(专利权)人：内蒙古自治区社会科学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人