一种蒙古文版面自动识别方法及系统技术方案

技术编号：39763200 阅读：19 留言：0更新日期：2023-12-22 02:19

本发明专利技术提出了一种蒙古文版面自动识别方法及系统，涉及电子信息领域

全部详细技术资料下载

【技术实现步骤摘要】
一种蒙古文版面自动识别方法及系统

[0001]本专利技术涉及电子信息领域，具体而言，涉及一种蒙古文版面自动识别方法及系统
。

技术介绍

[0002]随着社会的发展，对于文字以及语言的智能识别技术的应用越来越广，现如今针对于一些常用的语言例如英文以及中文等等的语言文本识别技术已经越来越成熟，但针对于一些相对比较冷门的语言的识别技术的开发还尚浅
。
[0003]现有的文本识别技术是通过神经网络或者译码器进行对应的识别，但由于蒙古文的特殊性质，因此市面上还没有针对于蒙古文进行精确识别的文本识别的方法
。
[0004]鉴于上述技术，寻找一种识别准确率更高且能识别蒙古文的蒙古文版面自动识别方法是本领域技术人员亟待解决的问题
。

技术实现思路

[0005]本专利技术的目的在于提供一种蒙古文版面自动识别方法及系统，其能够针对于蒙古文进行文本识别并提高文本识别的准确率
。
[0006]本专利技术是这样实现的：
[0007]第一方面，本申请实施例提供一种蒙...

【技术保护点】

【技术特征摘要】
1.
一种蒙古文版面自动识别方法，其特征在于，包括以下步骤：接收输入的图片信息，并利用特征提取器提取得到待识别区域，所述特征提取器为通过输入预设图片进行训练所得到的具有文本区域识别功能的学习模型；对所述待识别区域进行掩模处理得到掩模集合特征，所述掩模为用于对文本进行检测并提取出对应的所述文本覆盖区域的学习模型，所述掩模集合特征是预先通过建立学习模型通过输入预设文本进行训练所得到的特征模型；利用多路复合器对所述掩模集合特征进行识别，得到对应的识别结果，所述多路复合器是通过文本的识别头进行训练得到的学习模型进行识别，且所述文本的识别头中包括蒙古文的识别头
。2.
如权利要求1所述的一种蒙古文版面自动识别方法，其特征在于，所述特征提取器的建立包括以下步骤：标注部分蒙古文版面数据并使用英文的完整版面标注数据进行版面分析模型训练；根据所述版面分析模型训练的结果获取得到版面分析模型；使用蒙古文版面模型对此所述版面分析模型进行微调，并使用所述版面分析模型识别全部的蒙古文版面数据，并根据识别结果建立特征库，依据所述特征库建立对应学习模型，并生成特征提取器
。3.
如权利要求1所述的一种蒙古文版面自动识别方法，其特征在于，所述收集并识别所述图片信息中对应的所述掩模集合特征包括：根据所述图片信息建立所述掩模预测，并依据所述多路复用模型中的历史数据，对预测得到的掩模进行扩充；对扩充后的所述掩模建立
LPN
输入，利用所述
LPN
对所述掩模进行检测以及分割得到所述掩模集合特征
。4.
如权利要求3所述的一种蒙古文版面自动识别方法，其特征在于，所述
LPN
的特征库和所述文本的识别头的特征库建立包括以下步骤：由如下公式并行计算各所述识别头和各所述
LPN
的损失项并相加：其中
L
lang
是所述
LPN
的损失，
R
是所述识别头
r
的集合，
L
seq(r)
是所述识别头
r
的损失，通过如下公式计算得到对应的语言预测损失：其中语言与标注语言相匹配与否通过
I(l
＝
l
gt
)
进行计算，
p(l)
是所述
LPN
推断的单词属于语言
l
的概率；使用负对数似然得到文本识别损失
L
seq
：其中
p(y
t
＝
c
t
)
是序列位置
t
处字符的预测概率，
t
是字符标签序列的长度，
c
t
是
t
的
ground truth
字符；为了计算
L
seq(r)
，即支持不同字符集的不同识别头的<...

【专利技术属性】
技术研发人员：胡其吐，白双成，
申请(专利权)人：内蒙古自治区社会科学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人