藏文文本行检测方法、装置、电子设备制造方法及图纸

技术编号:42633559 阅读:31 留言:0更新日期:2024-09-06 01:33
本申请公开了一种藏文文本行检测方法、装置,属于文本行检测技术领域。所述方法通过预先训练的文本行检测模型执行,文本行检测模型包括:片段检测网络、特征聚合编码网络和映射输出网络,本方法通过片段检测网络对藏文文本图像进行片段检测,得到候选片段的检测框和片段特征;根据检测框,获取候选片段的位置编码信息;通过特征聚合编码网络对位置编码信息和片段特征,进行聚合编码,得到各候选片段的聚合编码向量;通过映射输出网络对所述聚合编码向量进行编码映射,得到藏文文本图像的文本行检测结果。本方法结合了回归方法可以有效处理重叠问题的优势以及神经网络模型的强大特征聚合分类能力,实现了藏文文本行的精确检测。

【技术实现步骤摘要】

本申请涉及文本行检测,特别是涉及藏文文本行检测方法、装置、电子设备,以及计算机可读存储介质。


技术介绍

1、文本行检测的目的是在文本图像中检测出文本行区域。现有技术中的文本行检测技术可以分为两大类:基于回归的文本行检测和基于分割的文本行检测。其中,基于回归的文本行检测,是将文字当做一个目标去检测,主要是受到了一些目标检测方法的启发;基于分割的文本行检测,通过对图像的像素进行分类,区分出文本部分和背景部分,得到属于文本部分的二值图,然后通过后处理部分得到文本行检测框。

2、然而,由于藏文古籍图像存在文本行间紧凑,字符是由字母上下堆叠组成,相邻行间字母存在交叉粘连的特点,在采用现有技术中的回归法或分割法进行文本行检测时,至少存在以下缺陷:基于分割法检测时,无法判定重叠区域的类别归属;基于回归法进行文本行检测时,可以检测存在重叠的目标,依赖于复杂的后处理,例如锚点生成、非最大抑制、二值化或轮廓提取,来生成或者细化最终的检测结果,而复杂的后处理往往会影响最终的检测结果的准确度。

3、可见,现有技术中的藏文文本行检测方法还需要改进。

<本文档来自技高网...

【技术保护点】

1.一种藏文文本行检测方法,其特征在于,通过预先训练的文本行检测模型执行所述方法,所述文本行检测模型包括:片段检测网络、特征聚合编码网络和映射输出网络,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述特征聚合编码网络基于多头自注意力网络构建,所述通过所述特征聚合编码网络对所述位置编码信息和所述片段特征,进行聚合编码,得到各所述候选片段的聚合编码向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述片段检测网络包括:特征提取网络和目标检测网络,所述通过所述片段检测网络对藏文文本图像进行片段检测,得到候选片段的检测框和片段特征,包括:

...

【技术特征摘要】

1.一种藏文文本行检测方法,其特征在于,通过预先训练的文本行检测模型执行所述方法,所述文本行检测模型包括:片段检测网络、特征聚合编码网络和映射输出网络,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述特征聚合编码网络基于多头自注意力网络构建,所述通过所述特征聚合编码网络对所述位置编码信息和所述片段特征,进行聚合编码,得到各所述候选片段的聚合编码向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述片段检测网络包括:特征提取网络和目标检测网络,所述通过所述片段检测网络对藏文文本图像进行片段检测,得到候选片段的检测框和片段特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过所述目标检测网络对每个尺度的所述全局特征图分别进行相应宽度的片段检测,得到每个所述尺度对应的候选片段的检测框和片段特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据每个尺度对应的所...

【专利技术属性】
技术研发人员:韦秋华周航刘正珍
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1