基于深度学习的藏文古籍多字体文字识别系统技术方案

技术编号：40044383 阅读：47 留言：0更新日期：2024-01-16 20:13

本发明专利技术涉及文字识别与处理技术领域，公开了基于深度学习的藏文古籍多字体文字识别系统，包括：用于数据集构建与数据预处理和对真实样本进行标注与生成合成样本的预处理模块、基于滑动窗的行识别模块与基于深度学习的串识别模块；本发明专利技术基于滑动窗的行识别技术和基于深度学习的串识别技术，解决了图像质量差、文本行较长且文字粘连的藏文古籍文字识别难题。经实验，该技术在现代藏文出版物印刷体识别上其宏平均准确率达到了97.27%，用于藏文古籍木刻本文字识别上宏平均准确率达到92.60%，用于藏文古籍手写本识别上宏平均准确率达到了85.47%，实现了国内外藏文古籍文字识别研究领域的重要突破。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文字识别与处理，特别是涉及基于深度学习的藏文古籍多字体文字识别系统。

技术介绍

1、藏文是公元7世纪吐蕃时期创制的拼音文字，目前主要在我国藏族地区和不丹以及印度、尼泊尔和巴基斯坦部分地区使用。藏文古籍浩如烟海，其内容主要分为声明学、因明学、内明学、工巧明、医方明(大五明)和辞藻学、韵律学、修辞、戏剧、历算(小五明)，其数量仅次于汉文典籍，位居全国第二。在众多典籍之中以宗教学、哲学著作居多，具有重要的人文科学研究及应用价值。

2、然后，大部分少数民族文字信息处理仍然处于以字形处理为主的阶段，古籍文献资源的数字化程度普遍不高，对古籍文献的扫描识别研究更是非常缺乏。没有将藏文语言结构及文字构成规律应用于识别技术研究，识别的精度不高，泛化能力薄弱，远远不能满足藏文文献数字化保护和利用的需求，亟待研发高精度、高识别率、高性能的数字化技术。

技术实现思路

1、为了实现上述目的，本专利技术提供了一种基于深度学习的藏文古籍多字体文字识别系统，以解决藏文识别的精度差，无法满足对藏文...

【技术保护点】

1.基于深度学习的藏文古籍多字体文字识别系统，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，所述行识别模块包括：滑动窗参数的计算、滑动窗滑动与识别块边界调整。

3.根据权利要求2所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，滑动窗的两个参数指标分别为宽高比k_window和重叠宽度OverLap_Width。

4.根据权利要求3所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，宽高比k_window满足以下关系：

5.根据权利要求4所述的基于深度学习的藏文古籍多字体...

【技术特征摘要】

1.基于深度学习的藏文古籍多字体文字识别系统，其特征在于，包括：

3.根据权利要求2所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，滑动窗的两个参数指标分别为宽高比k_window和重叠宽度overlap_width。

4.根据权利要求3所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，宽高比k_window满足以下关系：

5.根据权利要求4所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，重叠宽度overlap_width满足以下关系：

6.根据权利要求1所述的基于深度学习的藏文古籍多字体文字识别系统，其特征在于，所述串识别模块支持...

【专利技术属性】
技术研发人员：尼玛扎西，仁青东主，道吉扎西，刘珍正，拥措，韦秋华，仁增多杰，洛桑嘎登，
申请(专利权)人：西藏大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人