基于图像识别的文化资源数字化实现方法技术

技术编号:46545792 阅读:1 留言:0更新日期:2025-10-10 21:09
本申请实施例提供了基于图像识别的文化资源数字化实现方法,在方法中,基于文本边缘定位和非文本区域过滤提取增强图像中的文本候选区,利用DB分割算法对文本候选区进行文本分割,对分割得到的文本行图像进行分段处理,第一文本段的段尾与第二文本段的段首之间具有重合文本段;利用文本识别模型分别对第一文本段和第二文本段进行文本识别,将得到的重合文本段的识别结果用于文本识别模型的优化调整;将新的待识别图像作为优化调整后文本识别模型的输入,得到当前待识别图像的文本识别结果,构建包含文本识别结果的文化资源数据库并输出。本申请实施例可以将古籍文献等图像信息进行数字化,构建便于管理和应用的文化资源数据库。

【技术实现步骤摘要】

本申请实施例涉及图像处理,具体而言,涉及基于图像识别的文化资源数字化实现方法


技术介绍

1、随着信息技术的发展,人们对文化资源的保护、传承和利用提出了更高的要求,文化资源数字化成为满足这些需求的重要手段。数字化可以实现文化资源的永久保存、广泛传播和深入研究,为文化的传承和发展提供有力支持。

2、古籍是传承中华文明的重要载体,通过数字化技术加强古籍保护工作迫在眉睫。利用文献扫描、ocr识别、智能解析等现代科技进行古籍数字化整理,对提升古籍工作质量,促进古籍工作具有重要意义。

3、然而,相关技术中,针对采集的待识别图像,由于古籍文献常常是书写体形式出现,会增加图像中文本内容识别的难度,往往难以达到理想的识别效果。


技术实现思路

1、本申请实施例的目的在于提供基于图像识别的文化资源数字化实现方法,以至少解决相关技术中针对图像中文本识别存在的识别难度高的技术问题。

2、为实现上述目的,本申请实施例提供了如下的技术方案。

3、根据本申请的一个实施例,提供了基于图像识别的本文档来自技高网...

【技术保护点】

1.基于图像识别的文化资源数字化实现方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图像识别的文化资源数字化实现方法,其特征在于,在利用文本识别模型分别对第一文本段和第二文本段进行文本识别之前,还包括以下步骤:

3.根据权利要求2所述的基于图像识别的文化资源数字化实现方法,其特征在于,目标图像中的文本候选区通过文本边缘定位和非文本区域过滤处理得到,其中:

4.根据权利要求3所述的基于图像识别的文化资源数字化实现方法,其特征在于,利用引入资源特性的DB分割算法对文本候选区进行文本分割,得到带特征标签的文本行图像的步骤,包括:

5...

【技术特征摘要】

1.基于图像识别的文化资源数字化实现方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图像识别的文化资源数字化实现方法,其特征在于,在利用文本识别模型分别对第一文本段和第二文本段进行文本识别之前,还包括以下步骤:

3.根据权利要求2所述的基于图像识别的文化资源数字化实现方法,其特征在于,目标图像中的文本候选区通过文本边缘定位和非文本区域过滤处理得到,其中:

4.根据权利要求3所述的基于图像识别的文化资源数字化实现方法,其特征在于,利用引入资源特性的db分割算法对文本候选区进行文本分割,得到带特征标签的文本行图像的步骤,包括:

5.根据权利要求4所述的基于图像识别的文化资源数字化实现方法,其特征在于,在db模型的dcnv2模块中,dcnv2模块包括可变形卷积层、批量归一化和hardswis...

【专利技术属性】
技术研发人员:田龙吴雷武亚苹昌磊张金芝茆昌盛崔璐
申请(专利权)人:时代新媒体出版社有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1