【技术实现步骤摘要】
本申请实施例涉及图像处理,具体而言,涉及基于图像识别的文化资源数字化实现方法。
技术介绍
1、随着信息技术的发展,人们对文化资源的保护、传承和利用提出了更高的要求,文化资源数字化成为满足这些需求的重要手段。数字化可以实现文化资源的永久保存、广泛传播和深入研究,为文化的传承和发展提供有力支持。
2、古籍是传承中华文明的重要载体,通过数字化技术加强古籍保护工作迫在眉睫。利用文献扫描、ocr识别、智能解析等现代科技进行古籍数字化整理,对提升古籍工作质量,促进古籍工作具有重要意义。
3、然而,相关技术中,针对采集的待识别图像,由于古籍文献常常是书写体形式出现,会增加图像中文本内容识别的难度,往往难以达到理想的识别效果。
技术实现思路
1、本申请实施例的目的在于提供基于图像识别的文化资源数字化实现方法,以至少解决相关技术中针对图像中文本识别存在的识别难度高的技术问题。
2、为实现上述目的,本申请实施例提供了如下的技术方案。
3、根据本申请的一个实施例,
...【技术保护点】
1.基于图像识别的文化资源数字化实现方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于图像识别的文化资源数字化实现方法,其特征在于,在利用文本识别模型分别对第一文本段和第二文本段进行文本识别之前,还包括以下步骤:
3.根据权利要求2所述的基于图像识别的文化资源数字化实现方法,其特征在于,目标图像中的文本候选区通过文本边缘定位和非文本区域过滤处理得到,其中:
4.根据权利要求3所述的基于图像识别的文化资源数字化实现方法,其特征在于,利用引入资源特性的DB分割算法对文本候选区进行文本分割,得到带特征标签的文本行图像的步骤,包
5...
【技术特征摘要】
1.基于图像识别的文化资源数字化实现方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于图像识别的文化资源数字化实现方法,其特征在于,在利用文本识别模型分别对第一文本段和第二文本段进行文本识别之前,还包括以下步骤:
3.根据权利要求2所述的基于图像识别的文化资源数字化实现方法,其特征在于,目标图像中的文本候选区通过文本边缘定位和非文本区域过滤处理得到,其中:
4.根据权利要求3所述的基于图像识别的文化资源数字化实现方法,其特征在于,利用引入资源特性的db分割算法对文本候选区进行文本分割,得到带特征标签的文本行图像的步骤,包括:
5.根据权利要求4所述的基于图像识别的文化资源数字化实现方法,其特征在于,在db模型的dcnv2模块中,dcnv2模块包括可变形卷积层、批量归一化和hardswis...
【专利技术属性】
技术研发人员:田龙,吴雷,武亚苹,昌磊,张金芝,茆昌盛,崔璐,
申请(专利权)人:时代新媒体出版社有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。