一种文字识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:40592849 阅读:23 留言:0更新日期:2024-03-12 21:54
本发明专利技术公开了一种文字识别方法、装置、设备及可读存储介质,该方法包括:获取待识别文件;其中,包含在所述待识别文件中的文字由线条构成;从所述待识别文件中确定出样例文字,并计算出所述样例文字的文字样式特征信息;根据所述文字样式特征信息,从所述待识别文件的待识别区域中识别出用于构成文字的文字线条;根据所述文字样式特征信息,对得到的所有文字线条进行分组,以得到多个文字线条组;从所述文字线条组中识别出文字识别结果;本发明专利技术能够对目标文件中存在的由线条构成的文字进行快速、准确的位置定位及内容识别。

【技术实现步骤摘要】

本专利技术涉及图像识别,特别涉及一种文字识别方法、装置、设备及可读存储介质


技术介绍

1、对于建筑行业来说,图纸的导入和识别是其中较为关键一步,是后续整个建筑工程算量或者计价的基础。对于图纸的算量,例如需要计算表格中的图纸量、模型中的复核量,都是通过文字信息来计算的。所以图纸表格中的文字、截面中的文字信息等,都是必要的信息。目前,图纸存在dwg、cad、pdf等多种格式,当导入例如pdf等格式的矢量图纸时,图纸中的文字是被打散成线条和填充格式的,当用户点击文字位置时,显示的是线条的形式,不能获取文字的内容信息。在这种情况下,文字内容不可知,所有可用信息丢失,用户算量所需的文字、数字等信息都只能通过用户手动填写,整个过程较为繁琐、耗时较多、且效率低下。因此,如何识别矢量图纸中的文字信息成为了本领域技术人员亟需解决的技术问题。


技术实现思路

1、本专利技术的目的在于提供一种文字识别方法、装置、设备及可读存储介质,能够对目标文件中存在的由线条构成的文字进行快速、准确的位置定位及内容识别。>

2、根据本专本文档来自技高网...

【技术保护点】

1.一种文字识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文字识别方法,其特征在于,所述从所述待识别文件中确定出样例文字,并计算出所述样例文字的文字样式特征信息,包括:

3.根据权利要求2所述的文字识别方法,其特征在于,所述对所述样例区域内的所有线条进行分析,以计算出所述样例文字的文字样式特征信息,包括:

4.根据权利要求2所述的文字识别方法,其特征在于,所述根据所述文字样式特征信息,从所述待识别文件的待识别区域中识别出用于构成文字的文字线条,包括:

5.根据权利要求4所述的文字识别方法,其特征在于,所述将所述待识别区域中的...

【技术特征摘要】

1.一种文字识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文字识别方法,其特征在于,所述从所述待识别文件中确定出样例文字,并计算出所述样例文字的文字样式特征信息,包括:

3.根据权利要求2所述的文字识别方法,其特征在于,所述对所述样例区域内的所有线条进行分析,以计算出所述样例文字的文字样式特征信息,包括:

4.根据权利要求2所述的文字识别方法,其特征在于,所述根据所述文字样式特征信息,从所述待识别文件的待识别区域中识别出用于构成文字的文字线条,包括:

5.根据权利要求4所述的文字识别方法,其特征在于,所述将所述待识别区域中的不符合所述文字样式特征信息的非文字线条删除,包括:

6.根...

【专利技术属性】
技术研发人员:曾亚军
申请(专利权)人:广联达科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1