System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种企业表单数据提取方法及装置制造方法及图纸_技高网

一种企业表单数据提取方法及装置制造方法及图纸

技术编号:40837859 阅读:2 留言:0更新日期:2024-04-01 15:03
一种企业表单数据提取方法及装置,涉及数据提取领域;其中,方法包括:获取待提取表单的拍摄图像;对拍摄图像进行预处理,得到预处理图像,预处理包括去除背景噪声、增强对比度以及调整亮度;通过预设特征识别算法对预处理图像中的特征进行识别,得到数据特征;根据预设字词数据库对数据特征进行分类识别,得到表单数据;将表单数据存入预设表单数据库并将第一提示信息展示给用户,以提示用户表单数据录入完成。实施本申请提供的技术方案,能解决表单数据提取效率较低的问题。

【技术实现步骤摘要】

本申请涉及数据提取领域,具体涉及一种企业表单数据提取方法及装置


技术介绍

1、表单是企业进行数据记录和整理的重要工具;通过表单,企业可以方便地收集、整理和存储各种信息,如用于记录企业的碳排放量和碳排放链等信息,以便后续工作人员的分析和决策。

2、当前工业碳柜虽然能够对企业的各类碳排放信息进行管理和监测,但在录入数据过程中,往往采用人工录入的方式,工作人员需要将纸质表单中的数据一项一项地输入到工业碳柜上,这个过程也容易出现错误录入,遗漏录入等情况,当需要一次性提取录入很多表单时,工作人员所花费的时间将会更多,即存在表单数据提取效率较低的问题。

3、因此,亟需一种企业表单数据提取方法及装置。


技术实现思路

1、本申请提供了一种企业表单数据提取方法及装置,解决了表单数据提取效率较低的问题。

2、本申请在第一方面提供了一种企业表单数据提取方法,方法包括:获取待提取表单的拍摄图像;对拍摄图像进行预处理,得到预处理图像,预处理包括去除背景噪声、增强对比度以及调整亮度;通过预设特征识别算法对预处理图像中的特征进行识别,得到数据特征;根据预设字词数据库对数据特征进行分类识别,得到表单数据;将表单数据存入预设表单数据库并将第一提示信息展示给用户,以提示用户表单数据录入完成。

3、通过采用上述技术方案,服务器获取待提取表单的拍摄图像,对拍摄图像进行预处理以增加拍摄图像的清晰度,进而提高数据识别提取的正确率;通过预设特征识别算法对预处理图像中的字词或数据等特征进行提取,以在后续步骤中对拍摄图像有针对性地进行识别,提高识别效率;根据预设字词数据库对数据特征进行分类识别,得到表单数据,通过提前构建好的预设字词数据库来进行分类识别,每个企业有各自的预设字词数据库,能够提高识别正确率;将表单数据存入预设表单数据库,以便于后续对表单的检索查阅需求;并将第一提示信息展示给用户,以及时提示用户表单数据录入完成。

4、可选地,在获取待提取表单的拍摄图像之后,方法还包括:对拍摄图像进行边缘检测和直线检测,得到图像边缘直线以及倾斜度;根据倾斜度判断图像边缘直线是否出现倾斜情况;若图像边缘直线出现倾斜情况,则通过图像边缘直线获取待提取表单的顶点坐标;根据倾斜度以及顶点坐标获取透视变换矩阵;根据透视变换矩阵对拍摄图像进行调整,得到透视变换后的拍摄图像。

5、通过采用上述技术方案,服务器通过对拍摄图像进行边缘检测和直线检测,得到图像边缘直线以及该边缘直线的倾斜度,通过倾斜度来判断表单当前是否摆放正确;当判断表单存在倾斜情况时,通过获取待提取表单的顶点坐标以及倾斜度来获取透视变换矩阵,以根据透视变换矩阵对拍摄图像进行调整,省去了工作人员对待提取表单进行反复调整的过程,提高了识别效率。

6、可选地,对拍摄图像进行预处理,得到预处理图像,具体包括:对拍摄图像进行预处理,得到待检测图像;对待检测图像进行边缘检测,得到边缘图像;根据sobel算子计算梯度幅值,梯度幅值为边缘图像中每个像素的梯度幅值;通过梯度幅值计算得到边缘图像的平均梯度幅值;判断平均梯度幅值是否大于或等于预设清晰度阈值;若平均梯度幅值大于或等于预设清晰度阈值,则将待检测图像作为预处理图像。

7、通过采用上述技术方案,服务器对拍摄图像进行预处理之后,通过进行边缘检测、计算像素的梯度幅值以及平均梯度幅值来判断拍摄图像的清晰度,以避免因图像清晰度不足,而无法提取出表单数据的情况。

8、可选地,在判断平均梯度幅值是否大于或等于预设清晰度阈值之后,方法还包括:若平均梯度幅值小于预设清晰度阈值,则确定待检测图像的清晰度不满足识别要求;将第二提示信息展示给用户,以提示用户提高待提取表单的清晰度。

9、通过采用上述技术方案,当平均梯度幅值小于预设清晰度阈值时,服务器确定待检测图像的清晰度不满足识别要求,此时将第二提示信息展示给用户,以及时提示用户提高待提取表单的清晰度。

10、可选地,根据预设字词数据库对数据特征进行分类识别,得到表单数据,具体包括:通过预设相似度算法获取第一相似度以及第二相似度,第一相似度为第一类型特征与数据特征之间的相似度值,第二相似度为第二类型特征与数据特征之间的相似度值,第一类型特征以及第二类型特征为预设字词数据库中的任意两个不同类型的特征;比较第一相似度与第二相似度之间的大小;若第一相似度大于第二相似度,则判断第一相似度是否大于或等于预设相似度阈值;若第一相似度大于或等于预设相似度阈值,则获取第一类型特征对应的字词数据;将字词数据构建为表单数据。

11、通过采用上述技术方案,服务器通过预设相似度算法,将数据特征和提前构建的预设字词数据库中特征进行比较以及计算相似度值,获取其中相似度值最高的第一类型特征,即确定数据特征根第一类型特征最为接近;为了避免该最高相似度值依然较低,即实际上数据特征并不属于第一类型特征的情况,判断第一相似度是否大于或等于预设相似度阈值;若第一相似度大于或等于预设相似度阈值,则说明数据特征属于第一类型特征,此时获取第一类型特征对应的字词数据,将字词数据构建为表单数据,以完成表单数据的提取。

12、可选地,在根据预设字词数据库对数据特征进行分类识别,得到表单数据之后,更新预设字词数据库,更新预设字词数据库具体包括:构建数据特征与字词数据之间的对应关系;将数据特征存入第一类型特征;将对应关系存入预设字词数据库,以更新预设字词数据库。

13、通过采用上述技术方案,服务器在提取出表单数据后,构建数据特征与字词数据之间的对应关系,将数据特征存入第一类型特征,将对应关系存入预设字词数据库,以更新预设字词数据库,同时也便于后续用户根据关键词对表单进行检索,以及提高了所述预设字词数据库对企业的针对性。

14、可选地,在将表单数据存入预设表单数据库并将第一提示信息展示给用户之后,方法还包括:响应于用户的表单查询操作,获取用户输入的目标关键词;在预设表单数据库中获取目标关键词对应的目标表单数据;将目标表单数据展示给用户。

15、通过采用上述技术方案,服务器能够响应于用户的表单查询操作,获取用户输入的目标关键词,以根据目标关键词在预设表单数据库中检索关键词对应的目标表单数据,将目标表单数据展示给用户,以满足用户的表单查询需求。

16、本申请在第二方面提供了一种企业表单数据提取装置,装置包括获取单元和处理单元;

17、获取单元,用于获取待提取表单的拍摄图像。

18、处理单元,用于对拍摄图像进行预处理,得到预处理图像,预处理包括去除背景噪声、增强对比度以及调整亮度;还用于通过预设特征识别算法对预处理图像中的特征进行识别,得到数据特征;还用于根据预设字词数据库对数据特征进行分类识别,得到表单数据;还用于将表单数据存入预设表单数据库并将第一提示信息展示给用户,以提示用户表单数据录入完成。

19、可选地,处理单元用于对拍摄图像进行边缘检测和直线检测,得到图像边缘直本文档来自技高网...

【技术保护点】

1.一种企业表单数据提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述获取待提取表单的拍摄图像之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述拍摄图像进行预处理,得到预处理图像,具体包括:

4.根据权利要求3所述的方法,其特征在于,在所述判断所述平均梯度幅值是否大于或等于预设清晰度阈值之后,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述根据预设字词数据库对所述数据特征进行分类识别,得到表单数据,具体包括:

6.根据权利要求1所述的方法,其特征在于,在所述根据预设字词数据库对所述数据特征进行分类识别,得到表单数据之后,更新所述预设字词数据库,所述更新所述预设字词数据库具体包括:

7.根据权利要求1所述的方法,其特征在于,在所述将所述表单数据存入预设表单数据库并将第一提示信息展示给用户之后,所述方法还包括:

8.一种企业表单数据提取装置,其特征在于,所述装置包括获取单元(201)和处理单元(202):

9.一种电子设备,其特征在于,包括处理器(301)、存储器(305)、用户接口(303)及网络接口(304),所述存储器(305)用于存储指令,所述用户接口(303)和所述网络接口(304)用于给其他设备通信,所述处理器(301)用于执行所述存储器(305)中存储的指令,以使所述电子设备(300)执行如权利要求1至7任意一项所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上权利要求1至7中任意一项所述方法。

...

【技术特征摘要】

1.一种企业表单数据提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述获取待提取表单的拍摄图像之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述拍摄图像进行预处理,得到预处理图像,具体包括:

4.根据权利要求3所述的方法,其特征在于,在所述判断所述平均梯度幅值是否大于或等于预设清晰度阈值之后,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述根据预设字词数据库对所述数据特征进行分类识别,得到表单数据,具体包括:

6.根据权利要求1所述的方法,其特征在于,在所述根据预设字词数据库对所述数据特征进行分类识别,得到表单数据之后,更新所述预设字词数据库,所述更新所述预设字词数据库具体包括:

7.根据...

【专利技术属性】
技术研发人员:李玮陈京南唐天溥王耀华乔林龚鼎盛白志斌董一军杨新峰
申请(专利权)人:北京佳华智联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1