【技术实现步骤摘要】
纸质数据数字化方法及装置、电子设备、存储介质
本申请涉及图像处理领域、云计算领域,具体涉及图像识别技术,尤其涉及一种纸质数据数字化方法及装置、电子设备、存储介质。
技术介绍
随着计算机技术的飞速发展,各行各业在日常工作中都会积累大量的观测数据,比如气象观测行业每天都会记录大量的空气湿度、温度、大气压等气象数据。这些数据可以直接记录在计算机存储系统中,更易保存和分析,但是,在计算机技术欠发达的过去,各大行业积累了大量的纸质数据,还有一些行业在生产环境中不易使用电子设备,同样会积累大量非数字化数据,这类数据存储媒介不易存储、容易丢失损坏,且读取成本较高,不易对比计算分析。现有技术中数据数字化通常是通过文字识别的方法来进行数字化,但是,很多纸质数据中不仅包括文字内容,还包括图形内容,但是,现有技术中的方案只能够识别出文字内容,无法识别纸质数据中的图形内容。
技术实现思路
本申请提供了一种纸质数据数字化方法及装置、电子设备、存储介质。根据本申请的第一方面,提供了一种纸质数据数字化方法,包括 ...
【技术保护点】
1.一种纸质数据数字化方法,包括:/n根据待处理图像、所述待处理图像对应的标注信息确定标准模板;所述待处理图像是对纸质数据拍摄得到的;所述标准模板用于表示所述待处理图像的参考坐标系;/n识别所述待处理图像中包括的图形笔迹信息;/n根据所述图形笔迹信息、所述标准模板生成与所述待处理图像对应的数字化数据。/n
【技术特征摘要】
1.一种纸质数据数字化方法,包括:
根据待处理图像、所述待处理图像对应的标注信息确定标准模板;所述待处理图像是对纸质数据拍摄得到的;所述标准模板用于表示所述待处理图像的参考坐标系;
识别所述待处理图像中包括的图形笔迹信息;
根据所述图形笔迹信息、所述标准模板生成与所述待处理图像对应的数字化数据。
2.根据权利要求1所述的方法,其中,所述标注信息包括坐标点信息,所述根据待处理图像、所述待处理图像对应的标注信息确定标准模板,包括:
根据所述坐标点信息进行拟合得到坐标系信息;
根据所述待处理图像、所述坐标系信息确定所述标准模板。
3.根据权利要求1或2所述的方法,其中,所述根据待处理图像、所述待处理图像对应的标注信息确定标准模板之前,还包括:
响应对所述待处理图像的标注指令,在所述待处理图像中显示标注位置并确定所述标注信息。
4.根据权利要求3所述的方法,其中,所述标注指令包括定位点标注指令,所述标注信息包括定位点信息;
和/或,所述标注指令包括坐标点标注指令,所述标注信息包括坐标点信息。
5.根据权利要求4所述的方法,其中,所述定位点信息包括所述待处理图像的框架定点,用于限定所述标准模板的范围。
6.根据权利要求1所述的方法,其中,所述识别所述待处理图像中包括的图形笔迹信息,包括:
将所述待处理图像输入预设语义分割模型,输出所述待处理图像中包括的图形笔迹信息;
其中,所述语义分割模型用于确定所述待处理图像中包括的图形笔迹信息。
7.根据权利要求6所述的方法,其中,所述预设语义分割模型具体用于:
确定所述待处理图像中各个像素属于图形笔迹的第一概率值和/或不属于曲线笔迹的第二概率值;
根据所述第一概率值和/或第二概率值确定所述像素是否属于所述图形笔迹;
根据属于所述图形笔迹的像素确定所述图形笔迹信息。
8.根据权利要求1所述的方法,其中,所述根据所述图形笔迹信息、所述标准模板生成与所述待处理图像对应的数字化数据,包括:
将所述图形笔迹信息映射到所述标准模板中,得到初始数字化表格;其中,所述初始数字化表格中包括所述图形笔迹信息;
对所述初始数字化表格中的所述图形笔迹信息进行细化处理得到单像素宽度的笔迹;
根据所述单像素宽度的笔迹、所述标准模板中包括的所述参考坐标系确定与所述待处理图像对应的数字化数据。
9.根据权利要求8所述的方法,其中,所述标注信息包括定位点信息,所述标准模板包括所述定位点信息;
所述将所述图形笔迹信息映射到所述标准模板中,得到初始数字化表格,包括:
响应对所述图形笔迹信息的标注操作,在所述图形笔迹信息中确定与所述标准模板中定位点信息对应的匹配位置;
根据所述定位点信息与所述匹配位置的对应关系,将所述图形笔迹信息映射到所述标准模板中,得到所述初始数字化表格。
10.根据权利要求8所述的方法,其中,所述将所述笔迹信息映射到所述标准模板中,得到初始数字化表格,包括:
响应对所述图形笔迹信息、所述标准模板的匹配操作,在所述图形笔迹信息中确定第一匹配位置,在所述标准模板中确定第二匹配位置;其中,所述第一匹配位置与所述第二匹配位置对应;
根据所述第一匹配位置与所述第二匹配位置的对应关系,将所述图形笔迹信息映射到所述标准模板中,得到所述初始数字化表格。
11.根据权利要求8-10任一项所述的方法,其中,所述对所述初始数字化表格中的所述图形笔迹信息进行细化处理得到单像素宽度的笔迹,包括:
基于骨架提取算法对所述初始数字化表格中的所述图形笔迹信息进行处理,得到单像素宽度的笔迹。
12.根据权利要求8-10任一项所述的方法,其中,所述根据所述单像素宽度的笔迹、所述标准模板确定与所述待处理图像对应的数字化表格,包括:
根据所述单像素宽度的笔迹、所述标准模板中包括的素数参考坐标系,确定所述笔迹中每个像素点对应的数值信息;
根据所述数值信息确定与所述待处理图像对应的数字化数据。
13.一种纸质数据数字化装置,包括:
模板确定单元,用于根据待处理图像、所述待处理图像对应的标注信息确定标准模板;所述待处理图像是对纸质数据拍摄得到的;所述标准模板用于表示...
【专利技术属性】
技术研发人员:刘亚博,邹建法,聂磊,黄锋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。