当前位置: 首页 > 专利查询>东南大学专利>正文

纸质水文资料的数字化方法及装置制造方法及图纸

技术编号:14445354 阅读:79 留言:0更新日期:2017-01-15 11:13
本发明专利技术公开了一种纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据。该方法包括以下步骤:从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;对坐标网格图像、水文曲线图像进行倾斜校正;分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;计算出单位网格对应的水文数据;计算交点所对应的水文数据。本发明专利技术还公开了一种纸质水文资料的数字化装置。相比现有技术,本发明专利技术具有准确性和自动化程度高的优点,可大幅提高水文数据资料数字化的效率,降低成本。

【技术实现步骤摘要】

本专利技术涉及一种纸质水文资料的数字化方法及装置,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,属于计算机图像识别技术与水利技术相交叉的

技术介绍
在计算机没有普及之前,在水利、气象、生物医学、石油地质等领域,都是通过特定仪器或者人工将观测的有效数据信息绘制在纸质工程图纸上。在水利领域方面,水文信息是水利工程发展中最重要最根本的内容。可知纸质水文资料上的数据均是比较珍贵的历史资料,记录流量、水位、降水量、蒸发量等,其中很多的数据会被经常用来分析与处理,对这些有效信息的利用与共享将为我国水利工程建设提供科学的理论与依据,将会大大促进我国水利事业的发展。然而这类水文纸质资料并不是完全保存完整,随着时间,会受到存放条件、温度、环境等影响,导致如纸质磨坏破损、时间过久老化、字迹变淡模糊、纸质资料字迹渗透等污染,这些都会对历史数据的安全以及价值带来影响。因此对这类纸质资料进行数字化,将纸质水文资料中的重要的数据转移到计算机中进行分类存储和处理是很有必要的。由于水文纸质资料种类繁多以及数据多样化,对这些资料进行保存到计算机的过程中,一般是以人工为主,选择代表性的节点及数据,指定插值或曲线拟合的方法,计算出某一时间的水位信息等数据。但是曲线形态各异,拟合或插值并不能通用。另一种方式是通过人工录入数据并建立大型数据库,由于资料种类繁多数据量大,工作量巨大且易出错,数据需要经过严格的审查与校核才能入库,并需要提供各种不同的检索方式,而且并不保证能够在最短时间准确找到需要的数据。随着计算机技术的快速发展,数字图像处理技术渐渐成熟,很多研究者对图像处理技术有深入研究并且应用到实际领域中,如水利、石油地质、气象等。一方面,水文纸质资料与其他工程图纸相比,图纸的材质与规格并不相同,以及应用需求并不相同,从而如心电图等工程图纸数字化方法,并不能完全适用于纸质水位资料。另一方面,部分有关水文历史资料的数字化研究不够深入,例如[魏庆杰,董秀强.水文资料数据库管理系统开发及应用[J].水利科技与经济,第15卷,2009,163-165]、[赵春霖,孙利芳,王健.水文资料整编管理系统的设计思路及功能实现[J].内蒙古大学学报(自然科学版),2003,34(5):556-559]、[赵启升.数字化水资源档案管理系统的设计与实现[J].信息技术,2005,8:56-59]等均利用扫描仪将纸质水文资料转换图像格式进行入库保存。又如文献[肖卫,时昶,高军.历史水文资料数字化处理[J],人民长江,2011,42(11):67-69]、[王意惟,李登民,隋铁成.水文原始资料数据库的开发应用与分析评价[J].东北水利水电,2008,26(12):40-41]等,对水文资料的管理通过人工录入信息建立对应的数据库,对资料分类进行整编到数据库中,但是数据信息在录入之前需要经过严格的校正,对访问数据时需要建立各种索引,不能够快速用于进一步的参考与研究当中。综上可知,对于水文纸质资料而言,还没有能够全自动实现水文曲线数字化的技术被公开,且水文资料幅面大引起的形变给图像分割及数据提取带来一定难度。
技术实现思路
本专利技术所要解决的问题在于克服现有技术不足,提供一种纸质水文资料的数字化方法及装置,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,具有准确性和自动化程度高的优点。本专利技术具体采用以下技术方案解决上述技术问题:纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,包括以下步骤:步骤A、从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;步骤B、对坐标网格图像、水文曲线图像进行倾斜校正;步骤C、分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;步骤D、利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;步骤E、扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;步骤F、对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。优选地,所述对坐标网格图像、水文曲线图像进行倾斜校正,其方法具体如下:利用霍夫变换获得坐标网格图像中心区域的倾斜角度,然后按照所述倾斜角度对坐标网格图像、水文曲线图像分别进行旋转校正。优选地,按照以下方法对倾斜校正后的水文曲线图像进行图像增强:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理。优选地,所述对倾斜校正后的坐标网格图像进行图像增强,具体是指:利用行列投影的方法去除坐标网格区域外的点以及网格内部的噪点。优选地,所述利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合,具体方法如下:首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。优选地,所述交点所处网格的上、下端线按照以下方法确定:在坐标网格图像中确定以该交点为中心,宽度为60像素,高度为2倍单位网格高度的邻域;对于所述邻域中的每一行,统计其中位于网格线上的点的数目Neighbor_blackpoint,并将Neighbor_blackpoint大于一预设阈值的行作为候选端线,如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点上方的所有候选端线中距离交点最近的候选端线即为交点所处网格的上端线,位于交点下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线。优选地,所述从上、下端线中确定交点所处网格的基线,具体方法如下:确定与交点所处网格纵向距离较近的水文曲线极值点,然后选择距离所述水文曲线极值点距离近的端线作为基线。根据相同的专利技术思路还可以得到以下技术方案:纸质水文资料的数字化装置,包括:图像分割单元,用于从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;倾斜校正单元,用于对坐标网格图像、水文曲线图像进行倾斜校正;图本文档来自技高网
...
纸质水文资料的数字化方法及装置

【技术保护点】
纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,其特征在于,包括以下步骤:步骤A、从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;步骤B、对坐标网格图像、水文曲线图像进行倾斜校正;步骤C、分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;步骤D、利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;步骤E、扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;步骤F、对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。

【技术特征摘要】
1.纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,其特征在于,包括以下步骤:步骤A、从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;步骤B、对坐标网格图像、水文曲线图像进行倾斜校正;步骤C、分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;步骤D、利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;步骤E、扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;步骤F、对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。2.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述对坐标网格图像、水文曲线图像进行倾斜校正,其方法具体如下:利用霍夫变换获得坐标网格图像中心区域的倾斜角度,然后按照所述倾斜角度对坐标网格图像、水文曲线图像分别进行旋转校正。3.如权利要求1所述纸质水文资料的数字化方法,其特征在于,按照以下方法对倾斜校正后的水文曲线图像进行图像增强:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理。4.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述对倾斜校正后的坐标网格图像进行图像增强,具体是指:利用行列投影的方法去除坐标网格区域外的点以及网格内部的噪点。5.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合,具体方法如下:首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。6.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述交点所处网格的上、下端线按照以下方法确定:在坐标网格图像中确定以该交点为中心,宽度为60像素,高度为2倍单位网格高度的邻域;对于所述邻域中的每一行,统计其中位于网格线上的点的数目Neighbor_blackpoint,并将Neighbor_blackpoint大于一预设阈值的行作为候选端线,如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点上方的所有候选端线中距离交点最近的候选端线即为交点所处网格的上端线,位于交点下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线。7.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述从上、下端线中确定交点所处网格的基线,具体方法如下:确定与交点所处网格纵向距离较近的水文曲线极值点,然后选择距离...

【专利技术属性】
技术研发人员:郝立李士进占迪朱海晨高祥涛柏屏胡金龙曹帅
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1