一种工程造价分析数据采集与处理方法、系统技术方案

技术编号:36849723 阅读:22 留言:0更新日期:2023-03-15 17:05
本发明专利技术提供了一种工程造价分析数据采集与处理方法、系统,涉及工程造价技术领域,包括以下步骤:步骤一:收集所有预算报表的格式图像,对图像的字符格式面进行降噪锐化,去除噪点,集成为格式库;步骤二:提取格式库中所有报表上格式的颜色、纹理特征值;步骤三:将格式库中的格式图像融合特征值构建多个格式对比模型;本发明专利技术收集所有格式集成为格式库,并提取格式的特征值,作为对比依据,构建格式对比模型,并标记造价数据记录区域,接着获取所需要分析的预算报表图片的特征值,与对比模型对比,确定所属报表格式,以确定记录造价数据的区域,适配多种格式数据,精准确定数据记录区域,方便后续提取文字,节省人力,适用范围广。适用范围广。适用范围广。

【技术实现步骤摘要】
一种工程造价分析数据采集与处理方法、系统


[0001]本专利技术涉及工程造价
,尤其涉及一种工程造价分析数据采集与处理方法、系统。

技术介绍

[0002]在工程中,造价数据报表用于为项目投资控制、造价水平分析、工程决策分析等专业技经管理分析工作提供可靠的方法与依据,其中包含了采集到的造价数据、结算数据等一系列数据,由于采集的数据所涉及的业务范围广、背景数据量大,这使人工收集、人工统计分析的难度增加,人工计算非常容易出现无法避免的手误或遗漏,对最终造价分析结果产生一定影响,一定程度上降低了造价分析数据精确性。
[0003]现有技术中,一般采用人工收集造价报表上需要的数据,然后进行计算,费时费力,人工劳动强度大,也有的采用机器识别,然而,造价报表格式多样化,不同的格式中,所记录的重要数据位置不同,机器识别难以应对不同格式的报表来提取准确的数值,具有局限性,且报表中可能存在缺漏的情况,机器识别一般会忽略掉,造成数据损失,因此,本专利技术提出一种工程造价分析数据采集与处理方法、系统以解决现有技术中存在的问题。

技术实现思路

[0004]针对上述问题,本专利技术提出一种工程造价分析数据采集与处理方法、系统,该工程造价分析数据采集与处理方法、系统适配多种格式数据,精准确定数据记录区域,方便后续提取文字,节省人力,适用范围广。
[0005]为实现本专利技术的目的,本专利技术通过以下技术方案实现:一种工程造价分析数据采集与处理方法,其特征在于,包括以下步骤:
[0006]步骤一:收集所有预算报表的格式图像,对图像的字符格式面进行降噪锐化,去除噪点,集成为格式库;
[0007]步骤二:提取格式库中所有报表上格式的颜色、纹理特征值;
[0008]步骤三:将格式库中的格式图像融合特征值构建多个格式对比模型,人工在每个对比模块中标记造价数据记录区域;
[0009]步骤四:获取预算报表的图片数据,降噪后识别图片的颜色、纹理特征值,与对比模型对比,根据特征值确定所属报表格式;
[0010]步骤五:根据相应格式对比模型中人工标记的造价数据记录区域,确定预算报表图片上记录造价数据的区域;
[0011]步骤六:联网获取工程造价项目文本,以及多种专业术语,构建验证库;
[0012]步骤七:提取造价数据区域的有效文字,以验证库中的项目文本作为有效凭据,确定造价数据有效性,输出造价数据;
[0013]步骤八:当提取的文字出现缺漏,无法与验证库中文本完全匹配,则输出异常提醒,并根据缺漏前后文,列举相似的专业术语以供选择。
[0014]进一步改进在于:所述步骤一中,采用Lightroom/ACR全局降噪技术和Nik Dfine2局部降噪对格式图像进行处理。
[0015]进一步改进在于:所述步骤二中,利用ENVI软件识别格式库中所有报表的图像,并转换为HLS图像,提取颜色特征,然后通过ENVI软件的滤波功能对格式库中所有报表的图像进行滤波,并将其滤波提取的纹理结果置于ARCGIS进行密度分析,确定文字的纹理细密度,接着对图像进行光谱二阶导数的求取,在ENVI IDL中编写二阶导数运算算法,确定图像的特征值。
[0016]进一步改进在于:所述步骤三中,用REVIT软件进行建模处理,首先设置标高和轴网,然后将格式库中的格式图像导入,以此为基础,生成平面模型,然后将平面模型和颜色、纹理特征值导入GML中,实现数据可视化,接着,利用SVG进行数据矢量化,形成点、线、面,由点、线、面组成具体矢量化模型,以此构建多个格式对比模型,且步骤三中,人工在每个对比模块中标记造价数据记录区域,设置触发响应。
[0017]进一步改进在于:所述步骤四中,预算报表为实体报表或者文档报表,在实体报表情况下,通过拍摄获取其图片数据,在文档报表情况下,将文档转换为PDF图像文件;且步骤四中,采用Lightroom/ACR全局降噪技术和NikDfine2局部降噪对图片数据进行降噪,接着重复步骤二提取的步骤,识别图片的颜色、纹理特征值。
[0018]进一步改进在于:所述步骤五中,确定报表格式后,归类于相应的格式对比模型中,触发人工标记的造价数据记录区域,根据预算报表图片数据与相应格式对比模型的比例,确定造价数据记录区域,在预算报表图片数据中,对确定的造价数据记录区域进行高亮标记。
[0019]进一步改进在于:所述步骤六中,工程造价项目文本包括所有关乎工程造价的所有项目的文本介绍摘要和工程造价项目术语,多种专业术语包括工程造价项目术语以及与此术语相同或者相似的专业术语,以此作为验证库。
[0020]进一步改进在于:所述步骤七中,采用STAR

Net算法,识别预算报表图片的造价数据区域的文字,采用Term

Frequency、Inversedocumentfrequency和TF

IDF算法相结合的手段,以验证库中的项目文本作为有效凭据,提取文字中的专业术语以及专业术语后的造价数字,摒除无用文字,余下有效数据,将数据以列表的形式输出至显示端。
[0021]进一步改进在于:所述步骤八中,当提取的文字出现缺漏,缺漏的判断标准为:以验证库作为基础,当提取的文字与工程造价项目文本、多种专业术语达到60%相似,但无法完全匹配时,则判断该文字为缺漏,输出异常提醒信息至显示端,并根据60%及以上相似度,从验证库中进行筛选匹配,在显示端列举出可能匹配的相似专业术语以供选择。
[0022]一种工程造价分析数据采集与处理系统,包括存储有计算机程序的计算机可读存储介质和处理器,计算机可读存储介质上存储有能够被处理器加载并执行如上述所述一种工程造价分析数据采集与处理方法。
[0023]本专利技术的有益效果为:
[0024]1、本专利技术收集所有格式集成为格式库,并提取格式的特征值,作为对比依据,构建格式对比模型,并标记造价数据记录区域,接着获取所需要分析的预算报表图片的特征值,与对比模型对比,确定所属报表格式,以确定记录造价数据的区域,适配多种格式数据,精准确定数据记录区域,方便后续提取文字,节省人力,适用范围广。
[0025]2、本专利技术获取工程造价项目文本,以及多种专业术语,构建验证库,在提取所需要分析的预算报表图片的造价数据后,以验证库中的项目文本作为有效凭据,确定造价数据文字的有效性,避免无用文字,提取更加准确。
[0026]3、本专利技术根据60%及以上相似度以及缺漏前后文,提取出缺漏的文字,不忽略,避免数据损失,后续根据相似术语提供匹配选项,便于操作人员及时弥补,保证数据的完整性。
附图说明
[0027]图1为本专利技术的方法流程图。
具体实施方式
[0028]为了加深对本专利技术的理解,下面将结合实施例对本专利技术做进一步详述,本实施例仅用于解释本专利技术,并不构成对本专利技术保护范围的限定。
[0029]实施例一
[0030]根据图1所示,本实施例提出了一种工程造价分析数据采集与处理方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工程造价分析数据采集与处理方法,其特征在于,包括以下步骤:步骤一:收集所有预算报表的格式图像,对图像的字符格式面进行降噪锐化,去除噪点,集成为格式库;步骤二:提取格式库中所有报表上格式的颜色、纹理特征值;步骤三:将格式库中的格式图像融合特征值构建多个格式对比模型,人工在每个对比模块中标记造价数据记录区域;步骤四:获取预算报表的图片数据,降噪后识别图片的颜色、纹理特征值,与对比模型对比,根据特征值确定所属报表格式;步骤五:根据相应格式对比模型中人工标记的造价数据记录区域,确定预算报表图片上记录造价数据的区域;步骤六:联网获取工程造价项目文本,以及多种专业术语,构建验证库;步骤七:提取造价数据区域的有效文字,以验证库中的项目文本作为有效凭据,确定造价数据有效性,输出造价数据;步骤八:当提取的文字出现缺漏,无法与验证库中文本完全匹配,则输出异常提醒,并根据缺漏前后文,列举相似的专业术语以供选择。2.根据权利要求1所述的一种工程造价分析数据采集与处理方法,其特征在于:所述步骤一中,采用Lightroom/ACR全局降噪技术和NikDfine2局部降噪对格式图像进行处理。3.根据权利要求2所述的一种工程造价分析数据采集与处理方法,其特征在于:所述步骤二中,利用ENVI软件识别格式库中所有报表的图像,并转换为HLS图像,提取颜色特征,然后通过ENVI软件的滤波功能对格式库中所有报表的图像进行滤波,并将其滤波提取的纹理结果置于ARCGIS进行密度分析,确定文字的纹理细密度,接着对图像进行光谱二阶导数的求取,在ENVIIDL中编写二阶导数运算算法,确定图像的特征值。4.根据权利要求3所述的一种工程造价分析数据采集与处理方法,其特征在于:所述步骤三中,用REVIT软件进行建模处理,首先设置标高和轴网,然后将格式库中的格式图像导入,以此为基础,生成平面模型,然后将平面模型和颜色、纹理特征值导入GML中,实现数据可视化,接着,利用SVG进行数据矢量化,形成点、线、面,由点、线、面组成具体矢量化模型,以此构建多个格式对比模型,且步骤三中,人工在每个对比模块中标记造价数据记录区域,设置触发响应。5.根据权利要求4所述的一种工程造价分析数据采集与处理方法,其特征在于:所述步骤四中,预算报表为实体报表或者...

【专利技术属性】
技术研发人员:张晓岚吕玉正李晓鹏陈虹李少华
申请(专利权)人:中国人民解放军军事科学院国防工程研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1