一种基于关键词词库的工程造价数据解析系统及其方法技术方案

技术编号:37352570 阅读:18 留言:0更新日期:2023-04-27 07:03
本发明专利技术提供了一种基于关键词词库的工程造价数据解析系统及其方法,涉及工程造价技术领域,包括数据中心、分析中心和计算中心,所述数据中心、分析中心和计算中心基于计算机,所述数据中心包括人工输入数据库、网络数据库,所述分析中心包括文档提取模块、图片提取模块、关键词定位模块和关键词划分模块;本发明专利技术将所有的预算报表以文档、图片形式进行储存,并取决于词语对于工程项目的重要程度及关联性,自动提取文档、图片中与项目关联的关键词,与网络数据库中工程造价各项目的关键词进行比对,从而分析相应项目的造价公开数据,方便快速处理冗杂繁多的报表数据,自动提取相关联的关键词,提高处理效率。提高处理效率。提高处理效率。

【技术实现步骤摘要】
一种基于关键词词库的工程造价数据解析系统及其方法


[0001]本专利技术涉及工程造价
,尤其涉及一种基于关键词词库的工程造价数据解析系统及其方法。

技术介绍

[0002]工程造价是指构成项目在建设期预计或实际支出的建设费用,其综合运用管理学、经济学和工程技术等方面的知识与技能,对工程造价进行预测、计划、控制、核算、分析和评价等的工作过程被称为工程造价管理,按照法律法规和标准等规定的程序、方法和依据,对工程造价及其构成内容进行的预测或确定被称为工程计价,工程计价依据包括与计价内容、计价方法和价格标准相关的工程计量计价标准,工程计价定额及工程造价信息等,工程中,通常存在繁多的预算报表,预算报表中,存在一些工程造价项目和其他项目等多重数据,当需要工程造价评估时,员工必须在繁多的预算报表处筛选出属于工程造价项目的关键词,进行计算分析;
[0003]现有技术中,如授权公告号CN 113505211 B公开了“一种基于关键词词库的工程造价数据解析系统及其方法”,并具体公开了:更新工程造价数据解析系统;基于更新后的工程造价数据解析系统,获取用户输入的工程造价查询数据的查询检索结果;根据查询检索结果进行数据解析,得到工程造价数据解析结果;然而,上述技术中,仍然需要人工输入造价查询数据,再进行解析判断,造价查询数据的关键仍然需要人工从各种报表资料中获取,再进行查询解析,该技术并没有解决现有工程造价解析中,数据繁多,不易快速筛选评估的缺点,因此,本专利技术提出一种基于关键词词库的工程造价数据解析系统及其方法以解决现有技术中存在的问题。

技术实现思路

[0004]针对上述问题,本专利技术提出一种基于关键词词库的工程造价数据解析系统及其方法,该基于关键词词库的工程造价数据解析系统及其方法方便快速处理冗杂繁多的报表数据,自动提取相关联的关键词,提高处理效率。
[0005]为实现本专利技术的目的,本专利技术通过以下技术方案实现:一种基于关键词词库的工程造价数据解析系统,包括数据中心、分析中心和计算中心,所述数据中心、分析中心和计算中心基于计算机,所述数据中心包括人工输入数据库、网络数据库,所述分析中心包括文档提取模块、图片提取模块、关键词定位模块和关键词划分模块,所述计算中心包括关键词单元计算模块和总体计算模块;
[0006]所述人工输入数据库用于储存人工输入的整个工程所有的预算报表,包括文档形式和图片形式,所述网络数据库用于连接互联网,提取工程造价各项目的关键词,并检索相应项目的造价公开数据进行储存,所述文档提取模块用于提取人工输入数据库中文档形式报表的关键词,所述图片提取模块用于提取人工输入数据库中图片形式报表的关键词,关键词取决于该词语对于工程项目的重要程度及关联性,所述关键词定位模块用于对所有提
取的关键词溯源,记录其原文件,所述关键词划分模块联网获取关键词所属项目分类,用于将所有提取的关键词按照项目分类进行划分归类,构建多个单元集,所述关键词单元计算模块用于以单元集为单位,与网络数据库中的相同及相近关键词比对,确定单元集内各关键词造价,计算单元集总体造价并输出报表,所述总体计算模块用于计算所有单元集总体造价,并输出报表。
[0007]进一步改进在于:所述人工输入数据库包括本地储存中心和人工输入选项,所述人工输入选项基于计算机人机交互面板,且人工输入选项包括文档形式接收和图片形式接收,用于接收所有的预算报表储存在本地储存中心中,并在输入的过程中,对每个预算报表打上时间戳,提供时间检索功能。
[0008]进一步改进在于:所述网络数据库包括关键词数据库、造价数据库、定时更新模块和联网模块,所述联网模块连接互联网,给网络数据库提供网络支持,所述关键词数据库内置归纳模块和人工调整选项,所述归纳模块基于网络检索工程流程及造价项目,归纳各造价项目的关键词进行储存,所述人工调整选项提供人工改变关键词的功能。
[0009]进一步改进在于:所述造价数据库基于网络根据关键词数据库内部归纳的关键词进行检索,获取相应关键词的造价公开数据进行储存,所述定时更新模块用于设定定时间隔,使得造价数据库按照定时间隔联网检索最新的造价公开数据。
[0010]进一步改进在于:所述文档提取模块基于TF

IDF统计文档检索算法,评估一个词语对于一个语料库中的某个文档的重要程度,提取语料库中文档的关键词,所述图片提取模块通过CNN获取图像的视觉特征,通过RNN获取图像的序列特征,通过分类器CTC或解码器attention获取文字序列信息,提取出图片中的文档,然后基于所述文档提取模块,利用TF

IDF统计文档检索算法,评估一个词语对于一个语料库中的某个文档的重要程度,提取语料库中文档的关键词。
[0011]进一步改进在于:所述关键词定位模块用于将文档提取模块、图片提取模块提取的关键词与其原文件进行绑定,且关键词定位模块提供溯源查询功能和文件修改功能,所述溯源查询功能提供根据关键词查询原文件的功能,所述文件修改功能提供对原文件修改、删除的选项,所述关键词划分模块以网络数据库作为数据源,联网检索所有提取出来的关键词的工程项目划分,将相同项目和相近项目的关键词进行分类归纳,构建多个单元集。
[0012]进一步改进在于:所述关键词单元计算模块包括比对总结模块、相近词判断模块和单元报表输出模块,所述相近词判断模块以网络数据库作为联网路径,联网检索所有与分析中心提取的关键词相似工程功能项目的词,在每个关键词下以该关键词为主体围绕检索到相似词构建对比细胞,所述比对总结模块基于神经网络,将对比细胞与网络数据库中归纳的关键词进行神经训练,筛选出有效工程功能项目含义的关键词,从而获取该对比细胞最新造价公开数据,一个单元集中内置多个对比细胞,所述单元报表输出模块用于将每个单元集中的多个对比细胞造价进行相加,输出该单元集的总体造价报表。
[0013]进一步改进在于:所述总体计算模块用于将所有单元集的总体报价进行相加,输出总体的造价报表,且总体计算模块提供分级检索功能,兼容向下,用于检索内置的所有对比细胞、单元集的造价数据。
[0014]一种基于关键词词库的工程造价数据解析方法,包括以下步骤:
[0015]步骤一:人工输入整个工程所有的预算报表至人工输入数据库,包括文档形式和
图片形式;
[0016]步骤二:连接互联网,提取工程造价各项目的关键词,并检索相应项目的造价公开数据,储存至网络数据库;
[0017]步骤三:提取人工输入数据库中文档形式报表的关键词,提取图片形式报表的关键词,联网获取关键词所属项目分类,将相同项目和相近项目的关键词进行分类归纳,构建多个单元集;
[0018]步骤四:联网检索所有提取的关键词相似工程功能项目的词,以该关键词为主体围绕检索到相似词构建对比细胞;
[0019]步骤五:基于神经网络,将对比细胞与网络数据库中的关键词进行神经训练,筛选出有效工程含义的关键词,从而获取该对比细胞最新造价公开数据;
[0020]步骤六:将每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于关键词词库的工程造价数据解析系统,包括数据中心、分析中心和计算中心,其特征在于:所述数据中心、分析中心和计算中心基于计算机,所述数据中心包括人工输入数据库、网络数据库,所述分析中心包括文档提取模块、图片提取模块、关键词定位模块和关键词划分模块,所述计算中心包括关键词单元计算模块和总体计算模块;所述人工输入数据库用于储存人工输入的整个工程所有的预算报表,包括文档形式和图片形式,所述网络数据库用于连接互联网,提取工程造价各项目的关键词,并检索相应项目的造价公开数据进行储存,所述文档提取模块用于提取人工输入数据库中文档形式报表的关键词,所述图片提取模块用于提取人工输入数据库中图片形式报表的关键词,关键词取决于该词语对于工程项目的重要程度及关联性,所述关键词定位模块用于对所有提取的关键词溯源,记录其原文件,所述关键词划分模块联网获取关键词所属项目分类,用于将所有提取的关键词按照项目分类进行划分归类,构建多个单元集,所述关键词单元计算模块用于以单元集为单位,与网络数据库中的相同及相近关键词比对,确定单元集内各关键词造价,计算单元集总体造价并输出报表,所述总体计算模块用于计算所有单元集总体造价,并输出报表。2.根据权利要求1所述的一种基于关键词词库的工程造价数据解析系统,其特征在于:所述人工输入数据库包括本地储存中心和人工输入选项,所述人工输入选项基于计算机人机交互面板,且人工输入选项包括文档形式接收和图片形式接收,用于接收所有的预算报表储存在本地储存中心中,并在输入的过程中,对每个预算报表打上时间戳,提供时间检索功能。3.根据权利要求2所述的一种基于关键词词库的工程造价数据解析系统,其特征在于:所述网络数据库包括关键词数据库、造价数据库、定时更新模块和联网模块,所述联网模块连接互联网,给网络数据库提供网络支持,所述关键词数据库内置归纳模块和人工调整选项,所述归纳模块基于网络检索工程流程及造价项目,归纳各造价项目的关键词进行储存,所述人工调整选项提供人工改变关键词的功能。4.根据权利要求3所述的一种基于关键词词库的工程造价数据解析系统,其特征在于:所述造价数据库基于网络根据关键词数据库内部归纳的关键词进行检索,获取相应关键词的造价公开数据进行储存,所述定时更新模块用于设定定时间隔,使得造价数据库按照定时间隔联网检索最新的造价公开数据。5.根据权利要求4所述的一种基于关键词词库的工程造价数据解析系统,其特征在于:所述文档提取模块基于TF

IDF统计文档检索算法,评估一个词语对于一个语料库中的某个文档的重要程度,提取语料库中文档的关键词,所述图片提取模块通过CNN获取图像的视觉特征,通过RNN获取图像的序列特征,通过分类器CTC或解码器attention获取文字序列信息,提取出图片中的文档,然后基于所述文档提取模块,利用TF

【专利技术属性】
技术研发人员:张晓岚刘锟吕玉正李晓鹏李少华孙云厚王晓波
申请(专利权)人:中国人民解放军军事科学院国防工程研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1