基于数据匹配的数据导入方法及系统技术方案

技术编号:9991014 阅读:57 留言:0更新日期:2014-05-02 04:28
本发明专利技术公开了一种基于数据匹配的数据导入方法及系统,涉及数据匹配技术领域,所述方法包括以下步骤:S1:获取待导入的材料清单;S2:从所述待导入的材料清单中提取待导入的材料名称及材料规格;S3:计算所述待导入材料名称及材料规格与基础库中的每组数据之间的匹配率,所述基础库中的每组数据均包括:材料名称及材料规格;S4:根据所述匹配率将所述待导入材料名称及材料规格导入所述基础库中。本发明专利技术通过计算匹配率,并根据匹配率将所述待导入材料名称及材料规格导入基础库中,提高了数据录入效率,并降低了错误率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于数据匹配的数据导入方法及系统,涉及数据匹配
,所述方法包括以下步骤:S1:获取待导入的材料清单;S2:从所述待导入的材料清单中提取待导入的材料名称及材料规格;S3:计算所述待导入材料名称及材料规格与基础库中的每组数据之间的匹配率,所述基础库中的每组数据均包括:材料名称及材料规格;S4:根据所述匹配率将所述待导入材料名称及材料规格导入所述基础库中。本专利技术通过计算匹配率,并根据匹配率将所述待导入材料名称及材料规格导入基础库中,提高了数据录入效率,并降低了错误率。【专利说明】基于数据匹配的数据导入方法及系统
本专利技术涉及数据匹配
,特别涉及一种基于数据匹配的数据导入方法及系统。
技术介绍
在电力工程项目的建设过程中,所涉及到的材料、工程量数不胜数。由于这些电力材料、工程量分类繁多,规格型号各异,同时由于人为因素,对同一型号的材料的叫法也不尽相同,如施工单位所拿到的中标材料清单与施工图材料清单以及与现场人员对其的叫法不一致等。所以在电力施工单位对其会感到困惑,在施工和采购时也会造成一定困难。现有技术中,通常是由数据录入人员将中标清单、施工图清单、现场清单分次录入。由于不同角色对于物资的叫法不尽相同,数据录入人员无法将各类清单进行一一比对录入,从而导致系统中物资命名混乱无法进行有效合理分类,录入效率低下,并且错误率非常闻。
技术实现思路
(一)要解决的技术问题本专利技术要解决的技术问题是:如何提高数据录入效率,并降低错误率。(二)技术方案为解决上述技术问题,本专利技术提供了一种基于数据匹配的数据导入方法,所述方法包括以下步骤:`S1:获取待导入的材料清单;S2:从所述待导入的材料清单中提取待导入的材料名称及材料规格;S3:计算所述待导入材料名称及材料规格与基础库中的每组数据之间的匹配率,所述基础库中的每组数据均包括:材料名称及材料规格;S4:根据所述匹配率将所述待导入材料名称及材料规格导入所述基础库中。其中,步骤SI之前包括:SO:对所述基础库中每组数据均进行分词处理,并根据所述基础库中每组数据的分词结果创建索引;步骤S3包括:S301:对所述待导入材料名称及材料规格进行分词处理,并将所述待导入材料名称及材料规格的分词结果与所述基础库中每组数据的分词结果根据索引进行检索,统计所述基础库中每组数据的分词结果中与所述待导入材料名称及材料规格的分词结果匹配成功的分词个数;S302:根据下式计算所述匹配率p,P = W^a+Ws^b其中,W1= Ii^n1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b 均为权值、且O≤a≤1,0≤b≤I ;A为常数丸为所述待导入材料名称的分词结果与所述基础库中当前组数据的材料名称的分词结果匹配成功的分词个数;k2为所述待导入材料规格的分词结果与所述基础库中当前组数据的材料规格的分词结果匹配成功的分词个数J1为所述基础库中当前组数据的材料名称的分词个数;i2为所述基础库中当前组数据的材料规格的分词个数。其中,步骤S4包括:S401:将所述匹配率依次与第一阈值及第二阈值比较,所述第一阈值大于所述第二阈值;S402:若当前匹配率不小于所述第一阈值,则将所述待导入的材料名称及材料规格导入所述当前匹配率所对应的I组数据中,并结束流程;若所述当前匹配率不大于所述第二阈值,则将所述待导入的材料名称及材料规格作为新数据导入所述基础库中,并结束流程;若所述当前匹配率小于所述第一阈值且大于所述第二阈值,则执行步骤S403 ;S403:将所有匹配率进行从大到小排序,将前N个匹配率所对应的N组数据进行显示,所述N为不小于I的整数;S404:将所述待导入的材料名称及材料规格导入从显示的N组数据中所选择I组数据中,并结束流程;或,将所述待导入的材料名称及材料规格作为新数据导入所述基础库中,并结束流程。 本专利技术还公开了一种基于数据匹配的数据导入系统,所述系统包括:清单获取模块,用于获取待导入的材料清单;提取模块,用于从所述待导入的材料清单中提取待导入的材料名称及材料规格;匹配率计算模块,用于计算所述待导入材料名称及材料规格与基础库中的每组数据之间的匹配率,所述基础库中的每组数据均包括:材料名称及材料规格;导入模块,用于根据所述匹配率将所述待导入材料名称及材料规格导入所述基础库中。其中,所述系统还包括:索引创建模块,用于对所述基础库中每组数据均进行分词处理,并根据所述基础库中每组数据的分词结果创建索引;所述匹配率计算模块包括:分词统计子模块,用于对所述待导入材料名称及材料规格进行分词处理,并将所述待导入材料名称及材料规格的分词结果与所述基础库中每组数据的分词结果根据索引进行检索,统计所述基础库中每组数据的分词结果中与所述待导入材料名称及材料规格的分词结果匹配成功的分词个数;计算子模块,用于根据下式计算所述匹配率P,P = W^a+Wa^b 其中,W1= Iifn1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b 均为权值、且0≤a≤1,0≤b≤I ;A为常数丸为所述待导入材料名称的分词结果与所述基础库中当前组数据的材料名称的分词结果匹配成功的分词个数;k2为所述待导入材料规格的分词结果与所述基础库中当前组数据的材料规格的分词结果匹配成功的分词个数为所述基础库中当前组数据的材料名称的分词个数;i2为所述基础库中当前组数据的材料规格的分词个数。其中,所述导入模块包括:比较子模块,用于将所述匹配率依次与第一阈值及第二阈值比较,所述第一阈值大于所述第二阈值;判断子模块,用于若当前匹配率不小于所述第一阈值,则将所述待导入的材料名称及材料规格导入所述当前匹配率所对应的I组数据中;若所述当前匹配率不大于所述第二阈值,则将所述待导入的材料名称及材料规格作为新数据导入所述基础库中;若所述当前匹配率小于所述第一阈值且大于所述第二阈值;排序显示子模块,用于将所有匹配率进行从大到小排序,将前N个匹配率所对应的N组数据进行显示,所述N为不小于I的整数;数据导入子模块,用于将所述待导入的材料名称及材料规格导入从显示的N组数据中所选择I组数据中;或,将所述待导入的材料名称及材料规格作为新数据导入所述基础库中。(三)有益效果本专利技术通过计算匹配率,并根据匹配率将所述待导入材料名称及材料规格导入基础库中,提高了数据录入效率,并降低了错误率。【专利附图】【附图说明】图1是本专利技术一种实施方式的基于数据匹配的数据导入方法的流程框图;图2是本专利技术一种实施例的基于数据匹配的数据导入方法的流程框图;图3是本专利技术一种实施方式的基于数据匹配的数据导入系统的结构框图。【具体实施方式】下面结合附图和实施例,对本专利技术的【具体实施方式】作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。图1是本专利技术一种实施方式的基于数据匹配的数据导入方法的流程框图;参照图1,所述方法包括以下步骤:S1:获取待导入的材料清单;S2:从所述待导入的材料清单中提取待导入的材料名称及材料规格;S3:计算所述待导入材料名称及材料规格与基础库中的每组数据之间的匹配率,所述基础库中的每组数据均包括:材料名称及材料规格;S4:根据所述匹配率将所本文档来自技高网...
基于数据匹配的数据导入方法及系统

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:江春华罗新伟方文胡宝良陈显龙刘强
申请(专利权)人:北京恒华伟业科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1