The invention relates to an enterprise identification system based on configuration layer and its implementation method. The system consists of a configuration layer and a data separation device. The configuration layer includes source management, factor relation and data to identify three layers; source data source management to identify enterprise, and the enterprise name tag and two of source identification; processing results with the data of the confidence interval source management can access by relationship layer; relationship between layers according to the influence of enterprise recognition the total weight of the weight factor, proportion and similarity matching, summary factor matching data provide the basis for data recognition layer; data recognition layer, are weighted to calculate the total score by the factor, summary data, the identification result; separating device for data input and output of each configuration of enterprise data layer. In accordance with the input conditions to access the next layer, returns the original data source of enterprise data conforms to the output condition. The invention can filter multi-channel and multi source enterprise data in layers and match recognition repeatedly, and can be effectively applied to a variety of e-government systems.
【技术实现步骤摘要】
一种基于配置层的企业识别系统及其实现方法
本专利技术涉及计算机应用
,特别涉及一种基于配置层的企业识别系统及其实现方法。
技术介绍
随着国家信息化建设不断推进,多个地区已开展数据资源共享和整合的工作。但是,对于政务部门,仍存在多个系统共同工作,并且使用复杂的交互方式进行数据共享的现状。这种现状容易出现数据更新不及时,以及当某个系统停用了导致其他系统数据不更新的问题。以商务局使用的系统为例,企业信息是多个系统的核心内容。但由于企业信息属性多,并且存在变更的需要,一个企业存在的信息变更次数可能是上百次,变更过程还有可能出现人工误录入的场景,企业识别错误的情况会很容易导致围绕企业的其他功能出现问题。这时候就需要一种灵活度高和适用范围广的方法,可以对变更过或者更新不及时的企业信息进行识别,保证基于企业信息的其他功能正常运作。
技术实现思路
本专利技术解决的技术问题之一在于针对商务企业数据存在数据更新不及时、数据不更新和数据经人工误录入等企业数据异常的问题,提供一种基于配置层的企业识别系统。本专利技术解决的技术问题之二在于提供一种基于配置层的企业识别系统的实现方法;通过将 ...
【技术保护点】
一种基于配置层的企业识别系统,其特征在于:所述的系统由配置层和数据分离装置组成,并提供相应的开发和集成接口;所述的数据分离装置,用于每个配置层的输入输出,对符合输入条件的企业数据接入下一层,对符合输出条件的企业数据返回初始数据来源;所述的配置层,由来源管理层、因子关系层和数据识别层构成;所述的来源管理层,管理待识别企业的数据来源,并对可识别的来源进行企业名称标记和二次处理;对处理结果符合来源管理层置信区间的数据接入因子关系层;所述的因子关系层,根据影响企业识别权重的共有因子,对接入的数据进行权重比例分配以及相似度匹配,汇总的因子匹配数据为数据识别层提供计算依据;所述的数据识 ...
【技术特征摘要】
1.一种基于配置层的企业识别系统,其特征在于:所述的系统由配置层和数据分离装置组成,并提供相应的开发和集成接口;所述的数据分离装置,用于每个配置层的输入输出,对符合输入条件的企业数据接入下一层,对符合输出条件的企业数据返回初始数据来源;所述的配置层,由来源管理层、因子关系层和数据识别层构成;所述的来源管理层,管理待识别企业的数据来源,并对可识别的来源进行企业名称标记和二次处理;对处理结果符合来源管理层置信区间的数据接入因子关系层;所述的因子关系层,根据影响企业识别权重的共有因子,对接入的数据进行权重比例分配以及相似度匹配,汇总的因子匹配数据为数据识别层提供计算依据;所述的数据识别层,对汇总的因子匹配数据进行加权计算出总分,得出企业识别结果。2.根据权利要求1所述的企业识别系统,其特征在于:所述的来源管理层提供CRUD访问接口,用于接入和配置企业数据;所述的因子关系层提供CRUD访问接口,用于查询和维护企业属性因子及其权重比例;所述的数据分离装置提供CRUD访问接口,用于接入和输出层级之间交互的企业数据。3.一种权利要求1或2所述的企业识别系统的实现方法,其特征在于:所述的方法包括来源管理层、因子关系层和数据识别层配置;所述来源管理层配置流程是:S11,新建自定义识别流程,生成唯一标识流程ID;S12,选择企业数据库内存在的企业表,并标记企业名称属性;S13,填写[0,100]区间范围内的任意区间作为来源管理层置信区间;S14,保存识别流程;S15,日志记录,完成;所述因子关系层的配置流程是:S21,选择已有的识别流程;S22,选择识别流程内企业表共有的企业属性;S23,对企业共有属性进行权重比例分配,分配比例值为[0,100]区间的任意值,默认值均为0;S24,填写[0,100]区间范围内的任意区间作为因子关系层置信区间;S25,保存识别流程;S26,日志记录,完成;所述数据识别层的配置流程是:S31,选择已有的识别流程;S32,选择数据识别的可接受范围:单笔识别或者多笔识别;S33,保存识别流程;S34,日志记录,完成。4.一种权利要求3所述的实现方法,其特征在于:所述的来源管理层识别流程具体是:第一步,根据识别流程配置的企业名称属性提取配置表的所有企业名称;第二步,对企业名称数据进行分词并提取高频词;第三步,对每笔带企业名称的数据生成唯一企业...
【专利技术属性】
技术研发人员:郑葵荣,季统凯,
申请(专利权)人:国云科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。