用数据来源的动态影响因子确定数据有效性的系统及方法技术方案

技术编号:16606120 阅读:34 留言:0更新日期:2017-11-22 16:06
本发明专利技术公开了一种用数据来源的动态影响因子确定数据有效性的系统:包括采集模块、预处理模块、选择模块、处理模块一、输入模块二和输出模块。方法为获取数据项多个来源的数据值;将该数据项每个数据值的来源的影响因子分别相加,得出数据项每个数据值的总影响因子;取数据项每个数据值的总影响因子最大的值为有效值;有效值的每个数据值的来源的历史有效个数+1;数据项的历史有效值个数+1;更新数据项每个来源的影响因子为新影响因子,新影响因子等于数据项该来源的历史有效个数/数据项历史有效值个数;新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。保证企业信用评估数据的真实性以及全面性,提高评估结果的可信度。

System and method for determining data validity by using dynamic influence factor of data source

The present invention discloses a system for determining data validity by using dynamic influence factors of data sources, including acquisition module, pretreatment module, selection module, processing module, input module two and output module. Method for obtaining data from multiple sources of data values; the influential factors of the data item from each data value respectively added that the total effect of each data item data value factor; the total effect of each data item data value factor maximum valid value for each data source; the effective value of the value of the history of effective number +1; data item history effective value number +1; impact factor to update the data items of each source for the new impact factor, impact factor is equal to the new data source of the history of a number of effective data items / the number of effective history; determine the validity of the data items of each data source of new data values when the arrival of the new impact factor. To ensure the authenticity and comprehensiveness of enterprise credit evaluation data, and to improve the credibility of the evaluation results.

【技术实现步骤摘要】
用数据来源的动态影响因子确定数据有效性的系统及方法
本专利技术涉及企业征信
,尤其涉及一种用数据来源的动态影响因子确定数据有效性的系统及方法。
技术介绍
随着社会的发展进步,企业信用与企业经济利益的相互关联度越来越密切。企业信用可以由征信机构通过企业信用评估手段得出,即提供信用信息服务的企业,按一定规则合法采集企业、个人的信用信息后,加工整理形成企业、个人的信用报告等征信产品。有偿提供给经济活动中的贷款方、赊销方、招标方、出租方、保险方等有合法需求的信用使用者,为其了解交易对方的信用状况提供便利。征信服务既可为防范信用风险,保障交易安全创造条件,又可使具有良好信用记录的企业和个人得以较低的交易成本获得较多的交易机会,而缺乏良好信用记录的企业或个人则相反,从而促进形成"诚信受益,失信惩戒"的社会环境。征信业在促进信用经济发展和社会信用体系建设中发挥着重要的基础性作用。目前大多数的征信机构,用来评估企业信用的数据没有可信性,信用信息的可信性在一定程度可以由企业信用信息的来源决定,企业信用信息的来源有很多,例如,基于交易平台的数据,基于社交数据、基于互联网公开数据等。企业信用信息的真实性以及全面性,对企业信用的评估结果有很大的影响,但是,通过上述途径获取的企业信用信息的真实性及全面性没有保证,从而不能对企业进行全面可信的评价,如何保证企业信用评估数据的真实性以及全面性,从而提高企业信用评估结果的可信度,是本领域亟待解决的问题。
技术实现思路
为解决现在技术存在的问题,本专利技术提供一种用数据来源的动态影响因子确定数据有效性的方法。为实现上述目的,本专利技术采用的技术方案是:一种用数据来源的动态影响因子确定数据有效性的方法,包括:Step1:获取数据项多个来源的数据值;Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;Step3:取该数据项每个数据值的总影响因子最大的值为有效值;Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;Step5:更新该数据项每个来源的影响因子为新影响因子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。一种用数据来源的动态影响因子确定数据有效性的系统,包括:数据采集模块:获取数据项多个来源的数据值;数据预处理模块:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;数据选择模块:取该数据项每个数据值的总影响因子最大的值为有效值;数据处理模块一:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;数据输入模块二:嵌套在数据处理模块一内,更新该数据项每个来源的影响因子为新影响影子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;数据输出模块:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性后输出结论。采用本专利技术的技术方案后,1、改变了现有技术采用的静态确定单一来源法,即对每一个企业信用信息项,通过影响因子的动态变化来指定一个可信来源,该项的所有数据均只以该来源的数据为准,其余来源的该数据项数据不在丢弃,而当成基数作为判定总影响因子最大的值为有效值的条件。2、现有技术中对每一个企业信用信息项,单纯地指定一个来源优先级列表,依次按照优先级顺序选择来源,如果高优先级来源为空,则选择次优先级来源的数据,其余来源数据丢弃。本方案改变了上述模式,将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;取该数据项每个数据值的总影响因子最大的值为有效值;该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;所有的数据作为一个整体来分析和判断最终数据项的影响因子,来决定该数据的有效性。影响因子自动适应每个数据项各来源质量的动态变化,保障最终数据的有效性,无需人工干预。附图说明图1是利用数据来源的动态影响因子确定数据有效性的方法的流程框图。具体实施方式下面结合附图对本专利技术优选的技术方案做进一步的阐述:如图1所示,一种用数据来源的动态影响因子确定数据有效性的方法,包括:Step1:获取数据项多个来源的数据值;其中数据项的获取包括:网络爬虫实时采集、政府各数据单位的专线实时对接、第三方数据交易平台定期批量提供、人工收集整理录入。数据项包括:企业的工商注册信息;企业的法人、高管信息;企业的行政审批、处罚信息;企业的税务信息;企业的金融借贷信息;企业的知识产权信息;企业的供应商、客户信息。数据项主要来源为:政府各主管部门:工商、税务、海关等;银行机构:中国人民银行、中国工商银行、中国农业银行、中国建设银行、中国银行;类金融机构:担保、小贷;第三方数据交易平台:如贵阳大数据交易中心;人工实地调查采集。Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以确定以哪个版本为准。一个数据项多个数据值,有些数据值来自于一个来源,有些数据值来自于两个或多个来源;每个数据值各自来源的影响因子相加得出该数据值的总影响因子。Step3:取该数据项每个数据值的总影响因子最大的值为有效值;Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;具体为设定各个来源的该数据项的影响因子的初始值,经过Step3的不断自动优化调整,总影响因子最大的值即确定为最终有效值。Step5:更新该数据项每个来源的影响因子为新影响影子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。一种用数据来源的动态影响因子确定数据有效性的系统,包括:数据采集模块:获取数据项多个来源的数据值;数据预处理模块:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;数据选择模块:取该数据项每个数据值的总影响因子最大的值为有效值;数据处理模块一:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;数据输入模块二:嵌套在数据处理模块一内,更新该数据项每个来源的影响因子为新影响影子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;数据输出模块:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性后输出结论。其中,影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以确定以哪个版本为准。一个数据项多个数据值,有些数据值来自于一个来源,有些数据值来自于两个或多个来源;每个数据值各自来源的影响因子相加得出该数据值的总影响因子。以上实施方式只为说明本专利技术的技术构思及特点,其目的在于让熟悉此项技术的人了解本专利技术的内容并加以实施,并不能以此限制本专利技术的保护范围,凡根据本专利技术精神实质所做的等效变化或修饰,都应涵盖在本专利技术的保护范围内。本文档来自技高网...
用数据来源的动态影响因子确定数据有效性的系统及方法

【技术保护点】
一种用数据来源的动态影响因子确定数据有效性的方法,其特征在于:包括:Step1:获取数据项多个来源的数据值;Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;Step3:取该数据项每个数据值的总影响因子最大的值为有效值;Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;Step5:更新该数据项每个来源的影响因子为新影响因子,;新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。

【技术特征摘要】
1.一种用数据来源的动态影响因子确定数据有效性的方法,其特征在于:包括:Step1:获取数据项多个来源的数据值;Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;Step3:取该数据项每个数据值的总影响因子最大的值为有效值;Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;Step5:更新该数据项每个来源的影响因子为新影响因子,;新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。2.根据权利要求1所述的利用数据来源的动态影响因子确定数据有效性的方法,其特征在于:数据项的获取包括:网络爬虫实时采集、政府各数据单位的专线实时对接、第三方数据交易平台定期批量提供、人工收集整理录入。3.根据权利要求1所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:数据项包括:企业的工商注册信息;企业的法人、高管信息;企业的行政审批、处罚信息;企业的税务信息;企业的金融借贷信息;企业的知识产权信息;企业的供应商、客户信息。4.根据权利要求3所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:数据项主要来源为:政府各主管部门:工商、税务、海关等;银行机构:中国人民银行、中国工商银行、中国农业银行、中国建设银行、中国银行;类金融机构:担保、小贷;第三方数据交易平台:贵阳大数据交易中心;人工实地调查采集。5.根据权利要求1所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以...

【专利技术属性】
技术研发人员:宋朝钦王安静
申请(专利权)人:无锡企业征信有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1