数据可信度评估方法、装置、设备和存储介质制造方法及图纸

技术编号：20589099 阅读：28 留言：0更新日期：2019-03-16 07:13

本发明专利技术实施例公开了一种数据可信度评估方法、装置、设备和存储介质。该方法包括：依据至少两个数据源中相同主体关联的属性值信息，确定各数据源中各主体关联的属性值的可信度；依据各数据源中各主体关联的属性值的可信度，确定各数据源的可信度；依据各数据源中各主体关联的属性值的可信度以及各数据源的可信度，确定至少两个数据源进行数据融合后，相同主体关联的属性值的可信度。本发明专利技术实施例通过数据间的关联关系，实现了多源数据融合过程中对相同主体关联的属性值的可信度进行有效评估，提高多源数据融合过程中数据冲突时对数据可信度判断的决策力和效率。

全部详细技术资料下载

【技术实现步骤摘要】
数据可信度评估方法、装置、设备和存储介质
本专利技术实施例涉及大数据融合
，尤其涉及一种数据可信度评估方法、装置、设备和存储介质。
技术介绍
随着信息技术的快速发展，大数据用以描述和定义信息爆炸时代产生的海量数据，例如企业在日常运营时各业务部门生成的数据，或者累积的用户网络行为数据等。因此通过大数据融合技术将多源数据进行有效的整合，能够提高大数据的分析和处理效率。鉴于数据在输入、变换等操作过程中由于人为或者设备的误差，可能导致描述同一主体的数据在不同的数据源中存在误差、缺失甚至是相互冲突的现象，进而导致在多源数据融合过程中，无法判断多样性数据的可信度，降低数据融合的效率和准确性。现有技术通常依据投票原则或者取均值原则，来确定相互冲突的多源数据。然而，现有技术无法有效地确定多源数据中各数据的可信度，只是综合考虑各数据的存在性，宏观上确定数据的相对取值，降低了数据融合的准确度，数据的可靠性较低。
技术实现思路
本专利技术实施例提供了一种数据可信度评估方法、装置、设备和存储介质，能够确定多数据源中每个主体关联的属性值的可信度，提高数据可信度评估的准确性，为数据融合提供依据。第一方面，本专利技术实施例提供了一种数据可信度评估方法，包括：依据至少两个数据源中相同主体关联的属性值信息，确定各数据源中各主体关联的属性值的可信度；依据各数据源中各主体关联的属性值的可信度，确定各数据源的可信度；依据各数据源中各主体关联的属性值的可信度以及各数据源的可信度，确定至少两个数据源进行数据融合后，相同主体关联的属性值的可信度。第二方面，本专利技术实施例提供了一种数据可信度评估装置...

【技术保护点】
1.一种数据可信度评估方法，其特征在于，包括：依据至少两个数据源中相同主体关联的属性值信息，确定各数据源中各主体关联的属性值的可信度；依据各数据源中各主体关联的属性值的可信度，确定各数据源的可信度；依据各数据源中各主体关联的属性值的可信度以及各数据源的可信度，确定至少两个数据源进行数据融合后，相同主体关联的属性值的可信度。

【技术特征摘要】
1.一种数据可信度评估方法，其特征在于，包括：依据至少两个数据源中相同主体关联的属性值信息，确定各数据源中各主体关联的属性值的可信度；依据各数据源中各主体关联的属性值的可信度，确定各数据源的可信度；依据各数据源中各主体关联的属性值的可信度以及各数据源的可信度，确定至少两个数据源进行数据融合后，相同主体关联的属性值的可信度。2.根据权利要求1所述的方法，其特征在于，所述依据至少两个数据源中相同主体关联的属性值信息，确定各数据源中各主体关联的属性值的可信度，包括：依据属性值的生成时间，确定至少两个数据源中相同主体关联的相同属性值的出现次数，并依据各属性值的出现次数，确定各属性值的可信度；依据至少两个数据源中相同主体关联的相同属性值的生成时间、属性种类数量、或者相同属性最后一次出现的目标属性值，调整各数据源中各主体关联的属性值的可信度。3.根据权利要求2所述的方法，其特征在于，依据至少两个数据源中相同主体关联的相同属性值的生成时间，调整各数据源中各主体关联的属性值的可信度，包括：在至少两个数据源中，依据相同主体关联的相同属性值的生成时间，对于在预设时间阈值之内未再出现的属性值，则依据时间衰减系数，将该属性值的可信度进行衰减处理；对于可信度衰减的属性值，依据相同主体关联的相同属性值的生成时间，若在至少一个可信度高于预设的可信度判定阈值的数据源中再次出现，则将该属性值的可信度恢复为衰减前的可信度取值。4.根据权利要求2所述的方法，其特征在于，依据至少两个数据源中相同主体关联的属性种类数量，调整各数据源中各主体关联的属性值的可信度，包括：在至少一个可信度高于预设的可信度判定阈值的数据源中，若同一主体下有新种类的唯一值属性出现，则依据时间衰减系数，将至少两个数据源中的非唯一值属性的原属性值的可信度进行衰减处理；对所述时间衰减系数进行放大处理，依据放大后的时间衰减系数，将至少两个数据源中的除了新种类的唯一值属性以外的各唯一值属性的原属性值的可信度进行衰减处理。5.根据权利要求2所述的方法，其特征在于，依据至少两个数据源...

【专利技术属性】
技术研发人员：王梅，刘京武，万月亮，
申请(专利权)人：北京锐安科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人