【技术实现步骤摘要】
一种基于实体关系进行数据融合的方法及系统
本说明书实施例涉及计算机
,特别涉及一种基于实体关系进行数据融合的方法及系统。
技术介绍
企业关联关系是指基于数据源整合的与企业相关的信息。例如,企业与其有直接或间接关系的企业之间的关联信息、或者企业中自然人和自然人之间的关联关系。目前,企业关联关系可以被应用于各种行业,例如应用于金融行业,利用企业关联关系挖掘出与高金融风险企业关联的企业和自然人,识别其犯罪团伙。因此,为提升企业关联关系的丰富度和完整度,本说明书提出一种基于实体关系进行数据融合的方法及系统。
技术实现思路
本说明书实施例的一个方面提供一种基于实体关系进行数据融合的方法,所述方法包括:确定待融合实体的数据标识,得到待融合实体与所述数据标识的对应关系;所述待融合实体包括企业或自然人;获取待查询实体,基于所述待融合实体与所述数据标识的对应关系、以及所述待查询实体,确定所述待查询实体的关联信息;其中,所述确定待融合实体的数据标识包括:确定与所述待融合实体的相似性满足第一预设条件的相似实体,当所述相似实体具有数据标识时,将所述相似实体的数据标识作为所述待融合实体的数据标识。本说明书实施例的一个方面提供一种基于实体关系进行数据融合的系统,所述系统包括:数据标识确定模块,用于确定待融合实体的数据标识,得到待融合实体与所述数据标识的对应关系;所述待融合实体包括企业或自然人;查询模块,用于获取待查询实体,基于所述待融合实体与所述数据标识的对应关系、以及所述待查询实体,确定所述待查询实体 ...
【技术保护点】
1.一种基于实体关系进行数据融合的方法,包括:/n确定待融合实体的数据标识,得到待融合实体与所述数据标识的对应关系;所述待融合实体包括企业或自然人;/n获取待查询实体,基于所述待融合实体与所述数据标识的对应关系、以及所述待查询实体,确定所述待查询实体的关联信息;/n其中,所述确定待融合实体的数据标识包括:/n确定与所述待融合实体的相似性满足第一预设条件的相似实体,当所述相似实体具有数据标识时,将所述相似实体的数据标识作为所述待融合实体的数据标识。/n
【技术特征摘要】
1.一种基于实体关系进行数据融合的方法,包括:
确定待融合实体的数据标识,得到待融合实体与所述数据标识的对应关系;所述待融合实体包括企业或自然人;
获取待查询实体,基于所述待融合实体与所述数据标识的对应关系、以及所述待查询实体,确定所述待查询实体的关联信息;
其中,所述确定待融合实体的数据标识包括:
确定与所述待融合实体的相似性满足第一预设条件的相似实体,当所述相似实体具有数据标识时,将所述相似实体的数据标识作为所述待融合实体的数据标识。
2.如权利要求1所述的方法,所述确定待融合实体的数据标识包括:
获取所述待融合实体与第一实体之间的一层或多层关系中每一层的关系权重;所述第一实体与所述待融合实体之间相似度满足第二预设条件;所述关系权重代表所述关系的密切程度;
基于所述一层或多层关系中每一层的关系权重,确定所述待融合实体与所述第一实体之间的关系权重;
判断所述待融合实体与所述第一实体之间的关系权重是否大于阈值,是则将所述第一实体作为所述相似实体,并将所述第一实体的数据标识作为所述待融合实体的数据标识。
3.如权利要求1所述的方法,所述确定待融合实体的数据标识包括:
基于所述待融合实体和第一实体各自的地址信息,获取地址相似度;所述第一实体与所述待融合实体之间的相似度满足第二预设条件;
当所述地址相似度满足第三预设条件时,将所述第一实体作为所述相似实体,并将所述第一实体的数据标识作为所述待融合实体的数据标识;
所述地址相似度根据以下方式的一种或多种获取:
根据所述地址信息的位置坐标间的距离获取;
根据所述地址信息中的地址文本的相似度获取。
4.如权利要求1所述的方法,所述确定待融合实体的数据标识包括:
基于判别模型确定是否以第一实体的数据标识作为所述待融合实体的数据标识;所述第一实体与所述待融合实体之间的相似度满足第二预设条件;其中,所述判别模型的输入包括:所述待融合实体和所述第一实体的至少一个相关特征。
5.如权利要求4所述的方法,所述至少一个相关特征包括:与所述待融合实体存在一层或多层关系的关联实体、与所述第一实体存在一层或多层关系的关联实体、所述一层或多层关系中每一层的关系权重、所述待融合实体的相关信息、所述第一实体的相关信息;其中,所述关系权重代表所述关系的密切程度。
6.一种基于实体关系进行数据融合的系统,包括:
数据标识确定模块,用于确定待融合实体的数据标识,得到待融合实体...
【专利技术属性】
技术研发人员:刘小刚,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。