信息归并方法、交易查询方法、装置、计算机及存储介质制造方法及图纸

技术编号:25637078 阅读:14 留言:0更新日期:2020-09-15 21:29
本发明专利技术实施例公开了信息归并方法、交易查询方法、装置、计算机及存储介质。其中信息归并方法包括基于至少两个数据源获取待处理数据,提取待处理数据中的特征信息和特征关联信息;根据提取的特征信息和特征关联信息生成信息关联图;对信息关联图进行联通子图划分,生成至少一个联通子图,根据至少一个联通子图对待处理数据进行信息归并。通过将待处理数据中的特征信息通过关联关系形成信息关联图,并基于信息关联图中特征节点的联通性对信息关联图进行划分,得到多个彼此独立的联通子图,基于联通子图将特征信息进行归并,通过图形方式简化了信息归并,方便直观,解决了数据库中海量数据无法清晰判断数据关联关系的问题,提高了图像归并效率。

【技术实现步骤摘要】
信息归并方法、交易查询方法、装置、计算机及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种信息归并方法、交易查询方法、装置、计算机及存储介质。
技术介绍
随着互联网技术的不断发展以及电商平台的兴起,在电商平台上的团伙欺诈越来越多,黑产规模也越来越大。在电商平台上,同一用户具有多个账号的现象十分常见,一种情况是用户的正常网络活动,通过多个账号满足用户的活动需求;另一种情况是不法分子通过大量站好进行非法牟利,例如刷单、黑产或者洗钱等。为了提高电商平台的安全性判断多个交易个体是否为同一用户、多个欺诈行为是否为同一用户操作以及多个账号是否属于同一欺诈团体,在风控反欺诈中越来越重要。针对上述问题,目前常采用如下方式进行判断,其一,基于业务数据,根据固定的判断规则进行匹配,根据匹配结果判断不同账号是否属于同一用户,例如可以是将身份证号和注册手机号相同的账号确定为同一用户的账号;其二,基于用户的基本数据,确定账号对应的特征向量,通过无监督聚类方式,对账号的特征向量进行聚类,将聚类得到的账号确定为相似账号。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在以下技术问题:对于第一种判断方式,存在数据缺失导致无法判断的问题,例如在申请账号时,身份证信息不属于必填字段,存在大量账号的身份证字段缺失。进一步的,黑产用户通过实名认证时使用的身份证、手机号、银行卡等大部分由黑市购买得到,无法保证信息的准确性。对于第二种判断方式,通过无监督聚类算法,可以是将用户信息归并到一个特定的群组,但是如果存在较大的群组(包含大量账号)时,对于非数值型的属性,无法量化两个账号之间的形似程度,有效判断的准确性差。
技术实现思路
本专利技术提供信息归并方法、交易查询方法、装置、计算机及存储介质,以提高信息归并的准确性。第一方面,本专利技术实施例提供了一种信息归并方法,包括:基于至少两个数据源获取待处理数据,提取所述待处理数据中的特征信息和特征关联信息;根据提取的所述特征信息和所述特征关联信息生成信息关联图;对所述信息关联图进行联通子图划分,生成至少一个联通子图,根据所述至少一个联通子图对所述待处理数据进行信息归并。第二方面,本专利技术实施例还提供了一种交易查询方法,包括:获取已知风险用户信息,根据所述风险用户信息在至少一个联通子图中进行匹配,确定与所述已知风险用户信息相匹配的目标联通子图,其中,所述至少一个联通子图为根据本申请任意实施例提供的信息归并方法确定的;提取所述目标联通子图中关联用户信息;确定所述关联用户信息的当前交易,将所述关联用户信息的当前交易确定为风险交易。第三方面,本专利技术实施例还提供了一种信息归并装置,包括:信息提取模块,用于基于至少两个数据源获取待处理数据,提取所述待处理数据中的特征信息和特征关联信息;信息关联图生成模块,用于根据提取的所述特征信息和所述特征关联信息生成信息关联图;信息归并模块,用于对所述信息关联图进行联通子图划分,生成至少一个联通子图,根据所述至少一个联通子图对所述待处理数据进行信息归并。第四方面,本专利技术实施例还提供了一种交易查询装置,其特征在于,包括:第一目标联通子图确定模块,用于获取已知风险用户信息,根据所述风险用户信息在至少一个联通子图中进行匹配,确定与所述已知风险用户信息相匹配的目标联通子图,其中,所述至少一个联通子图为根据本申请任意实施例提供的信息归并方法确定的;关联用户信息确定模块,用于提取所述目标联通子图中关联用户信息;风险交易确定模块,用于确定所述关联用户信息的当前交易,将所述关联用户信息的当前交易确定为风险交易。第五方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请任意实施例提供的信息归并方法。第六方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任意实施例提供的信息归并方法。第七方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请任意实施例提供的交易查询方法。第八方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任意实施例提供的交易查询方法。本专利技术实施例提供的技术方案,通过将待处理数据中的特征信息通过特征信息间的关联关系形成信息关联图,并基于信息关联图中特征节点的联通性对信息关联图进行划分,得到多个彼此独立的联通子图,基于联通子图将特征信息进行归并,通过图形方式简化了信息归并,方便直观,解决了数据库中海量数据无法清晰判断数据关联关系的问题,提高了图像归并效率。附图说明图1为本专利技术实施例一提供的一种信息归并方法的方法流程图;图2是本专利技术实施例一提供的一种信息关联图的示意图;图3是本专利技术实施例二提供的一种交易查询方法的方法流程图;图4是本专利技术实施例三提供的一种信息归并装置的结构示意图;图5是本专利技术实施例四提供的一种交易查询装置的结构示意图;图6为本专利技术实施例五提供的一种计算机设备的结构示意图;图7为本专利技术实施例七提供的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种信息归并方法的流程图,本实施例可适用于对大量数据进行信息归并的情况,该方法可以由本申请实施例提供的信息归并装置来执行,具体包括如下步骤:S110、基于至少两个数据源获取待处理数据,提取所述待处理数据中的特征信息和特征关联信息。其中,数据源用于提供不同的待处理数据,待处理数据可以是数据源传输的实时数据,还可以是数据源存储的预设时间段的待处理数据。根据待归并数据确定特征标识,根据特征标识在待处理数据中提取对应的特征信息,以及特征信息之间的关联关系。其中,特征标识可以是特征信息的名称或者用于表征特征信息的字符或者字符串等,该特征标识可以是预先确定的,还可以是根据待归并数据从待处理数据中筛选得到的。示例性的,以电商平台的数据源为例,若待归并的数据为账号,则确定特征标识可以是与账号相关的信息标识,例如账号名称、账号注册用户、账号注册手机号等。可选的,提取所述待处理数据中的节点信息和节点关联信息,包括:根据预设特征标识在所述待处理数据中进行匹配,确定所述预设特征标识对应的特征信息;遍历所述待处理数据,确定任意两个特征信息之间的关联关系。在本实施例中,预先设置特征标识,将预设特征标识在待处理数据中进行逐一匹配,得本文档来自技高网
...

【技术保护点】
1.一种信息归并方法,其特征在于,包括:/n基于至少两个数据源获取待处理数据,提取所述待处理数据中的特征信息和特征关联信息;/n根据提取的所述特征信息和所述特征关联信息生成信息关联图;/n对所述信息关联图进行联通子图划分,生成至少一个联通子图,根据所述至少一个联通子图对所述待处理数据进行信息归并。/n

【技术特征摘要】
1.一种信息归并方法,其特征在于,包括:
基于至少两个数据源获取待处理数据,提取所述待处理数据中的特征信息和特征关联信息;
根据提取的所述特征信息和所述特征关联信息生成信息关联图;
对所述信息关联图进行联通子图划分,生成至少一个联通子图,根据所述至少一个联通子图对所述待处理数据进行信息归并。


2.根据权利要求1所述的方法,其特征在于,提取所述待处理数据中的节点信息和节点关联信息,包括:
根据预设特征标识在所述待处理数据中进行匹配,确定所述预设特征标识对应的特征信息;
遍历所述待处理数据,确定任意两个特征信息之间的关联关系。


3.根据权利要求1所述的方法,其特征在于,根据提取的所述特征信息和所述特征关联信息生成信息关联图,包括:
根据所述特征信息设置特征节点;
根据所述特征关联信息将存在关联关系的两个特征节点间设置关联边,生成所述信息关联图。


4.根据权利要求3所述的方法,其特征在于,对所述信息关联图进行联通子图划分,生成至少一个联通子图,根据所述至少一个联通子图对所述待处理数据进行信息归并,包括:
遍历所述信息关联图中的特征节点,将基于关联边连接的特征节点划分至同一联通子图,其中,任意两个联通子图中的任意特征节点之间不存在关联边;
将所述同一联通子图中特征节点对应的特征信息归并为同一群组信息。


5.根据权利要求1所述的方法,其特征在于,在对所述信息关联图进行联通子图划分,生成至少一个联通子图之后,还包括:
若存在至少一个历史联通子图,则将生成的至少一个联通子图与所述至少一个历史联通子图进行合并,生成至少一个更新联通子图;
相应的,根据所述至少一个联通子图对所述待处理数据进行信息归并,包括:
根据所述至少一个更新联通子图对所述待处理数据进行信息归并。


6.根据权利要求1-5任一所述的方法,其特征在于,所述数据源包括电商平台的用户行为数据源,相应的,所述信息关联图为电商平台的用户信息关联图,所述联通子图为具有关联关系的用户信息集合。


7.一种交易查询方法,其特征在于,包括:
获取已知风险用户信息,根据所述风险用户信息在至少一个联通子图中进行匹配,确定与所述已知风险用户信息相匹配的目标联通子图,其中,所述至少一个联通子图为根据权利要求1-6任一所述信息归并方法确定的;
提取所述目标联通子图中关联用户信息;
确定所述关联用户信息的当前交易,将所述关联用户信息的当前交易确定为风险交易。<...

【专利技术属性】
技术研发人员:周石磊
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1