一种账户分类方法、装置及电子设备制造方法及图纸

技术编号:32232360 阅读:14 留言:0更新日期:2022-02-09 17:36
本申请提供一种账户分类方法,所述方法包括:获取多个账户各自的交易数据;其中,每个交易数据包括如下一项或多项:交易时间、交易金额、和交易地点。根据多个账户各自的交易数据,确定第一特征集合。对第一特征集合进行数据降维,获得降维后的第二特征集合。根据第二特征集合中的特征对多个账户进行聚类,获得各个账户对应的账户组。如此,可以提高账户分类结果的准确性,此外,还可提高账户分类的效率以及减少资源消耗。减少资源消耗。减少资源消耗。

【技术实现步骤摘要】
一种账户分类方法、装置及电子设备


[0001]本申请涉及数据处理领域,具体而言,涉及一种账户分类方法、装置及电子设备。

技术介绍

[0002]在金融交易场景中,资金流动过程中的安全合规监控或者异常识别排查具有非常重要的意义。一般来说,在对异常业务排查过程中,通常会对有关的业务进行分类,从而梳理出该异常资金流动过程中的特殊模式。目前,可以基于人为经验或可视化图谱排查存在异常业务的账户。具体地,基于人为经验的方式,可以根据作业人员的经验和人工对账户交易流水明细的观察与总结来区分账户。基于可视化图谱的方式,可以将账户间的交易流水数据以交易拓扑图的形式,形成可视化的交易网络图,从而区分账户。
[0003]然而,基于人为经验的方式,受到作业人员对相关业务的历史经验以及主观影响大,存在账户分类的效率和准确性低下的问题。基于可视化图谱的方式,在可视化图谱中呈现出来的节点多,重叠交叉的边多,仍然难以准确区分账户;此外,基于可视化图谱的方式中,处理交易流水数据的计算量大,消耗资源多。
[0004]综上可知,上述区分账户的方案,均存在准确性低下的问题,此外还难以兼顾分类的效率和资源消耗。

技术实现思路

[0005]为了克服现有技术中的上述不足,本申请的目的在于提供一种账户分类方法、装置及电子设备。
[0006]第一方面,提供一种账户分类方法。该账户分类方法包括:获取多个账户各自的交易数据;其中,每个所述交易数据包括如下一项或多项:交易时间、交易金额、或交易地点;
[0007]根据所述多个账户各自的交易数据,确定第一特征集合;
[0008]对所述第一特征集合进行数据降维,获得降维后的第二特征集合;
[0009]根据所述第二特征集合中的特征对所述多个账户进行聚类,获得各个所述账户对应的账户组。
[0010]一种可能的设计方案中,所述根据所述多个账户各自的交易数据,确定第一特征集合,包括:
[0011]对所述账户的交易数据进行数据清洗和数据合并,获得合并流水数据;
[0012]对每个所述合并流水数据进行特征提取,获得中间特征集合;所述中间特征集合包括与每个所述账户对应的特征;
[0013]对所述中间特征集合中每个特征进行标准化,得到所述第一特征集合。
[0014]可选地,所述第一特征集合包括多个维度的特征;所述对所述标准化后的特征集合中的特征进行降维操作,获得降维后的第二特征集合,包括:
[0015]根据所述多个维度的特征对所述第一特征集合进行降维,获得所述第二特征集合。
[0016]一种可能的设计方案中,所述方法还包括:
[0017]确定目标账户组;
[0018]获取所述目标账户组中每个账户的特征值;
[0019]根据所述目标账户组中每个账户的特征值,确定目标账户组的作用,以确定目标账户组中每个账户的作用。
[0020]一种可能的设计方案中,聚类的方法包括:K均值聚类法、均值漂移聚类法、或层次聚类法。
[0021]第二方面,提供一种账户分类装置,所述装置包括:
[0022]获取模块,用于获取多个账户各自的交易数据;其中,每个所述交易数据包括如下一项或多项:交易时间、交易金额、或交易地点;
[0023]确定模块,用于根据所述多个账户各自的交易数据,确定第一特征集合;
[0024]降维模块,用于对所述第一特征集合中的特征进行数据降维,获得降维后的第二特征集合;
[0025]聚类模块,用于根据所述第二特征集合对所述多个账户进行聚类,获得各个所述账户对应的账户组。
[0026]一种可能的设计方案中,所述确定模块,还用于对所述账户的交易数据进行数据清洗和数据合并,获得合并流水数据;
[0027]对每个所述合并流水数据进行特征提取,获得中间特征集合;所述中间特征集合包括与每个所述账户对应的特征;
[0028]对所述中间特征集合中每个特征进行标准化,得到所述第一特征集合。
[0029]可选地,所述第一特征集合包括多个维度的特征;所述降维模块,用于根据所述多个维度的特征对所述第一特征集合进行降维,获得所述第二特征集合。
[0030]一种可能的设计方案中,所述确定模块,还用于确定目标账户组;
[0031]所述获取模块,还用于获取所述目标账户组中每个账户的特征值;
[0032]所述确定模块,还用于根据所述目标账户组中每个账户的特征值,确定目标账户组的作用,以确定目标账户组中每个账户的作用。
[0033]一种可能的设计方案中,聚类的方法包括:K均值聚类法、均值漂移聚类法、或层次聚类法。
[0034]第三方面,提供一种电子设备,包括处理器及机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被所述处理器执行时,实现本申请提供的账户分类方法。
[0035]相对于现有技术而言,本申请具有以下有益效果:
[0036]本申请提供的账户分类方法、装置及电子设备,通过从多个账户各自的交易数据中提取特征,确定出第一特征集合,并对第一特征集合进行数据降维,获得第二特征集合,基于第二特征集合中的特征对多个账户进行聚类,以获得各个所述账户对应的账户组。如此,基于用户的特征确定用户的账户组,将金融交易中的原始底层流水记录,转化提炼为具有描述总结性质的量化特征,使得原本较为繁杂的交易流水数据呈现为结构化特征形式,充分挖掘交易明细数据的信息,提高原始流水数据的利用效率,提升分类准确性。
[0037]此外,在分类过程中,对特征进行降维,可以在保证原始数据分类和决策能力的前
提下,去掉数据中的冗余信息,减少在原有高维空间中的特征不相关属性,更有效地提取简洁而有效的信息,能够简化交易数据的复杂度,减小数据量,从而提高分类效率和减少资源消耗并提升后续的聚类效果。
附图说明
[0038]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0039]图1为本申请实施例提供的账户分类方法的步骤流程示意图;
[0040]图2为本申请实施例提供的电子设备的示意图;
[0041]图3为本申请实施例提供的账户分类装置的功能模块示意图。
具体实施方式
[0042]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以各种不同的配置来布置和设计。
[0043]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种账户分类方法,其特征在于,所述方法包括:获取多个账户各自的交易数据;其中,每个所述交易数据包括如下一项或多项:交易时间、交易金额、或交易地点;根据所述多个账户各自的交易数据,确定第一特征集合;对所述第一特征集合进行数据降维,获得降维后的第二特征集合;根据所述第二特征集合中的特征对所述多个账户进行聚类,获得各个所述账户对应的账户组。2.根据权利要求1所述的账户分类方法,其特征在于,所述根据所述多个账户各自的交易数据,确定第一特征集合,包括:对每个所述账户的交易数据进行数据清洗和数据合并,获得合并流水数据;对所述合并流水数据进行特征提取,获得中间特征集合;所述中间特征集合包括与每个所述账户对应的特征;对所述中间特征集合中每个特征进行标准化,得到所述第一特征集合。3.根据权利要求2所述的账户分类方法,其特征在于,所述第一特征集合包括多个维度的特征;所述对所述第一特征集合进行数据降维,获得降维后的第二特征集合,包括:根据所述多个维度的特征对所述第一特征集合进行降维,获得所述第二特征集合。4.根据权利要求1

3中任一项所述的账户分类方法,其特征在于,所述方法还包括:确定目标账户组;获取所述目标账户组中每个账户的特征值;根据所述目标账户组中每个账户的特征值,确定所述目标账户组的作用,以确定所述目标账户组中每个账户的作用。5.根据权利要求1

3中任一项所述的方法,其特征在于,聚类的方法包括:K均值聚类法、均值漂移聚类法、或层次聚类法。6.一种账户分类装置,其特征在于,所述装置包括:获取模...

【专利技术属性】
技术研发人员:顾凌云谢旻旗辛颖张涛潘峻
申请(专利权)人:上海冰鉴信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1