用于针对联盟共享的敏感数据的无监督抽象的系统和方法技术方案

技术编号:34076532 阅读:13 留言:0更新日期:2022-07-11 17:50
一种用于在数据处理系统中生成标准客户简档的抽象系统具有处理设备和存储器。该抽象系统可以通过网络从计算设备接收客户数据,对客户数据执行无监督学习以产生具有多个共同特征的多个客户簇,并且确定簇表示标准客户,并且基于所确定的标准客户存储多个标准客户简档,其中标准客户简档包括多个共同特征的多个数据分布。抽象系统还将标准客户简档和附加标准客户简档提供给认知系统,以用于生成合成交易数据。交易数据。交易数据。

【技术实现步骤摘要】
【国外来华专利技术】用于针对联盟共享的敏感数据的无监督抽象的系统和方法


[0001]本专利技术大致涉及实现交易数据模拟器的认知系统,并且更具体地涉及用于针对信息联盟共享的敏感数据的无监督抽象的系统和方法。

技术介绍

[0002]金融犯罪检测系统,例如金融犯罪警告洞悉连同IBM 可以利用认知分析来帮助银行检测洗钱和恐怖融资。认知分析将“正常”金融活动与“可疑”活动区分开,并且使用区分信息来建立银行的预测模型。需要大量真实金融客户数据来训练预测模型。
[0003]由于真实客户数据非常敏感,因此银行只能提供有限量的真实客户数据。然而,为了最佳地模拟欺诈情况并检测不同类型的金融犯罪,看上去逼真的更多模拟的客户数据,例如用于训练的交易数据,可以产生更好的预测模型。IBM和IBM Watson是国际商业机器公司的商标,在全世界的许多管辖区注册。因此,在本领域中需要解决上述问题。

技术实现思路

[0004]从第一方面来看,本专利技术提供了一种用于在数据处理系统中生成标准客户简档的计算机实现的方法,所述数据处理系统包括处理设备和存储器,所述存储器包括由所述处理设备执行的指令,所述方法包括:通过网络从多个计算设备接收客户数据,所述客户数据包括针对多个客户到多个实体的信息;由所述处理设备对所述客户数据执行无监督学习,以产生具有多个共同特征的多个客户簇;由所述处理设备确定簇表示标准客户,并且基于所确定的标准客户存储多个标准客户简档,其中所述标准客户简档包括针对所述多个共同特征的多个数据分布;以及将所述多个标准客户简档提供给所述多个计算设备中的每一个计算设备,以用于基于所述标准客户生成合成交易数据。
[0005]从另一方面来看,本专利技术提供了一种抽象系统,包括处理设备和存储器,该存储器包括由处理设备执行以用于在数据处理系统中生成标准客户简档的指令,该数据处理系统被配置为:通过网络从多个计算设备接收客户数据,所述客户数据包括针对多个客户到多个实体的信息;由所述处理设备对所述客户数据执行无监督学习,以产生具有多个共同特征的多个客户簇;由所述处理设备确定簇表示标准客户,并且基于所确定的标准客户存储多个标准客户简档,其中所述标准客户简档包括针对所述多个共同特征的多个数据分布;以及将所述多个标准客户简档提供给所述多个计算设备中的每一个计算设备,以用于基于所述标准客户生成合成交易数据。
[0006]从另一方面来看,本专利技术提供了一种用于在数据处理系统中生成标准客户简档的计算机程序产品,该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质可由处理电路读取并且存储由处理电路执行以执行用于执行本专利技术的步骤的方法的指令。
[0007]从另一方面来看,本专利技术提供了一种计算机程序,其被存储在计算机可读介质上并且可加载到数字计算机的内部存储器中,所述计算机程序包括软件代码部分,当所述程
序在计算机上运行时,用于执行本专利技术的步骤。
[0008]从另一方面来看,本专利技术提供了一种包括软件的计算机程序产品,当由处理器执行时,所述软件执行一种方法,所述方法包括:通过网络从多个计算设备接收客户数据,所述客户数据包括针对多个客户到多个实体的信息;由所述处理设备对所述客户数据执行无监督学习,以产生具有多个共同特征的多个客户簇;由所述处理设备确定簇表示标准客户,并且基于所确定的标准客户存储多个标准客户简档,其中所述标准客户简档包括针对所述多个共同特征的多个数据分布;以及将所述多个标准客户简档提供给所述多个计算设备中的每一个计算设备,以用于基于所述标准客户生成合成交易数据
[0009]根据一些实施例,本公开描述了一种用于在数据处理系统中生成标准客户简档的计算机实现的方法。该方法包括由处理设备执行步骤,包括:通过网络从多个计算设备接收客户数据,该客户数据包括多个客户到多个实体的信息,对该客户数据执行无监督学习以产生具有多个共同特征的多个客户簇,以及确定簇代表标准客户,并基于所确定的标准客户存储多个标准客户简档。标准客户简档包括多个共同特征的多个数据分布。该方法还包括将多个标准客户简档提供给多个计算设备中的每一个计算设备,以用于基于标准客户生成合成交易数据。
[0010]根据其它实施例,本公开描述了一种用于在数据处理系统中生成标准客户简档的抽象系统。该抽象系统可以包括处理设备和存储器。该抽象系统可以通过网络从多个计算设备接收客户数据,客户数据包括针对多个客户到多个实体的信息。抽象系统还可以对客户数据执行无监督学习以产生具有多个共同特征的多个客户簇,并且确定簇表示标准客户,并且基于所确定的标准客户存储多个标准客户简档,其中标准客户简档包括多个共同特征的多个数据分布。抽象系统还可以将多个标准客户简档提供给多个计算设备中的每一个计算设备,以用于基于标准客户生成合成交易数据。
[0011]根据另外的实施例,本公开描述了一种非暂时性计算机可读介质,其上存储有用于在数据处理系统中生成标准客户简档的指令,所述指令在由至少一个处理设备执行时执行与所公开的实施例一致的所公开的方法。
[0012]从以下参考附图进行的对说明性实施例的详细描述中,本公开的附加特征和优点将变得显而易见。
附图说明
[0013]当结合附图阅读时,从以下详细描述中可以最好地理解本专利技术的前述和其它方面。为了说明本专利技术,在附图中示出了目前优选的实施例,然而,应当理解,本专利技术不限于所公开的具体手段。附图中包括以下附图:
[0014]图1描绘了根据公开的实施例的在计算机网络中实现交易数据模拟器的认知系统的一个说明性实施例的框图;
[0015]图2描绘了根据公开的实施例的其中可以实现说明性实施例的方面的示例数据处理系统的框图;
[0016]图3描绘了根据公开的实施例的抽象系统的一个说明性实施例的示意图;
[0017]图4描绘了根据公开的实施例的从客户数据到标准客户的示例性流程;
[0018]图5描绘了根据公开的实施例的对数据进行抽象以生成标准客户的方法的一个说
明性实施例的流程图;
[0019]图6描绘了根据公开的实施例的由抽象系统产生的示例标准客户的示意图;
[0020]图7描绘了根据公开的实施例的交易数据模拟器的一个说明性实施例的示意图;
[0021]图8描绘了根据公开的实施例的模拟交易数据的方法的一个说明性实施例的流程图;以及
[0022]图9描绘了示出根据公开的实施例的多个合成交易数据条目的示意图。
具体实施方式
[0023]作为概述,认知系统是专用计算机系统,或计算机系统组,其配置有硬件和/或软件逻辑(与在其上执行软件的硬件逻辑组合)以仿效人类认知功能。这些认知系统将类人的特征应用于传达和操纵思想,当与数字计算的固有强度结合时,其可以以高准确度和大规模弹性解决问题。IBM是一个这样的认知系统的例子,其可以处理人类可读语言,并且以比人类快得多的速度和大得多的规模,以类人的精确度识别文本段之间的推断。通常,这样的认知系统能够执行以下功能;
[0024]导航人类语言和理解的复杂性...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在数据处理系统中生成标准客户简档的计算机实现的方法,所述数据处理系统包括处理设备和存储器,所述存储器包括由所述处理设备执行的指令,所述方法包括:通过网络从多个计算设备接收客户数据,所述客户数据包括针对多个客户到多个实体的信息;由所述处理设备对所述客户数据执行无监督学习,以产生具有多个共同特征的多个客户簇;由所述处理设备确定簇表示标准客户,并且基于所确定的标准客户存储多个标准客户简档,其中所述标准客户简档包括针对所述多个共同特征的多个数据分布;以及将所述多个标准客户简档提供给所述多个计算设备中的每一个计算设备,以用于基于所述标准客户来生成合成交易数据。2.根据权利要求1所述的方法,其中,针对所述多个客户的信息包括识别信息和交易信息。3.根据前述权利要求中任一项所述的方法,还包括:在执行无监督学习之前过滤所述客户数据。4.根据权利要求3所述的方法,其中,所述过滤包括RFM分析以对客户进行分组。5.根据前述权利要求中任一项所述的方法,其中,所述执行无监督学习包括基于共同的特征对客户进行聚类,并且重复无监督学习以基于所述多个共同特征形成客户的子簇。6.根据前述权利要求中任一项所述的方法,其中,确定子簇表示标准客户包括:应用一个或多个规则。7.根据权利要求6所述的方法,其中,所述一个或多个规则包括大小确定,所述大小确定指示在被确定为标准客户的子簇中的客户的最小或最大数量。8.一种抽象系统,包括处理设备和存储器,所述存储器包括由所述处理设备执行的用于在数据处理系统中生成标准客户简档的指令,所述数据处理系统被配置为:通过网络从多个计算设备接收客户数据,所述客户数据包括针对多个客户到多个实体的...

【专利技术属性】
技术研发人员:B
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1