【技术实现步骤摘要】
【国外来华专利技术】用于交易数据处理的机器学习系统的训练
[0001]本专利技术涉及将机器学习系统应用于交易数据的系统和方法。某些示例涉及一种用于实时交易处理的机器学习系统。某些示例涉及一种训练机器学习系统以用于实时交易处理的方法。
技术介绍
[0002]数字支付在过去二十年中呈爆炸式增长,全球超过四分之三的支付使用了某种形式的支付卡或电子钱包。销售点系统正逐渐摆脱现金而变得数字化。简而言之,全球商业系统现在严重依赖于电子数据处理平台。这样一来,带来了许多工程方面的挑战,而这些挑战主要对非专业用户而言是隐藏的。例如,数字交易需要实时完成,实时意味着在购买点计算机设备所经历的延迟程度最小。数字交易还需要保证安全并抵御攻击和情报窃取。数字交易的处理也受到全球电子支付系统历史性发展的制约。例如,许多基础设施仍然是围绕为50多年前使用的大型主机架构设计的模型配置的。
[0003]随着数字交易的增加,新的安全风险也变得明显。数字交易为欺诈和恶意行为提供了新的温床。2015年,据估计,7%的数字交易是欺诈性的,并且随着更多在线经济活动的转型,这一数 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种训练监督机器学习系统以检测交易数据中的异常的方法,所述方法包括:获取数据样本的训练集,每个数据样本至少部分地衍生自交易数据,并与一组唯一可识别实体中的一个实体相关联,其中,所述训练集的至少一部分是未标记的;将指示不存在异常的标签分配给所述训练集中的未标记数据样本;将所述训练集中的数据样本的数据划分为两个特征集:表示可观察特征的第一特征集和表示上下文特征的第二特征集,所述可观察特征衍生自当前交易的至少交易数据的函数,所述上下文特征衍生自历史交易数据的一个或多个函数,所述历史交易数据排除所述当前交易和检索到的与所述当前交易的唯一可识别实体相关的数据;通过将来自分别与所述一组唯一可识别实体中的两个不同实体相关的所述两个特征集的特征组合,来生成合成数据样本;为所述合成数据样本分配指示存在异常的标签;用所述合成数据样本增强所述训练集;以及利用增强的训练集和分配的标签训练监督机器学习系统,其中,所述经过训练的监督机器学习系统被配置为在为之提供新数据样本时输出指示存在异常的值。2.根据权利要求1所述的方法,其中,所述可观察特征衍生自所述当前交易的预定义时间窗口内的交易数据的函数,并且其中,所述上下文特征衍生自所述预定义时间窗口外的交易数据。3.根据权利要求2所述的方法,其中,所述可观察特征中的一个或多个包括从预定义时间段内的交易数据计算的聚合度量,所述预定义时间段是相对于所述当前交易的时间定义的。4.根据权利要求3所述的方法,其中,对于给定的数据样本,获取数据样本的训练集包括:获取当前交易的交易数据,所述交易数据包括唯一可识别实体的标识符;以及获取所述唯一可识别实体的查找数据;其中,所获取的交易数据用于导出所述第一特征集,所获取的查找数据用于导出所述第二特征集。5.根据权利要求4所述的方法,其中,对于所述给定的数据样本,获取数据样本的训练集还包括:获取所述时间窗口的所述唯一可识别实体的交易数据;以及从所述交易数据计算一个或多个聚合度量;其中,所述一个或多个聚合度量用于导出所述第一特征集。6.根据权利要求4或5所述的方法,其中,对于所述给定的数据样本,获取数据样本的训练集还包括:获取所述唯一可识别实体的历史交易数据,所述历史交易数据包括所述时间窗口外的交易数据;以及从所述历史交易数据计算一个或多个聚合度量;其中,所述一个或多个聚合度量用于导出所述第二特征集。7.根据前述权利要求中任一项所述的方法,其中,所述第二特征集包括与相应的唯一
可识别实体...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。