一种数据的衍生方法、装置及设备制造方法及图纸

技术编号:19636124 阅读:20 留言:0更新日期:2018-12-01 16:42
本说明书实施例公开了一种数据的衍生方法、装置及设备,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格,然后,可以根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息,根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标,最终,可以通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。

A Data Derivation Method, Device and Equipment

The embodiment of this specification discloses a data derivation method, device and device, which includes: gridding the target data, generating one or more grids covering the target data, and then generating dimension information according to the information contained in each grid, including a single dimension information. Dimensional information and multi-dimensional information, according to the dimension information, as well as the time period and event type contained in each grid, determine the basic indicators corresponding to the target data. Finally, the basic indicators can be derived by the index derivation algorithm, and the corresponding derivative indicators of the target data can be obtained.

【技术实现步骤摘要】
一种数据的衍生方法、装置及设备
本说明书涉及计算机
,尤其涉及一种数据的衍生方法、装置及设备。
技术介绍
随着网络技和终端技术的日益普遍,网络交易中存在的风险也越来越多,尽管网路交易等业务系统中存在风险防控规则,但是,网络交易风险并没有因此而降低,业务系统中的风险防控仍然面临巨大的挑战,而如何得到更加准确的风险防控规则成为继续解决的重要问题。风险防控规则的确定主要依赖于生成上述风险防控规则所使用的训练数据或特征,这些特征可以称为指标。不同场景下,数据对应的指标的选取存在一定的差异,例如,在本国的国内交易中,需要选择案件率作为一项指标,而在国际交易中,通常会选择拒绝率或者失败率作为一项指标等,而且,当前上述主要采用比例变量的形式,然而,通过比例变量的形式确定的指标主要依赖技术人员的经验而得到,因此,数据对应的指标的选取具有较大的局限性,进而使得风险防控规则的生成的准确性较差,这样就需要提供一种更快捷获取数据对应的指标,并获取更多指标的方案。
技术实现思路
本说明书实施例的目的是提供一种数据的衍生方法、装置及设备,以提供一种更快捷获取数据对应的指标,并获取更多指标的方案。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种数据的衍生方法,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。可选地,所述指标衍生算法包括遗传算法、随机游走算法和暴力衍生算法。可选地,所述通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标,包括:判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件;如果不满足,则对所述基础指标进行至少一次的衍生处理,并在每次执行衍生处理后判断所述衍生处理得到的指标是否满足所述第一选取条件,直至判断出所述衍生处理得到的指标满足所述第一选取条件或执行的所述衍生处理的次数达到预定次数阈值;将最后一次衍生处理得到的指标确定为所述目标数据对应的衍生指标。可选地,所述判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件,包括:对所述基础指标进行编码处理,得到基础数据;对所述基础数据进行适应度计算,得到第一数据;判断所述第一数据是否满足所述第一选取条件;如果所述第一数据满足所述第一选取条件,则所述基础指标满足所述第一选取条件;如果所述第一数据不满足所述第一选取条件,则所述基础指标不满足所述第一选取条件;所述对所述基础指标进行衍生处理,包括:对所述基础指标对应的所述基础数据进行交叉处理和/或变异处理。可选地,所述适应度由多个预定指标进行聚合后得到。可选地,所述多个预定指标包括感受性ROC曲线下的面积AUC、信息量IV和嵌入层Embedding中的至少两个。可选地,所述事件类型包括支付类和操作类,所述支付类的事件包括交易事件、转账事件和扫码事件,所述操作类的事件包括登录事件、修改密码事件、注册事件和浏览事件。可选地,所述对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格,包括:以随机划分的方式,对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格。本说明书实施例提供的一种数据的衍生装置,所述装置包括:网格化模块,用于对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;维度生成模块,用于根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;基础指标确定模块,用于根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;指标衍生模块,用于通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。可选地,所述指标衍生算法包括遗传算法、随机游走算法和暴力衍生算法。可选地,所述指标衍生模块,包括:判断单元,用于判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件;指标衍生单元,用于如果不满足,则对所述基础指标进行至少一次的衍生处理,并在每次执行衍生处理后判断所述衍生处理得到的指标是否满足所述第一选取条件,直至判断出所述衍生处理得到的指标满足所述第一选取条件或执行的所述衍生处理的次数达到预定次数阈值;将最后一次衍生处理得到的指标确定为所述目标数据对应的衍生指标。可选地,所述判断单元,用于:对所述基础指标进行编码处理,得到基础数据;对所述基础数据进行适应度计算,得到第一数据;判断所述第一数据是否满足所述第一选取条件;如果所述第一数据满足所述第一选取条件,则所述基础指标满足所述第一选取条件;如果所述第一数据不满足所述第一选取条件,则所述基础指标不满足所述第一选取条件;所述指标衍生单元,用于对所述基础指标对应的所述基础数据进行交叉处理和/或变异处理。可选地,所述适应度由多个预定指标进行聚合后得到。可选地,所述多个预定指标包括感受性ROC曲线下的面积AUC、信息量IV和嵌入层Embedding中的至少两个。可选地,所述事件类型包括支付类和操作类,所述支付类的事件包括交易事件、转账事件和扫码事件,所述操作类的事件包括登录事件、修改密码事件、注册事件和浏览事件。可选地,所述网格化模块,用于以随机划分的方式,对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格。本说明书实施例提供的一种数据的衍生设备,所述数据的衍生设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。由以上本说明书实施例提供的技术方案可见,本说明书实施例通过对目标数据进行网格化处理,生成覆盖目标数据的一个或多个网格,然后,可以根据每个网格中包含的信息生成单维度信息和多维度信息,可以分别根据单维度信息和多维度信息,以及每个网格中包含的时间段和事件类型,确定目标数据对应的基础指标,最终,可以通过指标衍生算法对基础指标进行衍生处理,得到目标数据对应的衍生指标,这样,通过离散的目标数据自动划分网格,并将得到的网格列出,同时,根据网格生成单维度信息以及多维度信息,进而构建基础指标,由于基础指标中不仅通过单维度信息确定,还可以通过多维度信息确定,从而使得基础指标包含的内容更加广泛,为后续处理提供数据基础,另外,借助指标衍生算法实现对基础指标中元素的聚合,进而生成目标数据对应的衍生指标,可以使得目标数据对应的指标得到一定的扩充,进而该指标对应的特征也会更加精细和全面,从而提高后续处理的准确性,例如,可以使得得到的风险防控规则更加准确等。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图本文档来自技高网...

【技术保护点】
1.一种数据的衍生方法,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。

【技术特征摘要】
1.一种数据的衍生方法,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。2.根据权利要求1所述的方法,所述指标衍生算法包括遗传算法、随机游走算法和暴力衍生算法。3.根据权利要求2所述的方法,所述通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标,包括:判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件;如果不满足,则对所述基础指标进行至少一次的衍生处理,并在每次执行衍生处理后判断所述衍生处理得到的指标是否满足所述第一选取条件,直至判断出所述衍生处理得到的指标满足所述第一选取条件或执行的所述衍生处理的次数达到预定次数阈值;将最后一次衍生处理得到的指标确定为所述目标数据对应的衍生指标。4.根据权利要求3所述的方法,所述判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件,包括:对所述基础指标进行编码处理,得到基础数据;对所述基础数据进行适应度计算,得到第一数据;判断所述第一数据是否满足所述第一选取条件;如果所述第一数据满足所述第一选取条件,则所述基础指标满足所述第一选取条件;如果所述第一数据不满足所述第一选取条件,则所述基础指标不满足所述第一选取条件;所述对所述基础指标进行衍生处理,包括:对所述基础指标对应的所述基础数据进行交叉处理和/或变异处理。5.根据权利要求4所述的方法,所述适应度由多个预定指标进行聚合后得到。6.根据权利要求5所述的方法,所述多个预定指标包括感受性ROC曲线下的面积AUC、信息量IV和嵌入层Embedding中的至少两个。7.根据权利要求1所述的方法,所述事件类型包括支付类和操作类,所述支付类的事件包括交易事件、转账事件和扫码事件,所述操作类的事件包括登录事件、修改密码事件、注册事件和浏览事件。8.根据权利要求1所述的方法,所述对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格,包括:以随机划分的方式,对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格。9.一种数据的衍生装置,所述装置包括:网格化模块,用于对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;维度生成模块,用于根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维...

【专利技术属性】
技术研发人员:宋博文
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1