The embodiment of this specification discloses a data derivation method, device and device, which includes: gridding the target data, generating one or more grids covering the target data, and then generating dimension information according to the information contained in each grid, including a single dimension information. Dimensional information and multi-dimensional information, according to the dimension information, as well as the time period and event type contained in each grid, determine the basic indicators corresponding to the target data. Finally, the basic indicators can be derived by the index derivation algorithm, and the corresponding derivative indicators of the target data can be obtained.
【技术实现步骤摘要】
一种数据的衍生方法、装置及设备
本说明书涉及计算机
,尤其涉及一种数据的衍生方法、装置及设备。
技术介绍
随着网络技和终端技术的日益普遍,网络交易中存在的风险也越来越多,尽管网路交易等业务系统中存在风险防控规则,但是,网络交易风险并没有因此而降低,业务系统中的风险防控仍然面临巨大的挑战,而如何得到更加准确的风险防控规则成为继续解决的重要问题。风险防控规则的确定主要依赖于生成上述风险防控规则所使用的训练数据或特征,这些特征可以称为指标。不同场景下,数据对应的指标的选取存在一定的差异,例如,在本国的国内交易中,需要选择案件率作为一项指标,而在国际交易中,通常会选择拒绝率或者失败率作为一项指标等,而且,当前上述主要采用比例变量的形式,然而,通过比例变量的形式确定的指标主要依赖技术人员的经验而得到,因此,数据对应的指标的选取具有较大的局限性,进而使得风险防控规则的生成的准确性较差,这样就需要提供一种更快捷获取数据对应的指标,并获取更多指标的方案。
技术实现思路
本说明书实施例的目的是提供一种数据的衍生方法、装置及设备,以提供一种更快捷获取数据对应的指标,并获取更多指标的方案。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种数据的衍生方法,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据 ...
【技术保护点】
1.一种数据的衍生方法,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。
【技术特征摘要】
1.一种数据的衍生方法,所述方法包括:对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维度信息和多维度信息;根据所述维度信息,以及每个网格中包含的时间段和事件类型,确定所述目标数据对应的基础指标;通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标。2.根据权利要求1所述的方法,所述指标衍生算法包括遗传算法、随机游走算法和暴力衍生算法。3.根据权利要求2所述的方法,所述通过指标衍生算法对所述基础指标进行衍生处理,得到所述目标数据对应的衍生指标,包括:判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件;如果不满足,则对所述基础指标进行至少一次的衍生处理,并在每次执行衍生处理后判断所述衍生处理得到的指标是否满足所述第一选取条件,直至判断出所述衍生处理得到的指标满足所述第一选取条件或执行的所述衍生处理的次数达到预定次数阈值;将最后一次衍生处理得到的指标确定为所述目标数据对应的衍生指标。4.根据权利要求3所述的方法,所述判断所述基础指标是否满足所述指标衍生算法对应的第一选取条件,包括:对所述基础指标进行编码处理,得到基础数据;对所述基础数据进行适应度计算,得到第一数据;判断所述第一数据是否满足所述第一选取条件;如果所述第一数据满足所述第一选取条件,则所述基础指标满足所述第一选取条件;如果所述第一数据不满足所述第一选取条件,则所述基础指标不满足所述第一选取条件;所述对所述基础指标进行衍生处理,包括:对所述基础指标对应的所述基础数据进行交叉处理和/或变异处理。5.根据权利要求4所述的方法,所述适应度由多个预定指标进行聚合后得到。6.根据权利要求5所述的方法,所述多个预定指标包括感受性ROC曲线下的面积AUC、信息量IV和嵌入层Embedding中的至少两个。7.根据权利要求1所述的方法,所述事件类型包括支付类和操作类,所述支付类的事件包括交易事件、转账事件和扫码事件,所述操作类的事件包括登录事件、修改密码事件、注册事件和浏览事件。8.根据权利要求1所述的方法,所述对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格,包括:以随机划分的方式,对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格。9.一种数据的衍生装置,所述装置包括:网格化模块,用于对目标数据进行网格化处理,生成覆盖所述目标数据的一个或多个网格;维度生成模块,用于根据每个网格中包含的信息生成维度信息,所述维度信息中包括单维...
【专利技术属性】
技术研发人员:宋博文,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。