衍生变量的生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36338091 阅读:13 留言:0更新日期:2023-01-14 17:50
本申请提出一种衍生变量的生成方法、装置、电子设备和存储介质,涉及数据处理技术领域。其中,衍生变量的生成方法包括:获取业务数据,对业务数据进行变量衍生处理,以生成候选衍生变量,对候选衍生变量进行筛选,并将筛选出的候选衍生变量确定为目标衍生变量。本申请通过对整个生命周期的衍生变量进行智能化管理,降低了耗时,减少了人工投入,提高了智能化程度。程度。程度。

【技术实现步骤摘要】
衍生变量的生成方法、装置、电子设备和存储介质


[0001]本申请涉及数据处理
,尤其涉及一种衍生变量的生成方法、装置、电子设备和存储介质。

技术介绍

[0002]目前主要利用原始的业务数据投入策略和研发资源,根据变量加工逻辑进行个性化的衍生变量生成。
[0003]但是对于不同的衍生变量,需要重新投入策略和研发资源进行开发,用户不能自定义变量加工逻辑来生成新的衍生变量,智能化程度较低,花费时间长,人工投入很大。

技术实现思路

[0004]本申请提出一种衍生变量的生成方法、装置、电子设备和存储介质。
[0005]本申请第一方面实施例提出了一种衍生变量的生成方法,包括:获取业务数据;对所述业务数据进行变量衍生处理,以生成候选衍生变量;对所述候选衍生变量进行筛选,并将筛选出的所述候选衍生变量确定为目标衍生变量。
[0006]本申请实施例的衍生变量的生成方法,获取业务数据,对业务数据进行变量衍生处理,以生成候选衍生变量,对候选衍生变量进行筛选,并将筛选出的候选衍生变量确定为目标衍生变量。本实施例中,通过对整个生命周期的衍生变量进行智能化管理,降低了耗时,减少了人工投入,提高了智能化程度。
[0007]本申请第二方面实施例提出一种衍生变量的生成装置,包括:获取模块,被配置为获取业务数据;生成模块,被配置为对所述候选衍生变量进行筛选,并将筛选出的所述候选衍生变量确定为目标衍生变量;确定模块,被配置为对所述候选衍生变量进行筛选,并将筛选出的所述候选衍生变量确定为目标衍生变量。r/>[0008][0009]本申请实施例的衍生变量的生成装置,
[0010]获取业务数据,对业务数据进行变量衍生处理,以生成候选衍生变量,对候选衍生变量进行筛选,并将筛选出的候选衍生变量确定为目标衍生变量。本实施例中,通过对整个生命周期的衍生变量进行智能化管理,降低了耗时,减少了人工投入,提高了智能化程度。
[0011][0012]本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述第一方面实施例所述的衍生变量的生成方法。
[0013]本申请第四方面实施例提出了一种存储有计算机指令的计算机可读存储介质,所述计算机指令用于使所述计算机执行如上述第一方面实施例所述的衍生变量的生成方法。
[0014]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变
得明显,或通过本申请的实践了解到。
附图说明
[0015]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0016]图1为本申请一实施例提供的衍生变量的生成方法的流程示意图;
[0017]图2为本申请另一实施例提供的衍生变量的生成方法的流程示意图;
[0018]图3为本申请另一实施例提供的衍生变量的生成方法的流程示意图;
[0019]图4为本申请另一实施例提供的衍生变量的生成方法中创建变量处理方法的流程示意图;
[0020]图5为本申请另一实施例提供的衍生变量的生成方法中修改方法库中现有变量处理方法的流程示意图;
[0021]图6为本申请另一实施例提供的衍生变量的生成方法的流程示意图;
[0022]图7为本申请另一实施例提供的衍生变量的生成方法的流程示意图;
[0023]图8为本申请一实施例提供的衍生变量的生成装置的结构示意图;
[0024]图9为本申请一实施例提供的电子设备的框图。
具体实施方式
[0025]下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0026]数据处理(Data Processing,简称DP)是对数据的采集、存储、检索、加工、变换和传输。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响了人类社会发展的进程。
[0027]在本申请的描述中,术语“征信报文”为原始的记载信用信息的征信报告内容,可以用来查询个人或企业的社会信用,一般主要指包括个人基本信息,信贷信息(是否有银行贷款、是否有逾期、信用卡透支记录等)、非银行信息(水、电、燃气等公用事业费用的缴费信息、欠税情况、民事判决等)在内的个人信用信息的报告。
[0028]在本申请的描述中,术语“变量”一般描述一个人(或更一般的实体)特征的变量,根据变量属性不同,可以抽象为“时间、空间、类别、数值、实体标识、关系”等6个类别。
[0029]在本申请的描述中,术语“衍生变量”指征信报文原始数据通过一系列加工处理生成的新变量,该衍生变量用于后续策略或者模型计算过程。
[0030]在本申请的描述中,术语“Xgboost”(eXtreme Gradient Boosting,可扩展的提升树系统)为进行模型训练的一个梯度提升框架。
[0031]在本申请的描述中,术语“XML”(Extensible Markup Language,可扩展标记语言) 是一种用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。
[0032]在本申请的描述中,术语“HTML”(Hyper Text Markup Language,超级文本标记语言)是一种标记语言。它包括一系列标签.通过这些标签可以将网络上的文档格式统一,使分散的互联网资源连接为一个逻辑整体。HTML文本是由HTML命令组成的描述性文本, HTML命令可以说明文字,图形、动画、声音、表格、链接等。通常我们所说的H5就是页面的一种表现形式,而HTML5是第五代HTML的标准,可以说,H5都是基于HTML5 实现的,包括目前我们看到的大部分网页,基本上所有H5都遵循HTML5这个规范。
[0033]在本申请的描述中,术语“JSON”(JavaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成,现已成为主流的数据格式。任何支持的类型都可以通过JSON来表示,例如字符串、数字、对象、数组等。
[0034]下面参考附图描述本申请实施例的衍生变量的生成方法、装置、电子设备和存储介质。
[0035]图1为本申请一实施例提供的衍生变量的生成方法的流程示意图。本申请实施例的衍生变量的生成方法,可由本申请实施例提供的衍生变量的生成本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种衍生变量的生成方法,其特征在于,包括:获取业务数据;对所述业务数据进行变量衍生处理,以生成候选衍生变量;对所述候选衍生变量进行筛选,并将筛选出的所述候选衍生变量确定为目标衍生变量。2.根据权利要求1所述的生成方法,其特征在于,所述对所述业务数据进行变量衍生处理,以生成候选衍生变量,包括:获取所述业务数据的提取路径,并根据所述提取路径从所述业务数据中获取原生变量;根据选择的变量处理方法,对所述原生变量进行衍生处理,以生成第一候选衍生变量。3.根据权利要求2所述的生成方法,其特征在于,所述对所述候选衍生变量进行筛选,并将筛选出的所述候选衍生变量确定为目标衍生变量,包括:对所述第一候选衍生变量进行验证,并将通过验证的所述第一候选衍生变量确定为第一目标衍生变量。4.根据权利要求3所述的生成方法,其特征在于,还包括:对验证未通过的所述第一候选衍生变量进行修改,并返回所述对所述第一候选衍生变量进行验证步骤。5.根据权利要求2所述的生成方法,其特征在于,所述根据选择的变量处理方法,对所述原生变量进行处理,以生成第一候选衍生变量之前,还包括:判断方法库中是否存在所述变量处理方法;若所述方法库中不存在所述变量处理方法,则创建所述变量处理方法,或者修改所述方法库中的现有变量处理方法以生成所述变量处理方法。6.根据权利要求5所述的生成方法,其特征在于,所述创建所述变量处理方法,包括:获取配置的所述变量处理方法的参数和处理流程;对所述参数和处理流程进行解析,以生成语言属性和参数列表;基于所述语言属性和参数列表对所述变量处理方法进行验证;将验证通过的所述变量处理方法添加至所述方法库中。7.根据权利要求6所述的生成方法,其特征在于,所述创建所述变量处理方法,还包括:对所述变量处理方法的验证未通过,则获取所述用户重新配置的所述变量处理方法的参数和处理流程。8.根据权利要求5所述的生成方法,其特征在于,所述修改所述方法库中的现有变量处理方法以生成所述变量处理方法,包括:显示所述现有变量处理方法的参数和处理流程;对所述参数和处理流程进行修改;对修改后的所述现有变量处理方法进行验证;对修改后的所述现有变量处理方法的验证通过,且存在使用过所述现有变量处理方法的所述第一目标衍生变量,则判断与所述现有变量处理方法关联的所述第一目标衍生变量的业务报告结果是否变化;若所述业务报告结果未变化,则将修改后的所述现有变量处理方法确定为所述变量处
理方法,并将所述变量处理方法添加至所述方法库中。9.根据权利要求8所述的生成方法,其特征在于,所述修改所述方法库中的现有变量处理方法以生成所述变量处理方法,还包括:对修改后的所述现有变量处理方法的验证未通过,则重新对所述参数和处理流程进行修改。10.根据权利要求8所述的生成方法,其特征在于,所述修改所述方法库中的现有变量处理方法以生成所述变量处理方法,还包括:若所述业务报告结果变化,则重新对所述参数和处理流程进行修改。11.根据权利要求1所述的生成方法,其特征在于,所述对所述业务数据进行变量衍生处理,以生成候选衍生变量,包括:获取变量衍生规则;从所述业务数据中提取原生变量;根据所述变量衍生规则,对所述原生变量进行衍生处理,以获取第二候选衍生变量。12.根据权利要求11所述的生成方法,其特征在于,所述对所述候选衍生变量进行筛选,并将筛选出的所述候选衍生变量确定为目标衍生变量,包括:对所述第二候选衍生变量进行评分;将评分超过评分阈值的所述第二候选衍生变量确定为第二目标衍生变量。13.根据权利要求12所述的生成方法,其特征在于,所述对所述第二候选衍生变量进行评分,包括:获取待训练的变量评分模型和基础衍生变量;基于所述基础衍生变量对所述待训练的变量评分模型进行训练,以得到目标变量评分模型;根据所述目标变量评分模型对所述第二候选衍生变量进行评分。14.一种衍生变量的生成装置,其特征在于,包括:获取模块,被配置为获取业务数据;生成模块,被配置为对所述候选衍生变量进行筛...

【专利技术属性】
技术研发人员:刘帅朝张德黄乐乐
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1