【技术实现步骤摘要】
一种特征衍生方法、装置及电子设备
本申请涉及计算机
,尤其涉及一种特征衍生方法、装置及电子设备。
技术介绍
随着人工智能技术的发展,依据现有数据中的特征进行机器学习建立相关模型已非常常见。例如,在第三方支付平台或网络购物平台的风险防控领域,常依据现有的包含风险特征(例如,交易事件数据中的交易金额、交易频率等特征)的数据进行机器学习得到风控模型。针对各种风控模型,不法分子会不断的改进作案手段以避开风险防控,使得风险形式不断发生变化,例如,非法组织者往往会根据第三方支付平台的风控模型不停地尝试新的手段绕过监管。这就需要不断地对风控模型进行改进,以对未来可能出现的新风险做出有效的防控。然而,现有数据中的风险特征无法代表未来的情况,未来的包含新风险特征的数据还没有产生,因此,需要对现有数据中的风险特征进行学习,衍生得到能够反映未来风险的新风险特征,以对风控模型进行改进。其中,对现有特征进行学习衍生得到新特征的过程叫特征衍生。目前,要么依据人工经验进行特征衍生,要么利用穷举的方式进行特征衍生。前者依赖于领域内的专家经验,耗时长、衍生过程慢;后者需要花费大量的计算资源进 ...
【技术保护点】
1.一种特征衍生方法,所述方法包括:基于原始数据确定初始特征,所述初始特征为包含多个参数的累积型变量,所述原始数据中包含用于累积确定所述多个参数的值的事件明细数据;对所述初始特征的多个参数中的至少一个参数进行变换处理,衍生得到备选特征;将所述备选特征的元特征输入特征评分模型,得到所述备选特征的评分,所述特征评分模型是基于包含多个备选特征的元特征的样本数据和样本数据对应的第一标签训练得到的,第一标签为备选特征的评分;如果所述备选特征的评分大于或等于第一预设值,则将所述备选特征确定为衍生出的目标特征。
【技术特征摘要】
1.一种特征衍生方法,所述方法包括:基于原始数据确定初始特征,所述初始特征为包含多个参数的累积型变量,所述原始数据中包含用于累积确定所述多个参数的值的事件明细数据;对所述初始特征的多个参数中的至少一个参数进行变换处理,衍生得到备选特征;将所述备选特征的元特征输入特征评分模型,得到所述备选特征的评分,所述特征评分模型是基于包含多个备选特征的元特征的样本数据和样本数据对应的第一标签训练得到的,第一标签为备选特征的评分;如果所述备选特征的评分大于或等于第一预设值,则将所述备选特征确定为衍生出的目标特征。2.根据权利要求1所述的方法,还包括:如果所述备选特征的评分大于或等于第一预设值,返回执行所述对所述初始特征的多个参数中的至少一个参数进行变换处理的步骤;如果所述备选特征的评分小于第一预设值,则将所述初始特征丢弃。3.根据权利要求1所述的方法,还包括:基于包含所述多个备选特征的样本数据和样本数据对应的第二标签训练得到分类模型,第二标签用于指示备选特征对应的事件是否为异常事件;基于所述分类模型,确定所述多个备选特征在所述分类模型中对应的评分,备选特征在所述分类模型中对应的评分用于指示备选特征在所述分类模型的所有输入特征中的重要程度。4.根据权利要求3所述的方法,所述基于包含所述多个备选特征的样本数据和样本数据对应的第二标签训练得到分类模型,包括:获取包含所述多个备选特征的样本数据和样本数据对应的第二标签,循环执行第一指定步骤直到第一初始模型满足第一预设条件,将所述第一初始模型确定为所述分类模型;其中,所述第一预设条件包括随着循环执行所述第一指定步骤的次数的增加,所述第一初始模型的预设评价指标的增幅小于第二预设值;所述第一指定步骤包括:基于包含所述多个备选特征的样本数据和样本数据对应的第二标签,训练得到所述第一初始模型;将新衍生出的备选特征添加至所述样本数据中以对所述样本数据进行更新。5.根据权利要求3所述的方法,还包括:基于包含所述多个备选特征的元特征的样本数据和样本数据对应的第一标签,训练得到所述特征评分模型。6.根据权利要求5所述的方法,所述基于包含所述多个备选特征的元特征的样本数据和样本数据对应的第一标签,训练得到所述特征评分模型,包括:获取包含所述多个备选特征的元特征的样本数据和样本数据对应的第一标签,并循环执行第二指定步骤直到第二初始模型满足第二预设条件,将所述第二初始模型确定为所述特征评分模型;其中,所述第二预设条件包括随着循环执行所述第二指定步骤的次数的增加,所述第二初始模型的预设评价指标的增幅小于第三预设值;所述第二指定步骤包括:基于包含所述多个备选特征的元特征的样本数据和样本数据对应的第一标签,训练得到第二初始模型;将新衍生出的备选特征添加至所述样本数据中以对所述样本数据进行更新。7.根据权利要求1所述的方法,其中,所述初始数据中还包含所述多个参数对应的取值范围;所述对所述初始特征的多个参数中的至少一个参数进行变换处理,衍生得到备选特征,包括:基于所述至少一个参数对应的取值范围,随机变换所述...
【专利技术属性】
技术研发人员:张天翼,郭龙,宋博文,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。