【技术实现步骤摘要】
业务特征构造方法以及装置
本说明书实施例涉及机器学习
,特别涉及一种业务特征构造方法。本说明书一个或者多个实施例同时涉及一种业务特征构造装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
随着信息化社会的发展,用户接触到的信息越来越庞大、繁杂,同时用户对生活的便利性也要求越来越高,为了满足用户对生活便利性的需求,因此越来越多的应用程序应运而生。用户可通过应用程序进行购物、投资理财以及缴费等,并且用户在通过应用程序办理相关业务的同时,会生成大量与业务相关的业务数据,而业务端为保证业务的正常运行,则需利用这些业务数据对业务指标进行预测,例如,在商品推荐业务中,可对用户的喜好进行预测,以为用户推荐喜欢的商品,或者在风控领域,可对用户的交易风险进行预测,以降低业务的不良率;对于大部分业务指标的预测,往往会用到预测模型,因此,亟需一种特征构造方法,以提高模型学习结果的准确度。
技术实现思路
有鉴于此,本说明书施例提供了一种业务特征构造方法。本说明书一个或者多个实施例同时涉及一种业务特征构造装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种业务特征构造方法,包括:在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;利用多种数据筛选方法对所述业务访问记录进行数据筛选;对筛选结果中包含的业务访问记录进行组合生成多个业务序列;将所述业务序列输入特征构造模型,获取所述特征构造 ...
【技术保护点】
1.一种业务特征构造方法,包括:/n在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;/n利用多种数据筛选方法对所述业务访问记录进行数据筛选;/n对筛选结果中包含的业务访问记录进行组合生成多个业务序列;/n将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。/n
【技术特征摘要】
1.一种业务特征构造方法,包括:
在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;
利用多种数据筛选方法对所述业务访问记录进行数据筛选;
对筛选结果中包含的业务访问记录进行组合生成多个业务序列;
将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。
2.根据权利要求1所述的业务特征构造方法,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:
利用至少一种数据筛选算法对所述业务访问记录进行数据筛选处理,将筛选生成的至少一种筛选结果进行整合生成第一筛选集合;
利用数据筛选模型对所述业务访问记录进行数据筛选处理,生成第二筛选集合;
相应的,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选步骤执行之后,所述对筛选结果中包含的业务访问记录进行组合生成多个业务序列步骤执行之前,还包括:
将所述第一筛选集合以及所述第二筛选集合中包含的业务访问记录作为所述筛选结果。
3.根据权利要求1所述的业务特征构造方法,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:
按照多个数据维度对所述业务访问记录进行筛选生成与所述多个数据维度分别对应的数据集合;
根据所述数据维度确定分别与所述数据集合对应的数据筛选方法;
利用所述数据筛选方法对与所述数据筛选方法对应的数据集合中包含的业务访问记录进行数据筛选;
其中,所述数据筛选方法包括至少一种数据筛选算法或数据筛选模型。
4.根据权利要求1所述的业务特征构造方法,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:
利用至少一种数据筛选算法对所述业务访问记录进行数据筛选,将筛选生成的至少一种筛选结果进行整合生成第三筛选集合;
利用数据筛选模型对所述第三筛选集合中包含的业务访问记录进行数据筛选。
5.根据权利要求1所述的业务特征构造方法,所述特征构造模型采用如下方式进行训练:
基于所述业务访问记录与所述业务特征的关联关系构建预训练模型;
将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型;
将有标注的业务序列作为训练样本对所述初始特征构造模型进行训练,获得所述特征构造模型。
6.根据权利要求5所述的业务特征构造方法,所述将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型,包括:
将所述业务序列输入所述预训练模型,利用所述预训练模型的编码端对所述业务序列进行编码处理,获得第一业务特征;
对所述业务序列中包含的业务访问记录进行删减处理生成目标业务序列,并对所述目标业务序列进行编码处理生成第二业务特征;
根据所述第一业务特征和所述第二业务特征计算所述预训练模型的数据删减损失值,并根据所述数据删减损失值调整所述预训练模型的参数,获得所述初始特征构造模型。
7.根据权利要求5所述的业务特征构造方法,所述将所述业务序列作为训练样本输入所述预训练模型进行模型...
【专利技术属性】
技术研发人员:李友,王凯,朱训,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。