业务特征构造方法以及装置制造方法及图纸

技术编号:24574106 阅读:30 留言:0更新日期:2020-06-21 00:07
本说明书实施例提供业务特征构造方法以及装置,其中所述业务特征构造方法包括:在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录,并利用多种数据筛选方法对所述业务访问记录进行数据筛选,以获得对应的筛选结果,对筛选结果中包含的业务访问记录进行组合生成多个业务序列,并将多个业务序列输入特征构造模型,获取特征构造模型输出的用于训练目标业务的业务模型的业务特征。

Business feature construction method and device

【技术实现步骤摘要】
业务特征构造方法以及装置
本说明书实施例涉及机器学习
,特别涉及一种业务特征构造方法。本说明书一个或者多个实施例同时涉及一种业务特征构造装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
随着信息化社会的发展,用户接触到的信息越来越庞大、繁杂,同时用户对生活的便利性也要求越来越高,为了满足用户对生活便利性的需求,因此越来越多的应用程序应运而生。用户可通过应用程序进行购物、投资理财以及缴费等,并且用户在通过应用程序办理相关业务的同时,会生成大量与业务相关的业务数据,而业务端为保证业务的正常运行,则需利用这些业务数据对业务指标进行预测,例如,在商品推荐业务中,可对用户的喜好进行预测,以为用户推荐喜欢的商品,或者在风控领域,可对用户的交易风险进行预测,以降低业务的不良率;对于大部分业务指标的预测,往往会用到预测模型,因此,亟需一种特征构造方法,以提高模型学习结果的准确度。
技术实现思路
有鉴于此,本说明书施例提供了一种业务特征构造方法。本说明书一个或者多个实施例同时涉及一种业务特征构造装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种业务特征构造方法,包括:在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;利用多种数据筛选方法对所述业务访问记录进行数据筛选;对筛选结果中包含的业务访问记录进行组合生成多个业务序列;将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。可选地,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:利用至少一种数据筛选算法对所述业务访问记录进行数据筛选处理,将筛选生成的至少一种筛选结果进行整合生成第一筛选集合;利用数据筛选模型对所述业务访问记录进行数据筛选处理,生成第二筛选集合;相应的,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选步骤执行之后,所述对筛选结果中包含的业务访问记录进行组合生成多个业务序列步骤执行之前,还包括:将所述第一筛选集合以及所述第二筛选集合中包含的业务访问记录作为所述筛选结果。可选地,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:按照多个数据维度对所述业务访问记录进行筛选生成与所述多个数据维度分别对应的数据集合;根据所述数据维度确定分别与所述数据集合对应的数据筛选方法;利用所述数据筛选方法对与所述数据筛选方法对应的数据集合中包含的业务访问记录进行数据筛选;其中,所述数据筛选方法包括至少一种数据筛选算法或数据筛选模型。可选地,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:利用至少一种数据筛选算法对所述业务访问记录进行数据筛选,将筛选生成的至少一种筛选结果进行整合生成第三筛选集合;利用数据筛选模型对所述第三筛选集合中包含的业务访问记录进行数据筛选。可选地,所述特征构造模型采用如下方式进行训练:基于所述业务访问记录与所述业务特征的关联关系构建预训练模型;将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型;将有标注的业务序列作为训练样本对所述初始特征构造模型进行训练,获得所述特征构造模型。可选地,所述将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型,包括:将所述业务序列输入所述预训练模型,利用所述预训练模型的编码端对所述业务序列进行编码处理,获得第一业务特征;对所述业务序列中包含的业务访问记录进行删减处理生成目标业务序列,并对所述目标业务序列进行编码处理生成第二业务特征;根据所述第一业务特征和所述第二业务特征计算所述预训练模型的数据删减损失值,并根据所述数据删减损失值调整所述预训练模型的参数,获得所述初始特征构造模型。可选地,所述将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型,包括:对所述业务序列中包含的业务访问记录进行拆分处理生成多个子序列,并将所述子序列进行组合生成组合业务序列;将所述组合业务序列输入所述预训练模型,获取所述组合业务序列中各个子序列的同源识别结果;根据预存的损失函数和所述同源识别结果确定所述预训练模型的序列组合损失值;根据所述序列组合损失值调整所述预训练模型的参数,获得所述初始特征构造模型。可选地,所述将有标注的业务序列作为训练样本对所述初始特征构造模型进行训练,获得所述特征构造模型,包括:对所述业务序列进行真值标注处理;其中,真值标注结果用于表示所述业务序列中包含的业务访问记录对应的业务指标类型;将所述业务序列作为训练样本,以及所述真值标注结果作为样本标签对所述初始构造模型进行迭代训练,获得所述特征构造模型。可选地,所述业务序列通过以下方式生成:对所述筛选结果中包含的业务访问记录进行组合生成多个组合数据集合;对所述组合数据集合中包含的业务访问记录进行关键词提取;统计所述组合数据集合中所述关键词对应的出现频次;对所述关键词以及所述关键词对应的出现频次进行整合生成所述业务序列。根据本说明书实施例的第二方面,提供了一种业务特征构造装置,包括:读取模块,被配置为在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;筛选模块,被配置为利用多种数据筛选方法对所述业务访问记录进行数据筛选;对筛选结果中包含的业务访问记录进行组合生成多个业务序列;获取模块,被配置为将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。可选地,所述筛选模块,包括:第一筛选子模块,被配置为利用至少一种数据筛选算法对所述业务访问记录进行数据筛选处理,将筛选生成的至少一种筛选结果进行整合生成第一筛选集合;第二筛选子模块,被配置为利用数据筛选模型对所述业务访问记录进行数据筛选处理,生成第二筛选集合;相应的,所述业务特征构造装置,还包括:筛选结果确定模块,被配置为将所述第一筛选集合以及所述第二筛选集合中包含的业务访问记录作为所述筛选结果。根据本说明书实施例的第三方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;利用多种数据筛选方法对所述业务访问记录进行数据筛选;对筛选结果中包含的业务访问记录进行组合生成多个业务序列;将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。根据本说明书实施本文档来自技高网...

【技术保护点】
1.一种业务特征构造方法,包括:/n在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;/n利用多种数据筛选方法对所述业务访问记录进行数据筛选;/n对筛选结果中包含的业务访问记录进行组合生成多个业务序列;/n将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。/n

【技术特征摘要】
1.一种业务特征构造方法,包括:
在数据库中读取用户访问目标业务的业务执行页面生成的业务访问记录;
利用多种数据筛选方法对所述业务访问记录进行数据筛选;
对筛选结果中包含的业务访问记录进行组合生成多个业务序列;
将所述业务序列输入特征构造模型,获取所述特征构造模型输出的业务特征,所述业务特征用于对所述目标业务的业务模型进行训练。


2.根据权利要求1所述的业务特征构造方法,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:
利用至少一种数据筛选算法对所述业务访问记录进行数据筛选处理,将筛选生成的至少一种筛选结果进行整合生成第一筛选集合;
利用数据筛选模型对所述业务访问记录进行数据筛选处理,生成第二筛选集合;
相应的,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选步骤执行之后,所述对筛选结果中包含的业务访问记录进行组合生成多个业务序列步骤执行之前,还包括:
将所述第一筛选集合以及所述第二筛选集合中包含的业务访问记录作为所述筛选结果。


3.根据权利要求1所述的业务特征构造方法,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:
按照多个数据维度对所述业务访问记录进行筛选生成与所述多个数据维度分别对应的数据集合;
根据所述数据维度确定分别与所述数据集合对应的数据筛选方法;
利用所述数据筛选方法对与所述数据筛选方法对应的数据集合中包含的业务访问记录进行数据筛选;
其中,所述数据筛选方法包括至少一种数据筛选算法或数据筛选模型。


4.根据权利要求1所述的业务特征构造方法,所述利用多种数据筛选方法对所述业务访问记录进行数据筛选,包括:
利用至少一种数据筛选算法对所述业务访问记录进行数据筛选,将筛选生成的至少一种筛选结果进行整合生成第三筛选集合;
利用数据筛选模型对所述第三筛选集合中包含的业务访问记录进行数据筛选。


5.根据权利要求1所述的业务特征构造方法,所述特征构造模型采用如下方式进行训练:
基于所述业务访问记录与所述业务特征的关联关系构建预训练模型;
将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型;
将有标注的业务序列作为训练样本对所述初始特征构造模型进行训练,获得所述特征构造模型。


6.根据权利要求5所述的业务特征构造方法,所述将所述业务序列作为训练样本输入所述预训练模型进行模型的预训练,获得初始特征构造模型,包括:
将所述业务序列输入所述预训练模型,利用所述预训练模型的编码端对所述业务序列进行编码处理,获得第一业务特征;
对所述业务序列中包含的业务访问记录进行删减处理生成目标业务序列,并对所述目标业务序列进行编码处理生成第二业务特征;
根据所述第一业务特征和所述第二业务特征计算所述预训练模型的数据删减损失值,并根据所述数据删减损失值调整所述预训练模型的参数,获得所述初始特征构造模型。


7.根据权利要求5所述的业务特征构造方法,所述将所述业务序列作为训练样本输入所述预训练模型进行模型...

【专利技术属性】
技术研发人员:李友王凯朱训
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1