【技术实现步骤摘要】
离线特征分析方法、装置、计算机设备和存储介质
[0001]本申请涉及数据处理
,特别是涉及一种离线特征分析方法
、
装置
、
计算机设备和存储介质
。
技术介绍
[0002]随着数字化
、
大数据
、
云计算和人工智能的不断发展,在创建数据模型和训练过程中将用到用户多维度的原始业务数据,通过原始业务数据加工而成的信息被称为特征
。
然而,传统的离线特征分析方法,由于业务人员需要在离线服务平台中手动操作和维护,存在特征分析准确性和时效性较低等问题
。
技术实现思路
[0003]基于此,有必要针对上述技术问题,提供一种能够提高特征分析的准确性和时效性的离线特征分析方法
、
装置
、
计算机设备和存储介质
。
[0004]第一方面,提供一种离线特征分析方法,上述方法包括:
[0005]响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;
[0006]响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;
[0007]将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;
[0008]将各特征查询结果和对应的特征分析结果进行合并处理, ...
【技术保护点】
【技术特征摘要】
1.
一种离线特征分析方法,所述方法包括:响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,所述离线任务数据集包括离线任务类型和所述离线服务样本表;响应于对待查询特征的选择操作,根据所述待查询特征对各所述拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的所述离线样本的特征查询结果;将各所述特征查询结果输入至预先配置好的所述离线任务类型对应的特征分析模型,得到对应的特征分析结果;将各所述特征查询结果和对应的所述特征分析结果进行合并处理,生成离线特征分析结果统计表
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:获取离线服务平台输出的初始离线服务样本表
、
样本数据中心输出的离线样本服务数据和特征分析平台所储存的本地文件;对所述初始离线服务样本表
、
所述离线样本服务数据和所述本地文件进行数据处理,生成所述离线服务样本表;其中,所述数据处理包括数据清洗处理和数据格式转换处理
。3.
根据权利要求1所述的方法,其特征在于,所述对离线服务样本表进行拆分处理,得到对应的拆分样本表,包括:响应于对样本拆分参数的设置操作,根据所述样本拆分参数生成样本拆分规则;其中,样本拆分参数包括样本切片时间;根据所述样本拆分规则对所述离线服务样本表进行拆分处理,得到对应的所述拆分样本表
。4.
根据权利要求1所述的方法,其特征在于,所述离线任务数据集包括离线任务执行方式;所述根据所述待查询特征对各所述拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的所述离线样本的特征查询结果,包括:响应于所述离线任务执行方式为异步任务操作,对各所述拆分样本表中的离线样本所对应的离线样本数据集进行异步任务等待主动查询,得到对应的所述离线样本的特征查询结果
。5.
根据权利要求1所述的方法,其特征...
【专利技术属性】
技术研发人员:王涛涛,朱玮,余以召,
申请(专利权)人:上海数禾信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。