离线特征分析方法技术

技术编号:39795622 阅读:9 留言:0更新日期:2023-12-22 02:29
本申请涉及一种离线特征分析方法

【技术实现步骤摘要】
离线特征分析方法、装置、计算机设备和存储介质


[0001]本申请涉及数据处理
,特别是涉及一种离线特征分析方法

装置

计算机设备和存储介质


技术介绍

[0002]随着数字化

大数据

云计算和人工智能的不断发展,在创建数据模型和训练过程中将用到用户多维度的原始业务数据,通过原始业务数据加工而成的信息被称为特征

然而,传统的离线特征分析方法,由于业务人员需要在离线服务平台中手动操作和维护,存在特征分析准确性和时效性较低等问题


技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够提高特征分析的准确性和时效性的离线特征分析方法

装置

计算机设备和存储介质

[0004]第一方面,提供一种离线特征分析方法,上述方法包括:
[0005]响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;
[0006]响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;
[0007]将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;
[0008]将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表

[0009]在其中一个实施例中,上述方法还包括:
[0010]获取离线服务平台输出的初始离线服务样本表

样本数据中心输出的离线样本服务数据和特征分析平台所储存的本地文件;
[0011]对初始离线服务样本表

离线样本服务数据和本地文件进行数据处理,生成离线服务样本表;其中,数据处理包括数据清洗处理和数据格式转换处理

[0012]在其中一个实施例中,对离线服务样本表进行拆分处理,得到对应的拆分样本表,包括:
[0013]响应于对样本拆分参数的设置操作,根据样本拆分参数生成样本拆分规则;其中,样本拆分参数包括样本切片时间;
[0014]根据样本拆分规则对离线服务样本表进行拆分处理,得到对应的拆分样本表

[0015]在其中一个实施例中,离线任务数据集包括离线任务执行方式;根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果,包括:
[0016]响应于离线任务执行方式为异步任务操作,对各拆分样本表中的离线样本所对应
的离线样本数据集进行异步任务等待主动查询,得到对应的离线样本的特征查询结果

[0017]在其中一个实施例中,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果,还包括:
[0018]响应于离线任务执行方式为同步任务操作,对各拆分样本表中的离线样本所对应的离线样本数据集进行同步任务等待主动轮询,得到对应的离线样本的特征查询结果

[0019]在其中一个实施例中,特征查询结果包括样本身份识别数据和样本个人特征数据;特征分析结果包括样本行为特征

[0020]在其中一个实施例中,上述方法包括:
[0021]将离线特征分析结果统计表输出至样本数据中心,以使样本数据中心存储离线特征分析结果统计表

[0022]第二方面,提供了一种离线特征分析装置,所述装置包括样本拆分模块

特征查询模块

特征分析模块和结果统计模块

[0023]其中,样本拆分模块用于响应于接收到离线任务数据集,根据预设切片时间对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;特征查询模块用于响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;特征分析模块用于将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;结果统计模块用于将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表

[0024]第三方面,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现上述方法实施例中任一方法的步骤

[0025]第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中任一方法的步骤

[0026]上述离线特征分析方法

装置

计算机设备和存储介质,响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;而后,响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;接着,将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;最后,将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表,从而提供了特征口径统一的离线特征分析服务,提高了离线特征分析的准确性和时效性

附图说明
[0027]图1为一个实施例中离线特征分析方法的应用环境图;
[0028]图2为一个实施例中离线特征分析方法的第一流程示意图;
[0029]图3为一个实施例中对离线服务样本表进行拆分处理,得到对应的拆分样本表的流程示意图;
[0030]图4为一个实施例中离线特征分析方法的第二流程示意图;
[0031]图5为一个实施例中根据待查询特征对各拆分样本表中的离线样本所对应的离线
样本数据集进行查询,得到对应的离线样本的特征查询结果的流程示意图;
[0032]图6为一个实施例中离线特征分析方法的第三流程示意图;
[0033]图7为一个实施例中离线特征分析装置的结构框图;
[0034]图8为一个实施例中计算机设备的内部结构图

具体实施方式
[0035]为了使本申请的目的

技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明

应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请

[0036]为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述

附图中给出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种离线特征分析方法,所述方法包括:响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,所述离线任务数据集包括离线任务类型和所述离线服务样本表;响应于对待查询特征的选择操作,根据所述待查询特征对各所述拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的所述离线样本的特征查询结果;将各所述特征查询结果输入至预先配置好的所述离线任务类型对应的特征分析模型,得到对应的特征分析结果;将各所述特征查询结果和对应的所述特征分析结果进行合并处理,生成离线特征分析结果统计表
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:获取离线服务平台输出的初始离线服务样本表

样本数据中心输出的离线样本服务数据和特征分析平台所储存的本地文件;对所述初始离线服务样本表

所述离线样本服务数据和所述本地文件进行数据处理,生成所述离线服务样本表;其中,所述数据处理包括数据清洗处理和数据格式转换处理
。3.
根据权利要求1所述的方法,其特征在于,所述对离线服务样本表进行拆分处理,得到对应的拆分样本表,包括:响应于对样本拆分参数的设置操作,根据所述样本拆分参数生成样本拆分规则;其中,样本拆分参数包括样本切片时间;根据所述样本拆分规则对所述离线服务样本表进行拆分处理,得到对应的所述拆分样本表
。4.
根据权利要求1所述的方法,其特征在于,所述离线任务数据集包括离线任务执行方式;所述根据所述待查询特征对各所述拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的所述离线样本的特征查询结果,包括:响应于所述离线任务执行方式为异步任务操作,对各所述拆分样本表中的离线样本所对应的离线样本数据集进行异步任务等待主动查询,得到对应的所述离线样本的特征查询结果
。5.
根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:王涛涛朱玮余以召
申请(专利权)人:上海数禾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1