【技术实现步骤摘要】
征;
[0015]特征筛选模块,用于对原始特征进行筛选得到有效特征,所述原始特征为原始 数据的特征及挖掘得到的新特征;
[0016]所述原始数据集依次经过特征生成模块和特征筛选模块处理后得到特征数据 集,所述迭代训练单元使用特征数据集对每种职业所对应的二分类模型进行训练。
[0017]进一步地,所述特征生成模块包括基础特征提取单元、特征衍生单元和交叉特 征单元,所述基础特征单元用于提取原始数据的特征,所述特征衍生单元用于根据 预设置的业务规则生成新的特征,所述交叉特征单元用于使用特征交叉法组合原始 数据的特征得到的特征得到新的特征。
[0018]进一步地,所述特征筛选模块包括评估单元和多个筛选单元,每个所述筛选单 元搭载有一种特征筛选方式,所述评估单元用于对每个筛选单元的特征筛选结果进 行评估。
[0019]进一步地,所述原始数据集构建模块包括数据选择单元、数据预处理单元和数 据标注单元,所述数据选择单元用于获取业务数据并从业务数据中提取原始数据, 每条原始数据对应一个用户;所述数据预处理单元用于对原始数据进行预处理;所 述数 ...
【技术保护点】
【技术特征摘要】
1.一种用户职业预测系统,其特征在于,包括:原始数据集构建模块,用于获取原始数据并为原始数据标注职业标签生成原始数据集,所述原始数据集由多个样本构成,一个所述样本标注有一个用户的一个职业标签;模型构建模块,用于构建多个不同类型的分类模型;模型训练模块,包括模型选择单元、迭代训练单元、参数调节单元和模型评估单元;所述模型选择单元用于为每种职业选择分类模型;所述迭代训练单元用于对每种职业所对应的分类模型进行训练;所述参数调节单元用于设置每个分类模型的模型参数可选范围;所述模型评估单元用于评估每种职业所对应的分类模型的性能指标;职业预测模块,所述职业预测模块搭载有用户职业预测模型,所述用户职业预测模型由多个训练好的分类模型组合得到,每个分类模型用于进行一种职业的预测。2.根据权利要求1所述的一种用户职业预测系统,其特征在于,还包括:特征生成模块,用于提取原始数据的特征并对原始数据进行特征挖掘得到新特征;特征筛选模块,用于对原始特征进行筛选得到有效特征,所述原始特征为原始数据的特征及挖掘得到的新特征;所述原始数据集依次经过特征生成模块和特征筛选模块处理后得到特征数据集,所述迭代训练单元使用特征数据集对每种职业所对应的二分类模型进行训练。3.根据权利要求2所述的一种用户职业预测系统,其特征在于,所述特征生成模块包括基础特征提取单元、特征衍生单元和交叉特征单元,所述基础特征单元用于提取原始数据的特征,所述特征衍生单元用于根据预设置的业务规则生成新的特征,所述交叉特征单元用于使用特征交叉法组合原始数据的特征得到的特征得到新的特征。4.根据权利要求2所述的一种用户职业预测系统,其特征在...
【专利技术属性】
技术研发人员:程夏莹,易力,文扬,黄天立,付必宇,
申请(专利权)人:欧冶云商股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。