【技术实现步骤摘要】
数据的处理方法、装置、存储介质及电子设备
本申请涉及计算机
,尤其涉及一种数据的处理方法、装置、存储介质及电子设备。
技术介绍
随着互联网的发展,数据处理在互联网行业扮演着越来越重要的角色,在多个领域过程中,均需要通过对海量数据进行分析处理,但在现有技术中,存在处理过程繁琐,数据特征提取不充分、运算结果并不精准等问题。
技术实现思路
本申请实施例提供了一种数据的处理方法、装置、存储介质及电子设备,可以解决对数据的特征提取不充分,处理结果不精确的问题。所述技术方案如下:第一方面,本申请实施例提供了一种数据的处理方法,所述方法包括:获取数据的属性信息;其中,所述属性信息包括所述数据的基本信息和互动信息;对所述属性信息进行特征提取得到特征组集合;其中,所述特征组集合包括至少一个特征组,所述特征组中包括至少一个数据特征;基于预测模型对所述特征组集合进行处理得到预测值;根据所述预测值为所述数据标注上目标数据标签。第二方面,本申请实施例提供了一种数据的处理装置,所 ...
【技术保护点】
1.一种数据的处理方法,其特征在于,所述方法包括:/n获取数据的属性信息;其中,所述属性信息包括所述数据的基本信息和互动信息;/n对所述属性信息进行特征提取得到特征组集合;其中,所述特征组集合包括至少一个特征组,所述特征组中包括至少一个数据特征;/n基于预测模型对所述特征组集合进行处理得到预测值;/n根据所述预测值为所述数据标注上目标数据标签。/n
【技术特征摘要】
1.一种数据的处理方法,其特征在于,所述方法包括:
获取数据的属性信息;其中,所述属性信息包括所述数据的基本信息和互动信息;
对所述属性信息进行特征提取得到特征组集合;其中,所述特征组集合包括至少一个特征组,所述特征组中包括至少一个数据特征;
基于预测模型对所述特征组集合进行处理得到预测值;
根据所述预测值为所述数据标注上目标数据标签。
2.根据权利要求1所述的方法,其特征在于,所述预测模型的训练过程包括:
获取多个样本数据各自的属性信息;
对所述多个样本数据各自的属性信息进行特征提取,得到所述多个样本数据各自对应的特征组集合;
利用XGBoost算法对所述多个样本数据各自对应的特征组集合训练得到所述预测模型。
3.根据权利要求1所述的方法,其特征在于,所述对所述属性信息进行特征提取得到特征组集合,包括:
对所述属性信息进行特征工程处理,清除所述属性信息中的异常数据得到至少一个有效特征数据;
对所述至少一个有效特征数据进行预处理得到有效数据信息;
基于第一预设规则对所述有效数据信息进行特征提取得到所述特征组集合。
4.根据权利要求3所述的方法,其特征在于,所述基于第一预设规则对所述有效数据信息进行特征提取得到所述特征组集合,包括:
获取所述有效数据信息中的至少一个特征;
从所述至少一个特征中选取特征发散或相关性高于预设阈值的至少一个目标特征;
对所述至少一个目标特征分类处理得到所述特征组集合。
5.根据权利要求1所述的方法,其特征在于,所述根据所述预测值为所述数据标注上目标数据标签,包括:
判断...
【专利技术属性】
技术研发人员:穆咏麟,郑潮阳,张锐,
申请(专利权)人:北京大米科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。