【技术实现步骤摘要】
数据处理方法、装置及系统
本专利技术涉及计算机
,特别涉及一种数据处理方法、装置及系统。
技术介绍
随着社交网络的飞速发展以及网络用户的不断增多,网络侧产生的用户数据越来越多(成百上千或者更多),运营商可以通过对用户数据进行处理,确定用户的属性(如用户的性别、年龄或爱好),并根据用户的属性进行商业决策。通常的,运营商可以采用人工的方式对网络侧产生的用户数据进行处理,但是由于需要处理的数据量较大,人工处理的效率较低,因此,相关技术中,根据一种特征选择算法以及一种机器学习算法对多个用户数据进行处理,确定多个用户数据中的每个用户数据是否具有预设特征,进而确定每个用户数据对应的用户是否具有预设属性。示例的,某一通信运营商(如中国移动)的多个用户在使用该通信运营商提供的网络进行通信时,网络侧会产生较多的用户数据,如:用户的费用(能够反映用户的消费水平)、用户的账单(能够反映用户对中国移动提供的业务的使用情况)等。该通信运营商可以将网络侧产生的多个用户数据,代入一种特征选择算法(如特征空间算法),确定特征集,然后,将该特征集代入一种机器学习算法,确定该多个用户数据中具有预设特征(用户使用频率最高的业务为预设业务)的第一用户数据和不具有预设特征的第二用户数据,进而向第一用户数据对应的用户发送与预设业务相关的优惠信息。由于相关技术中,不同场景产生的用户数据不同,如:中国移动的用户产生的用户数据与中国电信(另一个通信运营商)的用户产生的用户数据不同,相关技术中在对每种场景产生的用户数据进行处理时,均采用同一种特征选择算法和同一种机器学习算法,且同一种机器学习算法无法适 ...
【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据的一组数据参数为目标参数组;将所述目标参数组代入预设算法模型,确定所述目标参数组对应的目标算法,所述目标算法为根据预设评估算法对所述目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法;根据所述目标参数组对应的目标算法确定所述待处理数据的属性。
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据的一组数据参数为目标参数组;将所述目标参数组代入预设算法模型,确定所述目标参数组对应的目标算法,所述目标算法为根据预设评估算法对所述目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法;根据所述目标参数组对应的目标算法确定所述待处理数据的属性。2.根据权利要求1所述的方法,其特征在于,所述目标算法包括:目标特征选择算法和目标机器学习算法,在将所述目标参数组代入预设算法模型前,所述方法还包括:获取n个样本集,所述n个样本集的n组数据参数包括所述目标参数组,所述n为大于或等于1的整数;确定所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法;根据所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,确定所述预设算法模型。3.根据权利要求2所述的方法,其特征在于,第一样本集为所述n个样本集中的任一样本集,所述确定所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,包括:将所述第一样本集代入至少一种特征选择算法中,确定所述第一样本集的一组数据参数对应的至少一个特征集;将所述第一样本集的一组数据参数对应的至少一个特征集,分别代入至少一种机器学习算法中,确定所述第一样本集的一组数据参数对应的至少一个处理模型;根据预设评估算法确定所述至少一个处理模型中每个处理模型对应的评估值,并将评估值最优的处理模型对应的特征选择算法和机器学习算法,作为所述第一样本集的一组数据参数对应的目标特征选择算法和目标机器学习算法。4.根据权利要求1或2所述的方法,其特征在于,所述目标算法包括:目标特征选择算法和目标机器学习算法,所述根据所述目标参数组对应的目标算法确定所述待处理数据的属性,包括:将所述待处理数据代入所述目标参数组对应的目标特征选择算法,确定目标特征集,所述目标特征集包括p个特征,所述p个特征中的每个特征具有一组特征参数,所述p为大于或等于1的整数,特征集中的特征具有一个权重;将所述p个特征的p组特征参数分别代入预设权重变化模型,确定所述p组特征参数中每组特征参数对应的权重变化值;根据确定的权重变化值更新所述目标特征集中的每个特征对应的权重;根据更新后的目标特征集和所述目标参数组对应的目标机器学习算法,确定所述待处理数据的属性。5.根据权利要求4所述的方法,其特征在于,在根据所述目标参数组对应的目标算法确定所述待处理数据的属性之前,所述方法还包括:获取m个样本集,所述m个样本集的m组数据参数包括所述目标参数组,所述m为大于或等于1的整数;确定所述m组数据参数中的每组数据参数对应的目标特征选择算法;确定初始特征集,所述初始特征集包括:将所述m个样本集中的每个样本集,代入样本集的一组数据参数对应的目标特征选择算法得到的特征集中的特征;确定参考特征集,所述参考特征集包括:将所述m个样本集中的每个样本集代入参考特征选择算法得到的特征集中的特征;根据所述参考特征集,确定所述初始特征集中每个特征的一组特征参数对应的权重变化值;根据所述每个特征的一组特征参数对应的权重变化值,确定所述预设权重变化模型。6.根据权利要求5所述的方法,其特征在于,所述根据所述参考特征集,确定所述初始特征集中每个特征的一组特征参数对应的权重变化值,包括:将所述初始特征集代入预设机器学习算法,确定第一处理模型;将所述参考特征集代入预设机器学习算法,确定第二处理模型;根据所述预设评估算法对所述第一处理模型进行评估,确定第一评估值;根据所述预设评估算法对所述第二处理模型进行评估,确定第二评估值;判断所述第二评估值是否大于所述第一评估值;若所述第二评估值大于所述第一评估值,且所述参考特征集包括所述初始特征集中的第一特征,则将所述第一特征在所述参考特征集中的权重,与所述第一特征在所述初始特征集中的权重之差,作为所述第一特征的一组特征参数对应的权重变化值。7.根据权利要求1所述的方法,其特征在于,所述目标算法包括:目标特征选择算法或目标机器学习算法。8.一种数据处理装置,其特征在于,所述数据处理装置包括:第一获取模块,用于获取待处理数据,所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。