数据处理方法、装置及系统制造方法及图纸

技术编号:17442458 阅读:25 留言:0更新日期:2018-03-10 15:17
本发明专利技术公开了一种数据处理方法、装置及系统,属于计算机技术领域,该方法包括:获取待处理数据,待处理数据的一组数据参数为目标参数组;将目标参数组代入预设算法模型,确定目标参数组对应的目标算法,目标算法为:根据预设评估算法对目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法;根据目标参数组对应的目标算法确定待处理数据的属性。本发明专利技术解决了数据处理的效果较差的问题,提高了数据处理的效果,本发明专利技术用于数据处理。

【技术实现步骤摘要】
数据处理方法、装置及系统
本专利技术涉及计算机
,特别涉及一种数据处理方法、装置及系统。
技术介绍
随着社交网络的飞速发展以及网络用户的不断增多,网络侧产生的用户数据越来越多(成百上千或者更多),运营商可以通过对用户数据进行处理,确定用户的属性(如用户的性别、年龄或爱好),并根据用户的属性进行商业决策。通常的,运营商可以采用人工的方式对网络侧产生的用户数据进行处理,但是由于需要处理的数据量较大,人工处理的效率较低,因此,相关技术中,根据一种特征选择算法以及一种机器学习算法对多个用户数据进行处理,确定多个用户数据中的每个用户数据是否具有预设特征,进而确定每个用户数据对应的用户是否具有预设属性。示例的,某一通信运营商(如中国移动)的多个用户在使用该通信运营商提供的网络进行通信时,网络侧会产生较多的用户数据,如:用户的费用(能够反映用户的消费水平)、用户的账单(能够反映用户对中国移动提供的业务的使用情况)等。该通信运营商可以将网络侧产生的多个用户数据,代入一种特征选择算法(如特征空间算法),确定特征集,然后,将该特征集代入一种机器学习算法,确定该多个用户数据中具有预设特征(用户使用频率最高的业务为预设业务)的第一用户数据和不具有预设特征的第二用户数据,进而向第一用户数据对应的用户发送与预设业务相关的优惠信息。由于相关技术中,不同场景产生的用户数据不同,如:中国移动的用户产生的用户数据与中国电信(另一个通信运营商)的用户产生的用户数据不同,相关技术中在对每种场景产生的用户数据进行处理时,均采用同一种特征选择算法和同一种机器学习算法,且同一种机器学习算法无法适用于所有场景下的用户数据,经过处理得到的用户数据属性的准确度较低,所以,数据处理的精确度较低,数据处理的效果较差。
技术实现思路
为了解决数据处理的效果较差的问题,本专利技术提供了一种数据处理方法、装置及系统。所述技术方案如下:第一方面,提供了一种数据处理方法,所述方法包括:获取待处理数据,该待处理数据的一组数据参数为目标参数组;在获取待处理数据后,可以将目标参数组代入预设算法模型,确定目标参数组对应的目标算法,需要说明的是,所述目标算法为根据预设评估算法对所述目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法;在确定目标参数组对应的目标算法后,就可以根据目标参数组对应的目标算法对待处理数据进行处理,从而确定待处理数据的属性。可选的,所述数据参数用于描述数据的特征,所述目标参数组用于描述所述待处理数据的一组特征。由于本专利技术中在获取到待处理数据后,直接可以根据预设算法模型,确定目标参数组对应的目标算法,且该预设算法模型所指示的目标参数组对应的目标算法为根据预设评估算法对目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法,也即根据目标参数组对应的目标算法对待处理数据进行处理,所确定出的待处理数据的属性最准确,提高了确定出的待处理数据的属性的准确度。可选的,所述目标算法可以包括:目标特征选择算法和目标机器学习算法,在将所述目标参数组代入预设算法模型之前,还可以获取n个样本集,该n个样本集中的每个样本集可以具有一组数据参数,n个样本集具有n组数据参数,且n个样本集的n组数据参数可以包括所述目标参数组,所述n可以为大于或等于1的整数;确定所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,示例的,在每获取到一个样本集后,可以确定该样本集的一组数据参数对应的目标特征选择算法和目标机器学习算法;在确定n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法后,可以根据所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,确定所述预设算法模型。也即是,在获取待处理数据前,需要预先获取n个样本集,并确定每个样本集对应的目标算法,以及根据每个样本集的目标算法推导出预设算法模型,使得根据该预设算法模型可以确定至少一组数据参数对应的目标算法,在对待处理数据进行处理时,能够快速的根据该预设算法模型确定该待处理数据对应的目标算法,提高了数据处理的速度和效率。可选的,第一样本集为所述n个样本集中的任一样本集,通常可以采用第一样本集对应的至少一种特征选择算法和至少一种机器学习算法对该第一样本集进行处理。所述确定所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,可以包括:将所述第一样本集代入至少一种特征选择算法(也即该第一样本集对应的至少一种特征选择算法)中,得到至少一个特征集,并将得到的至少一个特征集确定为所述第一样本集的一组数据参数对应的至少一个特征集;然后,可以将所述第一样本集的一组数据参数对应的至少一个特征集,分别代入至少一种机器学习算法中,得到至少一个处理模型,并将该至少一个处理模型确定为所述第一样本集的一组数据参数对应的至少一个处理模型;最后,可以根据预设评估算法确定所述至少一个处理模型中每个处理模型对应的评估值,并将评估值最优的处理模型对应的特征选择算法和机器学习算法,作为所述第一样本集的一组数据参数对应的目标特征选择算法和目标机器学习算法。需要说明的是,该第一样本集为n个样本集中的任一样本集,也即在确定n个样本集中的每个样本集对应的目标特征选择算法和目标机器学习算法的过程均可以参考上述确定第一样本集对应的目标特征选择算法和目标机器学习算法的过程。由于预先确定了预设算法模型,所以在对待处理数据进行处理时,可以直接根据该预设算法模型,确定待处理数据的目标参数组对应的目标特征选择算法和目标机器学习算法,且整个过程中耗时较短,所以提高了数据处理的速度和效率。可选的,所述目标算法可以包括:目标特征选择算法和目标机器学习算法,所述根据所述目标参数组对应的目标算法确定所述待处理数据的属性,包括:首先,将所述待处理数据代入所述目标参数组对应的目标特征选择算法,得到一个特征集,并将得到的特征集确定为目标特征集,所述目标特征集包括p个特征,所述p个特征中的每个特征具有一组特征参数,p个特征可以具有p组特征参数,所述p为大于或等于1的整数,且特征集中的每个特征具有一个权重;然后,可以将所述p个特征的p组特征参数分别代入预设权重变化模型,确定所述p组特征参数中每组特征参数对应的权重变化值,需要说明的是,根据所述预设权重变化模型能够确定出q组特征参数中的每组特征参数对应的权重变化值,所述q组特征参数包括所述p组特征参数,q≥p;在确定p组特征参数中每组特征参数对应的权重变化值后,可以根据确定出的权重变化值更新所述目标特征集中的每个特征对应的权重,也即,将原先每个特征的权重与该特征的一组特征参数对应的权重变化值之和作为更新后的该特征对应的权重;最后,可以根据更新特征的权重后的目标特征集和所述目标参数组对应的目标机器学习算法,确定所述待处理数据的属性。示例的,该预设权重变化模型可以为根据工作人员的经验值预先建立的,由于预先确定了预设权重变化模型,使得在使用自动特征选择算法得到目标特征集后,还可以参考工作人员的经验值,对该目标特征集中特征的权重进行更新,使得将更新后的目标特征集代入机器学习算法得到的处理模型的处理效果较好。可选的,在根据所述目标参数组对应的目标算法确定所述待处理数据的属性之前,本文档来自技高网
...
数据处理方法、装置及系统

【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据的一组数据参数为目标参数组;将所述目标参数组代入预设算法模型,确定所述目标参数组对应的目标算法,所述目标算法为根据预设评估算法对所述目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法;根据所述目标参数组对应的目标算法确定所述待处理数据的属性。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据的一组数据参数为目标参数组;将所述目标参数组代入预设算法模型,确定所述目标参数组对应的目标算法,所述目标算法为根据预设评估算法对所述目标参数组对应的至少一种算法进行评估,确定的最优评估值对应的算法;根据所述目标参数组对应的目标算法确定所述待处理数据的属性。2.根据权利要求1所述的方法,其特征在于,所述目标算法包括:目标特征选择算法和目标机器学习算法,在将所述目标参数组代入预设算法模型前,所述方法还包括:获取n个样本集,所述n个样本集的n组数据参数包括所述目标参数组,所述n为大于或等于1的整数;确定所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法;根据所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,确定所述预设算法模型。3.根据权利要求2所述的方法,其特征在于,第一样本集为所述n个样本集中的任一样本集,所述确定所述n组数据参数中的每组数据参数对应的目标特征选择算法和目标机器学习算法,包括:将所述第一样本集代入至少一种特征选择算法中,确定所述第一样本集的一组数据参数对应的至少一个特征集;将所述第一样本集的一组数据参数对应的至少一个特征集,分别代入至少一种机器学习算法中,确定所述第一样本集的一组数据参数对应的至少一个处理模型;根据预设评估算法确定所述至少一个处理模型中每个处理模型对应的评估值,并将评估值最优的处理模型对应的特征选择算法和机器学习算法,作为所述第一样本集的一组数据参数对应的目标特征选择算法和目标机器学习算法。4.根据权利要求1或2所述的方法,其特征在于,所述目标算法包括:目标特征选择算法和目标机器学习算法,所述根据所述目标参数组对应的目标算法确定所述待处理数据的属性,包括:将所述待处理数据代入所述目标参数组对应的目标特征选择算法,确定目标特征集,所述目标特征集包括p个特征,所述p个特征中的每个特征具有一组特征参数,所述p为大于或等于1的整数,特征集中的特征具有一个权重;将所述p个特征的p组特征参数分别代入预设权重变化模型,确定所述p组特征参数中每组特征参数对应的权重变化值;根据确定的权重变化值更新所述目标特征集中的每个特征对应的权重;根据更新后的目标特征集和所述目标参数组对应的目标机器学习算法,确定所述待处理数据的属性。5.根据权利要求4所述的方法,其特征在于,在根据所述目标参数组对应的目标算法确定所述待处理数据的属性之前,所述方法还包括:获取m个样本集,所述m个样本集的m组数据参数包括所述目标参数组,所述m为大于或等于1的整数;确定所述m组数据参数中的每组数据参数对应的目标特征选择算法;确定初始特征集,所述初始特征集包括:将所述m个样本集中的每个样本集,代入样本集的一组数据参数对应的目标特征选择算法得到的特征集中的特征;确定参考特征集,所述参考特征集包括:将所述m个样本集中的每个样本集代入参考特征选择算法得到的特征集中的特征;根据所述参考特征集,确定所述初始特征集中每个特征的一组特征参数对应的权重变化值;根据所述每个特征的一组特征参数对应的权重变化值,确定所述预设权重变化模型。6.根据权利要求5所述的方法,其特征在于,所述根据所述参考特征集,确定所述初始特征集中每个特征的一组特征参数对应的权重变化值,包括:将所述初始特征集代入预设机器学习算法,确定第一处理模型;将所述参考特征集代入预设机器学习算法,确定第二处理模型;根据所述预设评估算法对所述第一处理模型进行评估,确定第一评估值;根据所述预设评估算法对所述第二处理模型进行评估,确定第二评估值;判断所述第二评估值是否大于所述第一评估值;若所述第二评估值大于所述第一评估值,且所述参考特征集包括所述初始特征集中的第一特征,则将所述第一特征在所述参考特征集中的权重,与所述第一特征在所述初始特征集中的权重之差,作为所述第一特征的一组特征参数对应的权重变化值。7.根据权利要求1所述的方法,其特征在于,所述目标算法包括:目标特征选择算法或目标机器学习算法。8.一种数据处理装置,其特征在于,所述数据处理装置包括:第一获取模块,用于获取待处理数据,所述...

【专利技术属性】
技术研发人员:刘冬
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1