数据处理方法及装置制造方法及图纸

技术编号:20119493 阅读:41 留言:0更新日期:2019-01-16 12:22
本申请公开了一种数据处理方法及装置,属于计算机技术领域。所述方法包括:获取多个特征数据;自动对多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,两组处理数据包括一组高阶数据和一组低阶数据,高阶数据与多个特征数据中m个特征数据的非线性组合相关,低阶数据与多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;根据多个目标数据确定预测数据,多个目标数据包括两组处理数据。本申请解决了相关技术确定的预测数据的准确度较低的问题,提高了预测数据的准确度,本申请用于数据处理。

Data Processing Method and Device

This application discloses a data processing method and device, which belongs to the field of computer technology. The method includes: acquiring multi-feature data; automatically processing multi-feature data with two different non-linear combinations to obtain two sets of processing data. The two sets of processing data include a set of high-order data and a set of low-order data. The high-order data is related to the non-linear combination of M feature data in multi-feature data, and the low-order data is related to n feature numbers in multi-feature data. According to the non-linear combination correlation, m > 3, m > n > 2. Predictive data are determined according to multiple target data, and multiple target data include two groups of processing data. The application solves the problem of low accuracy of predicted data determined by relevant technology, and improves the accuracy of predicted data. The application is used for data processing.

【技术实现步骤摘要】
数据处理方法及装置
本申请涉及计算机
,特别涉及一种数据处理方法及装置。
技术介绍
随着计算机技术的发展,人们在对可动态变化的事物(例如某一网站的访问次数、某一文件的下载量、应用商城中某一应用的图标的点击率或视频网站中某一视频的点击率)进行分析时,通常可以获取事物的多个特征数据(特征数据用于表征事物的属性),并对该多个特征数据进行处理,得到用于表征该事物的发展方向的预测数据。相关技术中,人们可以向数据处理装置输入事物的多个特征数据,数据处理装置能够对事物的多个特征数据进行高阶非线性组合处理,得到多个高阶数据,并根据该多个高阶数据确定预测数据,其中,高阶数据为该多个特征数据中至少三个特征数据的非线性组合。例如,数据处理装置可以对应用商城中某一应用的多个特征数据进行高阶非线性组合处理,得到用于表征该应用的图标的点击率的预测数据,根据该预测数据可以确定该应用的推荐优先级。由于相关技术中的预测数据是数据处理装置基于多个高阶数据得到的,而准确的预测需要基于大量的数据来实现,上述多个高阶数据的数据量依然无法满足准确预测需求,因此,相关技术确定的预测数据的准确度较低。
技术实现思路
为了解决相关技术确定的预测数据的准确度较低的问题,本申请提供了一种数据处理方法及装置。所述技术方案如下:第一方面,提供了一种数据处理方法,所述方法包括:获取多个特征数据;自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;根据多个目标数据确定预测数据,所述多个目标数据包括所述两组处理数据。相关技术中对多个特征数据进行一种非线性组合处理(高阶非线性组合处理)能够得到的一组处理数据(包括至少一个高阶数据);而本申请能够自动对多个特征数据进行两种不同的非线性组合处理(高阶非线性组合处理和低阶非线性组合处理)并得到两组处理数据。也即是,本申请中得到的两组处理数据的数据量大于相关技术中得到的一组处理数据的数据量,且准确的预测需要基于大量的数据来实现,因此,本申请中基于两组处理数据得到的预测数据的准确度高于相关技术中基于一组处理数据得到的预测数据的准确度。可选的,所述自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,包括:自动对所述多个特征数据进行高阶非线性组合处理,得到所述一组高阶数据;自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据。需要说明的是,在获取到多个特征数据后,如果对该多个特征数据中的一部分特征数据进行高阶非线性组合处理得到的高阶数据的个数为第一个数,对该多个特征数据中的另一部分特征数据进行低阶非线性组合处理得到的低阶数据的个数为第二个数,则最终确定预测数据所基于的目标数据的个数等于第一个数与第二个数之和。如果对该多个数据进行高阶非线性组合处理,则得到的高阶数据的个数大于第一个数,且对该多个数据也进行低阶非线性组合处理,则得到的低阶数据的个数大于第二个数,且最终确定预测数据所基于的目标数据的个数也大于第一个数与第二个数之和。也即是,在对多个特征数据分别进行高阶非线性组合处理以及低阶非线性组合处理时,最终确定预测数据所基于的目标数据的个数就会较多,预测数据的准确度就会越高。可选的,在所述获取多个特征数据之后,所述方法还包括:自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,所述第一辅助数据与所述多个特征数据中的至少两个特征数据的线性组合相关,所述多个目标数据还包括:所述至少一个第一辅助数据。也即是,本申请不仅能够对多个特征数据进行高阶非线性组合处理以及低阶非线性组合处理,并且还能够对多个特征数据进行线性组合处理,得到一组第一辅助数据,从而进一步的增多了最终确定预测数据所基于的目标数据的个数,进一步提高了预测数据的准确度。可选的,所述自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据,包括:通过基于因子分解机FM的处理模块自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据;所述自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,包括:通过基于FM的处理模块,自动对所述多个特征数据进行线性组合处理,得到所述一组第一辅助数据;或者,所述自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据,包括:通过基于域感知分解机FFM的处理模块,自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据;所述自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,包括:通过基于FFM的处理模块,自动对所述多个特征数据进行线性组合处理,得到所述一组第一辅助数据。可选的,在所述根据多个目标数据确定预测数据之前,所述方法还包括:结合专家经验以及所述多个特征数据,确定x个经验特征数据,x≥1,所述x个经验特征数据包括:结合专家经验在所述多个特征数据中获取到的数据,和/或,结合专家经验对所述多个特征数据中的至少两个特征数据进行非线性组合处理得到数据;自动对所述x个经验特征数据进行处理,得到一组第二辅助数据,所述多个目标数据还包括:所述一组第二辅助数据,其中,当x=1时,所述第二辅助数据与一个经验特征数据相关,当x>1时,所述第二辅助数据与所述x个经验特征数据中的至少两个经验特征数据的线性组合相关,和/或,所述第二辅助数据与所述x个经验特征数据中的至少两个经验特征数据的非线性组合相关。也即是,本申请能够根据专家经验的指导,确定对预测数据影响较大的x个经验特征数据,并对x个经验特征数据进行处理得到的一组第二辅助数据。且最终确定预测数据所依据的目标数据还包括该第二辅助数据,从而进一步的增多了最终确定预测数据所基于的目标数据的个数,进一步提高了预测数据的准确度。可选的,所述多个特征数据为多个稀疏特征数据,在所述获取多个特征数据之后,所述方法包括:将所述多个稀疏特征数据,转换为多个稠密特征数据;所述自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,包括:自动对所述多个稠密特征数据进行两种不同的非线性组合处理得到所述两组处理数据。也即是,本申请在获取到多个稀疏特征数据后,还能够对该多个稀疏特征数据进行转换,得到多个稠密特征数据,且稠密特征数据的数据量远小于稀疏特征数据的数据量,对多个稠密特征数据进行处理的效率高于对多个稀疏特征数据进行处理的效率。第二方面,提供了一种数据处理装置,所述数据处理装置包括:获取单元,用于获取多个特征数据;非线性处理单元,用于自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;预测单元,用于根据多个目标数据确定预测数据,所述多个目标数据包括所述两组处理数据。可选的,所述非线性处理单元包括:高阶处理子单元,用于自动对所述多个特征数据进行高阶非线性组合处理,得到所述一组高阶数据;低阶处理本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:获取多个特征数据;自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;根据多个目标数据确定预测数据,所述多个目标数据包括所述两组处理数据。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取多个特征数据;自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;根据多个目标数据确定预测数据,所述多个目标数据包括所述两组处理数据。2.根据权利要求1所述的方法,其特征在于,所述自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,包括:自动对所述多个特征数据进行高阶非线性组合处理,得到所述一组高阶数据;自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据。3.根据权利要求1或2所述的方法,其特征在于,在所述获取多个特征数据之后,所述方法还包括:自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,所述第一辅助数据与所述多个特征数据中的至少两个特征数据的线性组合相关,所述多个目标数据还包括:所述至少一个第一辅助数据。4.根据权利要求3所述的方法,其特征在于,所述自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据,包括:通过基于因子分解机FM的处理模块自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据;所述自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,包括:通过基于FM的处理模块,自动对所述多个特征数据进行线性组合处理,得到所述一组第一辅助数据;或者,所述自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据,包括:通过基于域感知分解机FFM的处理模块,自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据;所述自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,包括:通过基于FFM的处理模块,自动对所述多个特征数据进行线性组合处理,得到所述一组第一辅助数据。5.根据权利要求1或2所述的方法,其特征在于,在所述根据多个目标数据确定预测数据之前,所述方法还包括:结合专家经验以及所述多个特征数据,确定x个经验特征数据,x≥1,所述x个经验特征数据包括:结合专家经验在所述多个特征数据中获取到的数据,和/或,结合专家经验对所述多个特征数据中的至少两个特征数据进行非线性组合处理得到数据;自动对所述x个经验特征数据进行处理,得到一组第二辅助数据,所述多个目标数据还包括:所述一组第二辅助数据;其中,当x=1时,所述第二辅助数据与一个经验特征数据相关;当x>1时,所述第二辅助数据与所述x个经验特征数据中的至少两个经验特征数据的线性组合相关,和/或,所述第二辅助数据与所述x个经验特征数据中的至少两个经验特征数据的非线性组合相关。6.根据权利要求1或2所述的方法,其特征在于,所述多个特征数据为多个稀疏特征数据,在所述获取多个特征数据之后,所述方法包括:将所述多个稀疏特征数据,转换为多个稠密特征...

【专利技术属性】
技术研发人员:唐睿明郭慧丰李震国何秀强
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1