This application discloses a data processing method and device, which belongs to the field of computer technology. The method includes: acquiring multi-feature data; automatically processing multi-feature data with two different non-linear combinations to obtain two sets of processing data. The two sets of processing data include a set of high-order data and a set of low-order data. The high-order data is related to the non-linear combination of M feature data in multi-feature data, and the low-order data is related to n feature numbers in multi-feature data. According to the non-linear combination correlation, m > 3, m > n > 2. Predictive data are determined according to multiple target data, and multiple target data include two groups of processing data. The application solves the problem of low accuracy of predicted data determined by relevant technology, and improves the accuracy of predicted data. The application is used for data processing.
【技术实现步骤摘要】
数据处理方法及装置
本申请涉及计算机
,特别涉及一种数据处理方法及装置。
技术介绍
随着计算机技术的发展,人们在对可动态变化的事物(例如某一网站的访问次数、某一文件的下载量、应用商城中某一应用的图标的点击率或视频网站中某一视频的点击率)进行分析时,通常可以获取事物的多个特征数据(特征数据用于表征事物的属性),并对该多个特征数据进行处理,得到用于表征该事物的发展方向的预测数据。相关技术中,人们可以向数据处理装置输入事物的多个特征数据,数据处理装置能够对事物的多个特征数据进行高阶非线性组合处理,得到多个高阶数据,并根据该多个高阶数据确定预测数据,其中,高阶数据为该多个特征数据中至少三个特征数据的非线性组合。例如,数据处理装置可以对应用商城中某一应用的多个特征数据进行高阶非线性组合处理,得到用于表征该应用的图标的点击率的预测数据,根据该预测数据可以确定该应用的推荐优先级。由于相关技术中的预测数据是数据处理装置基于多个高阶数据得到的,而准确的预测需要基于大量的数据来实现,上述多个高阶数据的数据量依然无法满足准确预测需求,因此,相关技术确定的预测数据的准确度较低。
技术实现思路
为了解决相关技术确定的预测数据的准确度较低的问题,本申请提供了一种数据处理方法及装置。所述技术方案如下:第一方面,提供了一种数据处理方法,所述方法包括:获取多个特征数据;自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:获取多个特征数据;自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;根据多个目标数据确定预测数据,所述多个目标数据包括所述两组处理数据。
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取多个特征数据;自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,其中,所述两组处理数据包括一组高阶数据和一组低阶数据,所述高阶数据与所述多个特征数据中m个特征数据的非线性组合相关,所述低阶数据与所述多个特征数据中n个特征数据的非线性组合相关,m≥3,m>n≥2;根据多个目标数据确定预测数据,所述多个目标数据包括所述两组处理数据。2.根据权利要求1所述的方法,其特征在于,所述自动对所述多个特征数据进行两种不同的非线性组合处理得到两组处理数据,包括:自动对所述多个特征数据进行高阶非线性组合处理,得到所述一组高阶数据;自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据。3.根据权利要求1或2所述的方法,其特征在于,在所述获取多个特征数据之后,所述方法还包括:自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,所述第一辅助数据与所述多个特征数据中的至少两个特征数据的线性组合相关,所述多个目标数据还包括:所述至少一个第一辅助数据。4.根据权利要求3所述的方法,其特征在于,所述自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据,包括:通过基于因子分解机FM的处理模块自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据;所述自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,包括:通过基于FM的处理模块,自动对所述多个特征数据进行线性组合处理,得到所述一组第一辅助数据;或者,所述自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据,包括:通过基于域感知分解机FFM的处理模块,自动对所述多个特征数据进行低阶非线性组合处理,得到所述一组低阶数据;所述自动对所述多个特征数据进行线性组合处理,得到一组第一辅助数据,包括:通过基于FFM的处理模块,自动对所述多个特征数据进行线性组合处理,得到所述一组第一辅助数据。5.根据权利要求1或2所述的方法,其特征在于,在所述根据多个目标数据确定预测数据之前,所述方法还包括:结合专家经验以及所述多个特征数据,确定x个经验特征数据,x≥1,所述x个经验特征数据包括:结合专家经验在所述多个特征数据中获取到的数据,和/或,结合专家经验对所述多个特征数据中的至少两个特征数据进行非线性组合处理得到数据;自动对所述x个经验特征数据进行处理,得到一组第二辅助数据,所述多个目标数据还包括:所述一组第二辅助数据;其中,当x=1时,所述第二辅助数据与一个经验特征数据相关;当x>1时,所述第二辅助数据与所述x个经验特征数据中的至少两个经验特征数据的线性组合相关,和/或,所述第二辅助数据与所述x个经验特征数据中的至少两个经验特征数据的非线性组合相关。6.根据权利要求1或2所述的方法,其特征在于,所述多个特征数据为多个稀疏特征数据,在所述获取多个特征数据之后,所述方法包括:将所述多个稀疏特征数据,转换为多个稠密特征...
【专利技术属性】
技术研发人员:唐睿明,郭慧丰,李震国,何秀强,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。