一种数据分析处理方法及系统技术方案

技术编号:14173354 阅读:96 留言:0更新日期:2016-12-13 01:28
本发明专利技术公开了一种数据分析处理方法及系统,其中,数据分析处理方法包括:获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;将所述抽样数据进行分割并行处理,得到分割处理结果;将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。通过本发明专利技术提供的方法,能够获取用户行为数据以及网站的产品公开数据,并按照设定的数学模型对待分析数据进行高效并行处理,挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。

Data analysis processing method and system

The invention discloses a data processing method and system, which includes data processing methods: to acquire the data analysis and processing, and the sample processing and analysis of data processing, get the data sampling; sampling data segmentation parallel processing, get segmentation results; the segmentation results combined treatment, product data analysis after the combined treatment. The method provided by the invention, the public product data to obtain user behavior data and web site, and according to the mathematical model to analysis data of parallel processing, dig out the valuable information and knowledge products, product sales data to obtain the high accuracy of the analysis results of electronic business platform.

【技术实现步骤摘要】

本专利技术涉及电子商务
,具体涉及一种数据分析处理方法及系统
技术介绍
目前,电子商务类网站大数据商品推送给在线购买者,通过分析用户点击行为、购买行为、产品相关性、偏好及使用时间规律推送相应的商品及促销信息。目前,电商的数据分析,仅限于各大电商网站内部,对自身数据本身的分析,现有技术中,无法做到对于全网全部电商数据的横向挖掘,更没有结合全网用户访问行为,进行相关分析。对于全网电商数据的抓取,涉及数据量巨大,而且需要将不同电商网站的非结构化数据,解析成结构化数据,无论从数据量本身、数据的抓取还是解析都有着极大的难度。
技术实现思路
本专利技术所要解决的技术问题是提供一种数据分析处理方法及系统,能够挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。本专利技术解决上述技术问题的技术方案如下:依据本专利技术的一个方面,提供了一种数据分析处理方法,所述方法包括:S101、获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;S102、将所述抽样数据进行分割并行处理,得到分割处理结果;S103、将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。依据本专利技术的另一个方面,提供了一种数据分析处理系统,所述系统包括:抽样处理单元,用于获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;分割处理单元,用于将所述抽样数据进行分割并行处理,得到分割处理结果;合并处理单元,用于将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。本专利技术提供的一种数据分析处理方法及系统,能够获取用户行为数据以及网站的产品公开数据,并按照设定的数学模型对待分析数据进行高效并行处理,挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。附图说明图1为本专利技术实施例一的一种数据分析处理方法流程图;图2为本专利技术实施例二的一种数据分析处理系统示意图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。实施例一、一种数据分析处理方法。下面结合图1对本实施例提供的方法进行详细说明。参见图1,S101、获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据。具体的,获取待分析处理数据,并对所述待分析处理数据进行抽样处理,将分布的异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载,得到抽样数据。其中,所述待分析处理数据具体包括用户行为数据以及电子网站的公开数据;所述用户行为数据至少包括用户浏览历史数据以及购买产品的行为数据;所述电子网站的公开数据至少包括产品评论数据、产品排名数据以及产品访问数据。S102、将所述抽样数据进行分割并行处理,得到分割处理结果。具体的,将所述抽样数据进行分割,按照预置的数学模型并行计算处理分割后的抽样数据,得到分割处理结果。分割并行处理能够提高数据的处理速度。具体根据根据业务规则和算法规则建立预置数学模型。其中,所述算法规则包括聚类、分类算法、关联规则以及时间序列;所述业务规则,包括通过产品评论数据、产品排名数据和产品访问量数据分别统计出产品的销量,对产品评论数据、产品排名数据和产品访问量数据取中位数,作为置信度最高的销量值。S103、将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。具体的,将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果,将其作为电商平台的产品销量数据分析结果。实施例二、一种数据分析处理系统。下面结合图2对本实施例提供的系统进行详细说明。图2中,本实施例提供的系统包括抽样处理单元201、分割处理单元202、合并处理单元203以及模型建立单元204。所述抽样处理单元201,用于获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据。具体的,所述抽样处理单元201获取待分析处理数据,并对所述待分析处理数据进行抽样处理,将分布的异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载,得到抽样数据。其中,所述待分析处理数据具体包括用户行为数据以及电子网站的公开数据;所述用户行为数据至少包括用户浏览历史数据以及购买产品的行为数据;所述电子网站的公开数据至少包括产品评论数据、产品排名数据以及产品访问数据。所述分割处理单元202,用于将所述抽样数据进行分割并行处理,得到分割处理结果。所述模型建立单元204,用于具体的,所述分割处理单元202将所述抽样数据进行分割,按照预置的数学模型并行计算处理分割后的抽样数据,得到分割处理结果,分割并行处理能够提高数据的处理速度。所述模型建立单元204根据根据业务规则和算法规则建立预置数学模型。其中,所述算法规则包括聚类、分类算法、关联规则以及时间序列;所述业务规则,包括通过产品评论数据、产品排名数据和产品访问量数据分别统计出产品的销量,对产品评论数据、产品排名数据和产品访问量数据取中位数,作为置信度最高的销量值。所述合并处理单元203,用于将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。具体的,所述合并处理单元203将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果,将其作为电商平台的产品销量数据分析结果。具体的,所述抽样处理单元201获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;所述分割处理单元202将所述抽样数据进行分割并行处理,得到分割处理结果;所述合并处理单元203将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。本专利技术提供的一种数据分析处理方法及系统,能够获取用户行为数据以及网站的产品公开数据,并按照设定的数学模型对待分析数据进行高效并行处理,挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。以上所述仅为本专利技术的较佳实施例,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
一种数据分析处理方法及系统

【技术保护点】
一种数据分析处理方法,其特征在于,所述方法包括:S101、获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;S102、将所述抽样数据进行分割并行处理,得到分割处理结果;S103、将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。

【技术特征摘要】
1.一种数据分析处理方法,其特征在于,所述方法包括:S101、获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;S102、将所述抽样数据进行分割并行处理,得到分割处理结果;S103、将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。2.如权利要求1所述的一种数据分析处理方法,其特征在于,所述S101中所述待分析处理数据具体包括用户行为数据以及电子网站的公开数据;所述用户行为数据至少包括用户浏览历史数据以及购买产品的行为数据;所述电子网站的公开数据至少包括产品评论数据、产品排名数据以及产品访问数据。3.如权利要求2所述的一种数据分析处理方法,其特征在于,所述S101中对所述待分析处理数据进行抽样处理具体包括:将分布的异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载。4.如权利要求3所述的一种数据分析处理方法,其特征在于,所述S102具体包括:将所述抽样数据进行分割,按照预置的数学模型并行计算处理分割后的抽样数据,得到分割处理结果。5.如权利要求4所述的一种数据分析处理方法,其特征在于,所述S102之前还包括:根据业务规则和算法规则建立预置数学模型。6.一种数...

【专利技术属性】
技术研发人员:李德华
申请(专利权)人:武汉合创源科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1