当前位置: 首页 > 专利查询>湖北大学专利>正文

一种物联网电子商务购物数据的处理方法及系统技术方案

技术编号:15054513 阅读:103 留言:0更新日期:2017-04-06 00:34
本发明专利技术公开了一种物联网电子商务购物数据的处理方法及系统。其中,该方法至少包括:对用户数据进行分组;获得与目标用户最相似的分组用户数据;根据所述最相似的分组用户数据得到所述目标用户的评分数据,从而增加了目标用户的评价数据。此外,本发明专利技术通过对用户数据进行分组,以组为单位进行数据分析,因而减少了计算量,进而缩短了运算的时间。

【技术实现步骤摘要】

本专利技术涉及数据处理
,尤其涉及一种物联网电子商务购物数据的处理方法及系统。
技术介绍
目前,RecSys(RecommenderSystems,推荐系统)被广泛应用于各电子商务平台中。而CF算法(CollaborativeFiltering,协同过滤算法)是应用到RecSys中最广泛的技术之一,并作为RecSys的核心算法。CF算法需要根据用户的历史行为找出用户的偏好,而不依赖于项目的特征属性,就可以产生推荐。现如今,电子商务系统的规模和用户数量正急剧扩大,诸如用户评分矩阵之类的评分信息也庞大起来,而CF算法的一些问题也逐步暴露出来,算法质量逐渐下降。主要问题描述如下:(1)数据稀疏性问题数据稀疏性问题是CF算法长期以来都没有很好解决的主要问题。CF算法的有效运行依赖于的用户评分矩阵数据。就总体而言,用户的评价数据非常庞大,而且对于电子商务平台来说,也比较容易获得,但是就单个用户而言,因其个人时间或者其个人习惯,评价数据往往是极少的。较少的评价数据难以构建丰富的用户项目评价矩阵,从而通过算法计算出来的用户或者是项目的相似度往往是不准确的,进而产生的推荐往往也不能引起用户的兴趣。(2)扩展性问题运算时间是衡量算法质量的重要指标之一,如果用户和项目的数量太庞大,系统服务器就无法在短时间内计算大量的数据,这样便会直接影响到协同过滤算法的运算时间,也会影响到用户体验,致使用户减少。用户减少又会使系统收集到的数据减少,这样恶性循环,最后会造成整个RecSys的性能下降。
技术实现思路
本专利技术通过提供一种物联网电子商务购物数据的处理方法及系统,解决了现有技术中的数据稀疏性问题和扩展性问题,实现了增加用户的评价数据和减少计算量的技术效果。本专利技术提供了一种物联网电子商务购物数据的处理方法,至少包括:对用户数据进行分组;获得与目标用户最相似的分组用户数据;根据所述最相似的分组用户数据得到所述目标用户的评分数据。进一步地,所述对用户数据进行分组,具体包括:获取用户数据;其中,所述用户数据至少包括:用户代号及该用户对项目的评分;根据所述用户代号或该用户对项目的评分对所述用户数据进行分组。进一步地,所述获得与目标用户最相似的分组用户数据,具体包括:基于所述用户对项目的评分得到各分组用户对项目的兴趣向量;计算所述各分组用户对项目的兴趣向量的相似性;根据所述兴趣向量的相似性得到各分组用户之间的相似性;通过所述各分组用户之间的相似性得到与所述目标用户最相似的分组用户,并得到所述最相似的分组用户的用户数据。进一步地,所述计算所述各分组用户对项目的兴趣向量的相似性,具体包括:基于公式计算得到所述各分组用户对项目a和项目b的兴趣向量的相似性。进一步地,所述通过所述各分组用户之间的相似性得到与所述目标用户最相似的分组用户,具体包括:选取与所述目标用户相似性最大的分组用户作为与所述目标用户最相似的分组用户。本专利技术提供的物联网电子商务购物数据的处理系统,至少包括:分组模块,用于对用户数据进行分组;数据获取模块,用于获得与目标用户最相似的分组用户数据;评分模块,用于根据所述最相似的分组用户数据得到所述目标用户的评分数据。进一步地,所述分组模块,具体包括:数据获取单元,用于获取用户数据;其中,所述用户数据至少包括:用户代号及该用户对项目的评分;分组执行单元,用于根据所述用户代号或该用户对项目的评分对所述用户数据进行分组。进一步地,所述数据获取模块,具体包括:第一数据处理单元,用于基于所述用户对项目的评分得到各分组用户对项目的兴趣向量;计算模块,用于计算所述各分组用户对项目的兴趣向量的相似性;第二数据处理单元,用于根据所述兴趣向量的相似性得到各分组用户之间的相似性;第三数据处理单元,用于通过所述各分组用户之间的相似性得到与所述目标用户最相似的分组用户,并得到所述最相似的分组用户的用户数据。进一步地,所述计算模块,具体用于基于公式计算得到所述各分组用户对项目a和项目b的兴趣向量的相似性。进一步地,所述第三数据处理单元,具体用于选取与所述目标用户相似性最大的分组用户作为与所述目标用户最相似的分组用户,并得到所述最相似的分组用户的用户数据。本专利技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:先对用户数据进行分组,再获得与目标用户最相似的分组用户数据,接着根据最相似的分组用户数据得到目标用户的评分数据,从而增加了目标用户的评价数据。此外,本专利技术通过对用户数据进行分组,以组为单位进行数据分析,因而减少了计算量,进而缩短了运算的时间。附图说明图1为本专利技术实施例提供的物联网电子商务购物数据的处理方法的流程图;图2为本专利技术实施例提供的物联网电子商务购物数据的处理系统的模块图。具体实施方式本专利技术实施例通过提供一种物联网电子商务购物数据的处理方法及系统,解决了现有技术中的数据稀疏性问题和扩展性问题,实现了增加用户的评价数据和减少计算量的技术效果。本专利技术实施例中的技术方案为解决上述技术问题,总体思路如下:先对用户数据进行分组,再获得与目标用户最相似的分组用户数据,接着根据最相似的分组用户数据得到目标用户的评分数据,从而增加了目标用户的评价数据。此外,本专利技术实施例通过对用户数据进行分组,以组为单位进行数据分析,因而减少了计算量,进而缩短了运算的时间。为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。参见图1,本专利技术实施例提供的物联网电子商务购物数据的处理方法,至少包括:步骤S110:对用户数据进行分组;对本步骤进行说明:获取用户数据;其中,用户数据至少包括:用户代号及该用户对项目的评分;根据用户代号或该用户对项目的评分对用户数据进行分组。这里需要说明的是,用户对项目的评分至少包括:用户对各项目的评分、用户对某几个项目评分的平均值及用户对所有项目的评分平均值。还需要说明的是,也可以根据本专利技术实施例所依托的系统的运算需求对用户数据进行分组。在系统用户数量大的时候,可以考虑将分组数增多;在系统用户数量少的时候,将分组减少;不能整除的剩余用户放入最后一组。步骤S120:获得与目标用户最相似的分组用户数据;对本步骤进行说明:基于用户对项目的评分得到各分组用户对项目的兴趣向量;将用户对n个项目的评分作为n维空间向量处理。向量都是有指向的,不同的指向代表用户对不同的项目的评价。向量都是有长度的,不同的长度表示用户对各项目的评分不同。计算各分组用户对项目的兴趣向量的相似性;在本实施例中,计算各分组用户对项目的兴趣向量的相似性,具体包括:通过向量的指向可以判断两个向量之间的相似度,而向量之间的夹角可以用来反映向量指向的关系,该夹角可以通过其余弦值衡量,因此,可以基于公式计算得到各分组用户对项目a和项目b的兴趣向量的相似性。根据兴趣向量的相似性得到各分组用户之间的相似性;通过各分组用户之间的相似性得到与目标用户最相似的分组用户,并得到最相似的分组用户的用户数据。在本实施例中,通过各分组用户之间的相似性得到与目标用户最相似的分组用户,具体包括:选取与目标用户相似性最大的分组用户作为与目标用户最相似的分组用户。需要说明的是,还可以选取多个分组用户作为目标用户的最相似的分组用户集合。具体的方法包括:取相似性数值大于预设的用户本文档来自技高网...

【技术保护点】
一种物联网电子商务购物数据的处理方法,其特征在于,至少包括:对用户数据进行分组;获得与目标用户最相似的分组用户数据;根据所述最相似的分组用户数据得到所述目标用户的评分数据。

【技术特征摘要】
1.一种物联网电子商务购物数据的处理方法,其特征在于,至少包括:对用户数据进行分组;获得与目标用户最相似的分组用户数据;根据所述最相似的分组用户数据得到所述目标用户的评分数据。2.如权利要求1所述的方法,其特征在于,所述对用户数据进行分组,具体包括:获取用户数据;其中,所述用户数据至少包括:用户代号及该用户对项目的评分;根据所述用户代号或该用户对项目的评分对所述用户数据进行分组。3.如权利要求2所述的方法,其特征在于,所述获得与目标用户最相似的分组用户数据,具体包括:基于所述用户对项目的评分得到各分组用户对项目的兴趣向量;计算所述各分组用户对项目的兴趣向量的相似性;根据所述兴趣向量的相似性得到各分组用户之间的相似性;通过所述各分组用户之间的相似性得到与所述目标用户最相似的分组用户,并得到所述最相似的分组用户的用户数据。4.如权利要求3所述的方法,其特征在于,所述计算所述各分组用户对项目的兴趣向量的相似性,具体包括:基于公式计算得到所述各分组用户对项目a和项目b的兴趣向量的相似性。5.如权利要求3所述的方法,其特征在于,所述通过所述各分组用户之间的相似性得到与所述目标用户最相似的分组用户,具体包括:选取与所述目标用户相似性最大的分组用户作为与所述目标用户最相似的分组用户。6.一种物联网电子商务购物数据的处理系统,...

【专利技术属性】
技术研发人员:黄辰王时绘张龑
申请(专利权)人:湖北大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1