用户特征数据的计算方法和装置制造方法及图纸

技术编号:14290666 阅读:62 留言:0更新日期:2016-12-25 20:58
本申请公开了一种用户特征数据的计算方法,包括:获取用户的活动数据,并根据用户的活动数据确定与用户关联的多个关联用户;根据用户的活动数据分别建立用户与多个关联用户之间的多个特征向量,并根据多个特征向量分别计算用户与多个关联用户之间的多个关联度;根据多个关联度从多个关联用户中选择多个参考用户;以及根据多个参考用户计算用户的特征数据。该方法针对互联网中的海量数据进行了筛选,通过选取与用户最相关的多个关联用户的活动数据进行特征数据的计算,减少了数据的计算量,提高了计算速度。本申请还公开了一种用户特征数据的计算装置。

【技术实现步骤摘要】

本申请涉及互联网
,尤其涉及一种用户特征数据的计算方法和装置
技术介绍
目前,互联网中会记录用户的活动数据,通过用户的活动数据可以计算出用户的特征数据,例如,用户的喜好、活动轨迹、消费能力等。但往往由于互联网中记录的单个用户的数据量过少(如数据缺失或非常稀疏等),所以可能会导致用户特征数据的计算不准确,而整个互联网中记录的所有的用户活动数据量又过多,无法从中筛选出用于某一个用户特征数据计算的关联活动数据,或由于互联网的数据量过大,导致运算速度过慢等。
技术实现思路
本申请的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本申请的第一个目的在于提出一种用户特征数据的计算方法,该方法针对互联网中的海量数据进行了筛选,通过选取与用户最相关的多个关联用户的活动数据进行特征数据的计算,减少了数据的计算量,提高了计算速度。本申请的第二个目的在于提出一种用户特征数据的计算装置。为了实现上述目的,本申请第一方面实施例的用户特征数据的计算方法,包括:获取用户的活动数据,并根据所述用户的活动数据确定与所述用户关联的多个关联用户;根据所述用户的活动数据分别建立所述用户与所述多个关联用户之间的多个特征向量,并根据所述多个特征向量分别计算所述用户与所述多个关联用户之间的多个关联度;根据所述多个关联度从所述多个关联用户中选择多个参考用户;以及根据所述多个参考用户计算所述用户的特征数据。本申请实施例的用户特征数据的计算方法,可先获取用户的活动数据,并根据用户的活动数据确定与用户关联的多个关联用户,之后可根据用户的活动数据分别建立用户与多个关联用户之间的多个特征向量,并根据多个特征向量分别计算用户与多个关联用户之间的多个关联度,然后,可根据多个关联度从多个关联用户中选择多个参考用户,最后,可根据多个参考用户计算用户的特征数据,即通过针对互联网中的海量数据进行了筛选,通过选取与用户最相关的多个关联用户的活动数据进行特征数据的计算,减少了数据的计算
量,提高了计算速度。为了实现上述目的,本申请第二方面实施例的用户特征数据的计算装置,包括:获取模块,用于获取用户的活动数据,并根据所述用户的活动数据确定与所述用户关联的多个关联用户;第一计算模块,用于根据所述用户的活动数据分别建立所述用户与所述多个关联用户之间的多个特征向量,并根据所述多个特征向量分别计算所述用户与所述多个关联用户之间的多个关联度;选择模块,用于根据所述多个关联度从所述多个关联用户中选择多个参考用户;以及第二计算模块,用于根据所述多个参考用户计算所述用户的特征数据。本申请实施例的用户特征数据的计算装置,可通过获取模块获取用户的活动数据,并根据用户的活动数据确定与用户关联的多个关联用户,第一计算模块根据用户的活动数据分别建立用户与多个关联用户之间的多个特征向量,并根据多个特征向量分别计算用户与多个关联用户之间的多个关联度,选择模块根据多个关联度从多个关联用户中选择多个参考用户,第二计算模块根据多个参考用户计算用户的特征数据,即通过针对互联网中的海量数据进行了筛选,通过选取与用户最相关的多个关联用户的活动数据进行特征数据的计算,减少了数据的计算量,提高了计算速度。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,图1是根据本申请一个实施例的用户特征数据的计算方法的流程图;图2是根据本申请另一个实施例的用户特征数据的计算方法的流程图;图3是根据本申请一个实施例的用户特征数据的计算装置的结构示意图;图4是根据本申请一个实施例的第二计算模块的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的用户特征数据的计算方法和装置。图1是根据本申请一个实施例的用户特征数据的计算方法的流程图。如图1所示,该用户特征数据的计算方法可以包括:S101,获取用户的活动数据,并根据用户的活动数据确定与用户关联的多个关联用户。其中,在本申请的实施例中,用户的活动数据可理解为用户在互联网中进行操作(例如,搜索操作、广告选择操作、浏览操作等)时所返回的结果。可以基于对历史用户的行为数据的经验观察以及历史用户的社交活动数据来理解用户的活动数据。具体地,可先获取用户的活动数据,之后可根据用户的活动数据找到与该用户的活动数据有关联的多个用户,以作为该用户的多个关联用户。例如,以活动数据为用户X0选择查看某个广告为例,可根据该活动数据找到其他同样选择查看该广告的用户Xi,并将这些用户Xi作为与用户X0关联的多个关联用户Xi。可以理解,关联用户可以是该用户的社会关系圈中的好友,还可以是与该用户的活动数据有关联的陌生人。S102,根据用户的活动数据分别建立用户与多个关联用户之间的多个特征向量,并根据多个特征向量分别计算用户与多个关联用户之间的多个关联度。具体而言,在本申请的实施例中,可先分别从用户的活动数据中挑选出用户与每个关联用户之间的多个特征变量,并将多个特征变量进行组合以建立用户与每个关联用户之间的特征向量;对用户与每个关联用户之间的特征向量进行数值化和归一化处理,并根据数值化和归一化处理之后的用户与每个关联用户之间的特征向量,及特征向量中的每个特征变量的预设权重值,计算用户与每个关联用户之间的关联度。其中,在本申请的实施例中,特征向量可包括但不限于活动数据的用途、活动数据的发生地、活动数据的大小和活动数据的发生次数等。更具体地,可先从用户的活动数据中挑选出用户X0与关联用户Xi之间有关联的信息(即关联的活动数据)以作为用户X0与关联用户Xi之间的特征变量,并将这些变量组合以建立用户X0与关联用户Xi之间的特征向量,即该特征向量中的元素可分别为用户X0与关联用户Xi之间关联的活动数据的用途、用户X0与关联用户Xi之间关联的活动数据的发生地、用户X0与关联用户Xi之间关联的活动数据的大小和用户X0与关联用户Xi之间关联的活动数据的发生次数等。然后,可对用户X0与关联用户Xi之间的特征向量进行数值化和归一化处理,并根据数值化和归一化处理之后的特征向量及特征向量中的每个特征变量的权重值,计算出用户X0与关联用户Xi之间关联度。可以理解,关联度越大,表示用户X0与关联用户Xi的关系越亲密。例如,以用户X0与关联用户Xi之间的特征向量为I={A,B,C,D本文档来自技高网
...
用户特征数据的计算方法和装置

【技术保护点】
一种用户特征数据的计算方法,其特征在于,包括以下步骤:获取用户的活动数据,并根据所述用户的活动数据确定与所述用户关联的多个关联用户;根据所述用户的活动数据分别建立所述用户与所述多个关联用户之间的多个特征向量,并根据所述多个特征向量分别计算所述用户与所述多个关联用户之间的多个关联度;根据所述多个关联度从所述多个关联用户中选择多个参考用户;以及根据所述多个参考用户计算所述用户的特征数据。

【技术特征摘要】
1.一种用户特征数据的计算方法,其特征在于,包括以下步骤:获取用户的活动数据,并根据所述用户的活动数据确定与所述用户关联的多个关联用户;根据所述用户的活动数据分别建立所述用户与所述多个关联用户之间的多个特征向量,并根据所述多个特征向量分别计算所述用户与所述多个关联用户之间的多个关联度;根据所述多个关联度从所述多个关联用户中选择多个参考用户;以及根据所述多个参考用户计算所述用户的特征数据。2.如权利要求1所述的用户特征数据的计算方法,其特征在于,根据所述用户的活动数据分别建立所述用户与所述多个关联用户之间的多个特征向量,并根据所述多个特征向量分别计算所述用户与所述多个关联用户之间的多个关联度具体包括:分别从所述用户的活动数据中挑选出所述用户与每个关联用户之间的多个特征变量,并将所述多个特征变量进行组合以建立所述用户与所述每个关联用户之间的特征向量;对所述用户与所述每个关联用户之间的特征向量进行数值化和归一化处理,并根据数值化和归一化处理之后的所述用户与所述每个关联用户之间的特征向量,及所述特征向量中的每个特征变量的预设权重值,计算所述用户与所述每个关联用户之间的关联度。3.如权利要求1所述的用户特征数据的计算方法,其特征在于,根据所述多个关联度从所述多个关联用户中选择多个参考用户具体包括:根据所述多个关联度对所述多个关联用户进行排序,并根据排序结果选择关联度最大的多个关联用户作为所述多个参考用户。4.如权利要求1所述的用户特征数据的计算方法,其特征在于,所述特征向量包括活动数据的用途、活动数据的发生地、活动数据的大小和活动数据的发生次数。5.如权利要求1-4中任一项所述的用户特征数据的计算方法,其特征在于,根据所述多个参考用户计算所述用户的特征数据具体包括:获取所述多个参考用户的特征数据;以及根据所述用户与所述多个参考用户之间的关联...

【专利技术属性】
技术研发人员:焦瑜净孔令西何勇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1