基于大数据的用户偏好分析识别方法技术

技术编号:35231033 阅读:22 留言:0更新日期:2022-10-15 10:52
本发明专利技术涉及电数字数据处理技术领域,具体涉及一种基于大数据的用户偏好分析识别方法。该方法包括:获取用户历史上的浏览记录,其中历史上的浏览记录中浏览后购买的浏览记录为购买行为;获得多个聚类簇,将索引相关的聚类簇进行连接获得偏好链,其中一种完整设备对应一个偏好链,偏好链的起点为完整设备的购买行为对应的聚类簇;获得偏好链的第一决策力、第二决策力和第三决策力;基于待对比聚类簇和对应的偏好链之间第一、第二和第三决策的差异获得待对比聚类簇和对应的偏好链的差异程度;基于所述差异程度分析用户的偏好,并确定产品推荐策略。本发明专利技术能够精确的定位用户当前的偏好,根据偏好设置适合用户的产品推荐策略。根据偏好设置适合用户的产品推荐策略。根据偏好设置适合用户的产品推荐策略。

【技术实现步骤摘要】
基于大数据的用户偏好分析识别方法


[0001]本专利技术涉及电数字数据处理
,具体涉及一种基于大数据的用户偏好分析识别方法。

技术介绍

[0002]当用户在浏览商品的详情页时,系统会把详情页中这件商品信息存储起来,作为该用户的浏览记录,也叫做浏览日志。这些实时流数据作为大数据的一种,为网站经营者提供了具有商业价值的用户偏好描摹,系统根据描摹来推送相关的偏好产品及资讯,并通过统计分析长期的浏览数据,帮助经营者更好的聚焦客户需求,制定营销策划。
[0003]现有常见的用户偏好分析方法在通过挖掘零售类产品的历史浏览日志中的数据来获得信息时,更多关注的是用来评估用户的个人消费力水平,而在对用户所需要的产品种类、款式等进行预测时更依赖的是实时的浏览数据,也即是当前用户的点击量和页面停留时长等;但是对于工业设备类的产品进行销售时,对其运营网站来说,产品的类别较少,实时的浏览数据是比较单薄的,因此实时数据的参考性可能是比较低的,此时若还仅仅只根据当前的用户的实时浏览数据来定位用户的偏好,则会导致定位的结果并不理想,从而使得最后根据定位的偏好改变运营网站的推荐策略时,改变的推荐策略达到的效果并不理想。

技术实现思路

[0004]为了解决上述技术问题,本专利技术的目的在于提供一种基于大数据的用户偏好分析识别方法,所采用的技术方案具体如下:本专利技术一个实施例提供了一种基于大数据的用户偏好分析识别方法:获取用户历史上的浏览记录,其中历史上的浏览记录中浏览后购买的浏览记录为购买行为;以每个购买行为为聚类中心点,完成每个购买行为的时段内的相关的浏览记录为聚类点进行聚类获得多个聚类簇;若两个聚类簇的购买行为购买的产品为一个完整设备的配件产品,则这两个聚类簇的索引相关;将索引相关的聚类簇进行连接获得偏好链,其中一种完整设备对应一个偏好链,偏好链的起点为完整设备的购买行为对应的聚类簇;一条偏好链上所有聚类簇中第一条浏览记录开始时间和最后一条浏览记录结束时间的比值的平均值为该条偏好链的第一决策力;一条偏好链上所有聚类簇的浏览记录的时长的方差的和的均值为该偏好链的第二决策力;基于一条偏好链上每个聚类簇内每款产品的浏览记录数量和聚类簇内总的浏览记录数量获得该偏好链的第三决策力;以用户当前的浏览记录为聚类中心点,预设时段内的浏览记录为聚类点进行聚类获得待对比聚类簇;根据当前的浏览记录浏览的产品所属的完整设备确定待对比聚类簇对应的偏好链;计算待对比聚类簇的第一、第二和第三决策力,基于待对比聚类簇和对应的偏好链之间第一、第二和第三决策的差异获得待对比聚类簇和对应的偏好链的差异程度;基于所述差异程度分析用户的偏好,并确定产品推荐策略。
[0005]优选地,浏览记录包括:一条浏览记录包括所浏览的产品的信息和浏览的时间信息。
[0006]优选地,以每个购买行为为聚类中心点,完成每个购买行为的时段内的相关的浏览记录为聚类点进行聚类获得多个聚类簇,包括:所述完成每个购买行为的时段为在购买一类产品时,从开始浏览该类产品到购买结束后停止浏览该类产品的时间段;所述相关的浏览记录表示在完成一个购买行为的时段内用户的每个浏览记录浏览的产品与购买行为购买的产品类别相同。
[0007]优选地,第三决策力为:其中,表示第三决策力;表示偏好链中聚类簇的数量;e表示自然常数;表示与购买行为购买的产品的相同类别的产品的最大款式数量;表示偏好链中第i个聚类簇内与购买行为购买的产品相同类别的第款产品的浏览记录数量;表示第i个聚类簇中浏览记录的总数量;表示以e为底的对数函数。
[0008]优选地,以用户当前的浏览记录为聚类中心点,预设时段内的浏览记录为聚类点进行聚类获得待对比聚类簇,包括:用户当前的浏览记录为当前时刻用户正在浏览时的浏览记录或者为用户距离当前时刻最近的一次浏览记录;预设时段表示距离用户当前的浏览记录的一段时间。
[0009]优选地,差异程度为:其中,表示偏好链a和待对比聚类簇b的差异程度;和分别表示偏好链a和待对比聚类簇b的第一决策力;和分别表示偏好链a和待对比聚类簇b的第二决策力;和分别表示偏好链a和待对比聚类簇b的第三决策力;、、分别表示第一、第二和第三决策力的权重。
[0010]优选地,基于所述差异程度分析用户的偏好,并确定产品推荐策略包括:设定差异阈值,若差异程度小于差异阈值,用户当前的偏好特征与对应的偏好链中用户的偏好特征相似,推荐策略是为用户推荐与用户当前的偏好特征相似的偏好链中各购买行为购买的产品;若差异程度大于等于差异阈值,用户当前的偏好特征与对应的偏好链中用户的偏好特征不相似,推荐策略是为用户推荐多样化的产品。
[0011]本专利技术实施例至少具有如下有益效果:1.本专利技术通过对每个完整设备和相应的配件产品的历史浏览记录进行分析,以每个购买行为为聚类中心点进行聚类获得多个聚类簇,将每个完整设备的购买行为对应的聚类簇和其配件产品的购买行为对应的聚类簇进行连接能够得到每种完整设备对应的偏好链,由于一种完整设备的偏好链信息包含一种完整设备和其配件产品的历史浏览购买信
息,信息量比较全面,在依据其对用户的偏好进行分析时,能够比较全面且精确的定位用户的偏好;2.在利用用户当前的多个浏览记录具体分析用户的偏好时,通过当前浏览的产品属于哪个完整设备的配件产品获得用户当前的多个浏览记录对应的偏好链,计算获得对应的偏好链的第一、第二和第三决策力,同时基于用户当前的多个浏览记录的信息获得用户当前浏览产品时的第一、第二和第三决策力;对用户当前的多个浏览记录对应的偏好链和用户当前的多个浏览记录的第一、第二和第三决策力的差异进行分析,然后基于差异对用户当前的浏览行为的偏好进行定位,结合了历史数据,并且更偏向于用户在购买产品时的决策习惯,能够更深层次的描摹用户当前的决策力,提高用户偏好定位结果的精确程度。
附图说明
[0012]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0013]图1为本专利技术实施例提供的一种基于大数据的用户偏好分析识别方法的方法流程图。
具体实施方式
[0014]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种基于大数据的用户偏好分析识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
[0015]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0016]下面结合附图具体的说明本专利技术所提供的一种基于大数据的用户偏好分析识别方法的具体方案。
[0017]实施例:本专利技术的主要应用场景为:对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的用户偏好分析识别方法,其特征在于,该方法包括:获取用户历史上的浏览记录,其中历史上的浏览记录中浏览后购买的浏览记录为购买行为;以每个购买行为为聚类中心点,完成每个购买行为的时段内的相关的浏览记录为聚类点进行聚类获得多个聚类簇;若两个聚类簇的购买行为购买的产品为一个完整设备的配件产品,则这两个聚类簇的索引相关;将索引相关的聚类簇进行连接获得偏好链,其中一种完整设备对应一个偏好链,偏好链的起点为完整设备的购买行为对应的聚类簇;一条偏好链上所有聚类簇中第一条浏览记录开始时间和最后一条浏览记录结束时间的比值的平均值为该条偏好链的第一决策力;一条偏好链上所有聚类簇的浏览记录的时长的方差的和的均值为该偏好链的第二决策力;基于一条偏好链上每个聚类簇内每款产品的浏览记录数量和聚类簇内总的浏览记录数量获得该偏好链的第三决策力;以用户当前的浏览记录为聚类中心点,预设时段内的浏览记录为聚类点进行聚类获得待对比聚类簇;根据当前的浏览记录浏览的产品所属的完整设备确定待对比聚类簇对应的偏好链;计算待对比聚类簇的第一、第二和第三决策力,基于待对比聚类簇和对应的偏好链之间第一、第二和第三决策的差异获得待对比聚类簇和对应的偏好链的差异程度;基于所述差异程度分析用户的偏好,并确定产品推荐策略。2.根据权利要求1所述的一种基于大数据的用户偏好分析识别方法,其特征在于,所述浏览记录包括:一条浏览记录包括所浏览的产品的信息和浏览的时间信息。3.根据权利要求1所述的一种基于大数据的用户偏好分析识别方法,其特征在于,所述以每个购买行为为聚类中心点,完成每个购买行为的时段内的相关的浏览记录为聚类点进行聚类获得多个聚类簇,包括:所述完成每个购买行为的时段为在购买一类产品时,从开始浏览该类产品到购买结束后停止浏览该类产品的时间段;所述相关...

【专利技术属性】
技术研发人员:刘梅
申请(专利权)人:南通久拓智能装备有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1