一种用户偏好特征的识别方法及其装置制造方法及图纸

技术编号:35844134 阅读:22 留言:0更新日期:2022-12-07 10:23
本发明专利技术提供了一种用户偏好特征的识别方法及其装置,可解决车联网推荐系统的实时效率和性能问题,同时还能挖掘用户的潜在偏好特征。所述用户偏好特征的识别方法包括:获取车机端的用户数据,所述用户数据为采集到的表征用户日常的原始记录数据;清洗所述用户数据以过滤掉无效数据,以获得过滤后的结构化的有效用户数据;以及对所述有效用户数据进行聚类分析以获得用户偏好特征。析以获得用户偏好特征。析以获得用户偏好特征。

【技术实现步骤摘要】
一种用户偏好特征的识别方法及其装置


[0001]本专利技术涉及车机端的数据处理领域,尤其涉及一种用户偏好特征的识别方法及其装置。

技术介绍

[0002]随着互联网技术的发展,收集到的用户数据量逐渐增大。通过全量数据寻找与目标用户相似度比较高的用户极大的影响了推荐系统的性能。尤其是一些实时性比较高的系统的效率和性能问题尤为凸显。
[0003]目前,通过离线的聚类在线查询方法可以很好地解决推荐系统的效率和性能问题。当大量数据收集上来以后,可通过聚类算法对用户的类别进行标识,这样仅需在与当前用户相同类别的其他用户(标识相同的用户/相邻用户)中查询出当前用户的分类。
[0004]目前,在车联网的推荐系统中,由于用户的行为偏好数据量极大,如何提高推荐系统的实时性则成为了车辆网推荐系统的一个发展瓶颈。同时,仅仅通过对当前的用户数据进行分析,并不能挖掘用户的潜在偏好。
[0005]为解决车联网推荐系统中存在的上述问题,本专利技术旨在提供一种用户偏好特征的识别方法及其装置,能够解决车联网推荐系统的实时效率和性能问题,同时还能挖掘用户的潜在偏好特征。

技术实现思路

[0006]以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
[0007]根据本专利技术的一个方面,提供了一种用户偏好特征的识别方法,包括:获取车机端的用户数据,所述用户数据为采集到的表征用户日常的原始记录数据;清洗所述用户数据以过滤掉无效数据,以获得过滤后的结构化的有效用户数据;以及对所述有效用户数据进行聚类分析以获得用户偏好特征。
[0008]在一实施例中,所述用户数据为埋点数据,所述获取用户数据包括:采集车机端各个埋点产生的实时数据;将各个埋点产生的实时数据存储至Kafka数据平台;以及利用日志收集系统对存储在Kafka数据平台上的实时数据进行收集,以获得所述用户数据。
[0009]在一实施例中,所述清洗所述用户数据包括:利用数据仓库工具或计算引擎清洗所述用户数据。
[0010]在一实施例中,所述对所述有效用户数据进行聚类分析以获得用户偏好特征包括:利用K

means聚类算法对所述有效用户数据进行聚类分析,以获得用户偏好特征。
[0011]在一实施例中,在对所述有效用户数据进行聚类分析以获得用户偏好特征之后还包括:基于所述用户偏好特征,向用户推荐对应的产品和/或服务。
[0012]根据本专利技术的又一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如上述任一实施例中所述的用户偏好特征的识别方法的步骤。
[0013]根据本专利技术的再一个方面,提供了一种用户偏好特征的识别装置,包括:存储器;以及与所述存储器连接的处理器,所述处理器被配置成:获取车机端的用户数据,所述用户数据为采集到的用户日常的原始记录数据;清洗所述用户数据以过滤掉无效数据,以获得过滤后的结构化的有效用户数据;以及对所述有效用户数据进行聚类分析以获得用户偏好特征。
[0014]在一实施例中,所述用户数据为埋点数据,所述处理器被进一步配置成:采集车机端各个埋点产生的实时数据;将各个埋点产生的实时数据存储至Kafka数据平台;以及利用日志收集系统对存储在Kafka数据平台上的实时数据进行收集,以获得所述用户数据。
[0015]在一实施例中,所述处理器被进一步配置成:利用数据仓库工具或计算引擎清洗所述用户数据。
[0016]在一实施例中,所述处理器被进一步配置成:利用K

means聚类算法对所述有效用户数据进行聚类分析,以获得用户偏好特征。
[0017]在一实施例中,所述处理器还被配置成:在对所述有效用户数据进行聚类分析以获得用户偏好特征之后,基于所述用户偏好特征,向用户推荐对应的产品。
[0018]本专利技术通过对用户数据进行清洗来获得实时性高、有效性高且关系整齐的有效用户数据;再通过对有效用户数据进行聚类分析,离线获得用户的偏好特征,解决了车联网推荐系统的实时效率和性能的问题,同时实现了用户的潜在偏好特征的挖掘。
[0019]进一步地,本专利技术通过埋点来实现所需要的用户数据的个性化采集,通过Kafka数据平台来实现实时的数据存储,并进一步利用日志收集系统来进行数据收集,从而有效防止了数据积压。
附图说明
[0020]在结合以下附图阅读本公开的实施例的详细描述之后,更能够更好地理解本专利技术的上述特征和优点。
[0021]图1是根据本专利技术的一个方面绘示的一实施例中的用户偏好特征的识别方法的流程示意图;
[0022]图2是根据本专利技术的一个方面绘示的一实施例中的用户偏好特征的识别方法的部分流程示意图;
[0023]图3是根据本专利技术的另一个方面绘示的一实施例中的用户偏好特征的识别装置的模块框图。
具体实施方式
[0024]给出以下描述以使得本领域技术人员能够实施和使用本专利技术并将其结合到具体应用背景中。各种变型、以及在不同应用中的各种使用对于本领域技术人员将是容易显见的,并且本文定义的一般性原理可适用于较宽范围的实施例。由此,本专利技术并不限于本文中给出的实施例,而是应被授予与本文中公开的原理和新颖性特征相一致的最广义的范围。
[0025]在以下详细描述中,阐述了许多特定细节以提供对本专利技术的更透彻理解。然而,对于本领域技术人员显而易见的是,本专利技术的实践可不必局限于这些具体细节。换言之,公知的结构和器件以框图形式示出而没有详细显示,以避免模糊本专利技术。
[0026]请读者注意与本说明书同时提交的且对公众查阅本说明书开放的所有文件及文献,且所有这样的文件及文献的内容以参考方式并入本文。除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。
[0027]注意,在使用到的情况下,标志左、右、前、后、顶、底、正、反、顺时针和逆时针仅仅是出于方便的目的所使用的,而并不暗示任何具体的固定方向。事实上,它们被用于反映对象的各个部分之间的相对位置和/或方向。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0028]在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。
[0029]注意,在使用到的情况下,进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户偏好特征的识别方法,其特征在于,包括:获取车机端的用户数据,所述用户数据为采集到的表征用户日常的原始记录数据;清洗所述用户数据以过滤掉无效数据,以获得过滤后的结构化的有效用户数据;以及对所述有效用户数据进行聚类分析以获得用户偏好特征。2.如权利要求1所述的识别方法,其中,所述用户数据为埋点数据,所述获取用户数据包括:采集车机端各个埋点产生的实时数据;将各个埋点产生的实时数据存储至Kafka数据平台;以及利用日志收集系统对存储在Kafka数据平台上的实时数据进行收集,以获得所述用户数据。3.如权利要求1所述的识别方法,其中,所述清洗所述用户数据包括:利用数据仓库工具或计算引擎清洗所述用户数据。4.如权利要求1所述的识别方法,其中,所述对所述有效用户数据进行聚类分析以获得用户偏好特征包括:利用K

means聚类算法对所述有效用户数据进行聚类分析,以获得用户偏好特征。5.如权利要求1所述的识别方法,其中,在对所述有效用户数据进行聚类分析以获得用户偏好特征之后还包括:基于所述用户偏好特征,向用户推荐对应的产品和/或服务。6.一种用户偏好特征的识别装置,其特征在于,包括:存储器;以及与所述存储器连接的处理器,所述处理...

【专利技术属性】
技术研发人员:孙晓磊
申请(专利权)人:上海博泰悦臻网络技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1