用户兴趣挖掘方法、装置、设备和存储介质制造方法及图纸

技术编号:23212832 阅读:34 留言:0更新日期:2020-01-31 21:53
本发明专利技术提供一种用户兴趣挖掘方法、装置、设备和存储介质。该方法用于为互联网应用提供用户数据,该方法包括:获取用户在互联网上进行操作的单天数据源;对单天数据源进行挖掘分析,得到单天内所述用户的第一兴趣数据,第一兴趣数据包含兴趣标签与单天兴趣分析结果的对应关系;在时间维度上对第一兴趣数据进行累计,得到至少两天内用户的第二兴趣数据,第二兴趣数据包含兴趣标签与至少两个单天兴趣分析结果的对应关系;对第二兴趣数据进行数据评价分析,得到用户的兴趣评价数据。本发明专利技术实施例能够体现用户行为在时间维度上的属性,根据兴趣评价数据能有效的对用户兴趣进行区分,能够根据兴趣评价数据定位用户。

User interest mining methods, devices, devices and storage media

【技术实现步骤摘要】
用户兴趣挖掘方法、装置、设备和存储介质
本专利技术涉及计算机
,尤其涉及一种用户兴趣挖掘方法、装置、设备和存储介质。
技术介绍
随着互联网技术的发展,越来越多的用户使用互联网进行搜索、社交、购买等行为。为了实现对不同用户的个性化服务,需要对用户兴趣进行挖掘。由于用户兴趣的形成是一个随时间变化的过程,而非一个时间点能够表达的,并且不同种类的兴趣会有不同的表现形式。因此,为了体现用户兴趣的强度和区分度,对于本领域技术人员来说亟需一种对用户兴趣进行准确评价的方法。
技术实现思路
本专利技术提供一种用户兴趣挖掘方法、装置、设备和存储介质,以实现对用户兴趣进行评价,得到兴趣评价数据,该兴趣评价数据能够体现用户行为在时间维度上的属性,能有效的对用户兴趣进行区分,并定位用户。第一方面,本专利技术提供一种用户兴趣挖掘方法,所述方法用于为互联网应用提供用户数据,所述方法包括:获取用户在互联网上进行操作的单天数据源;对所述单天数据源进行挖掘分析,得到单天内所述用户的第一兴趣数据,所述第一兴趣数据包含兴趣标签本文档来自技高网...

【技术保护点】
1.一种用户兴趣挖掘方法,其特征在于,所述方法用于为互联网应用提供用户数据,所述方法包括:/n获取用户在互联网上进行操作的单天数据源;/n对所述单天数据源进行挖掘分析,得到单天内所述用户的第一兴趣数据,所述第一兴趣数据包含兴趣标签与单天兴趣分析结果的对应关系;/n在时间维度上对所述第一兴趣数据进行累计,得到至少两天内所述用户的第二兴趣数据,所述第二兴趣数据包含所述兴趣标签与所述至少两个单天兴趣分析结果的对应关系;/n对所述第二兴趣数据进行数据评价分析,得到所述用户的兴趣评价数据。/n

【技术特征摘要】
1.一种用户兴趣挖掘方法,其特征在于,所述方法用于为互联网应用提供用户数据,所述方法包括:
获取用户在互联网上进行操作的单天数据源;
对所述单天数据源进行挖掘分析,得到单天内所述用户的第一兴趣数据,所述第一兴趣数据包含兴趣标签与单天兴趣分析结果的对应关系;
在时间维度上对所述第一兴趣数据进行累计,得到至少两天内所述用户的第二兴趣数据,所述第二兴趣数据包含所述兴趣标签与所述至少两个单天兴趣分析结果的对应关系;
对所述第二兴趣数据进行数据评价分析,得到所述用户的兴趣评价数据。


2.根据权利要求1所述的方法,其特征在于,所述对所述单天数据源进行挖掘分析,得到单天内所述用户的第一兴趣数据,包括:
对所述单天数据源进行数据分析,得到与所述用户对应的兴趣标签;
针对各兴趣标签,确定所述单天数据源的数据源分类、用户行为分类以及用户行为次数,并对所述数据源分类所对应的权重值、用户行为分类所对应的权重值以及用户行为次数进行加权处理,得到单天内所述用户的行为强度值,并对所述行为强度值进行归一化处理;
将各兴趣标签与归一化后的行为强度值进行关联,得到所述第一兴趣数据。


3.根据权利要求2所述的方法,其特征在于,所述数据源分类,包括以下类别:
搜索、浏览、广告、社交、电商;
所述用户行为分类,包括以下类别:
搜索、浏览、关注、下单。


4.根据权利要求2或3所述的方法,其特征在于,在时间维度上对所述第一兴趣数据进行累计,得到至少两天内所述用户的第二兴趣数据,包括:
采用稀疏存储的形式对与各兴趣标签所对应的行为强度值按天累计,形成与各兴趣标签对应的兴趣向量;
将所述各兴趣标签与所述兴趣向量进行关联,得到所述第二兴趣数据。


5.根据权利要求4所述的方法,其特征在于,所述对所述第二兴趣数据进行数据评价分析,得到所述用户的兴趣评价数据,包括以下至少一个处理:
将所述第二兴趣数据中的兴趣向量转换为兴趣强度评价数据;或,
将所述第二兴趣数据中的兴趣向量转换为兴趣强度,并将所述兴趣强度转换为兴趣投入度评价数据;或,
将所述第二兴趣数据中的兴趣向量转换为兴趣强度,将所述兴趣强度转换为兴趣投入度,并将所述兴趣投入度转换为兴趣分数评价数据;或,
针对各兴趣标签,将所述第二兴趣数据中的兴趣向量转换为兴趣强度,并根据各兴趣标签的级别将所述兴趣强度转换为兴趣强度评价数据。


6.根据权利要求5所述的方法,其特征在于,所述将所述第二兴趣数据中的兴趣向量转换为兴趣强度评价数据,包括:
针对各兴趣标签,根据所述兴趣向量提取评价指标,并对所提取的各个评价指标进行加权,得到与各兴趣标签对应的兴趣强度评价数据。


7.根据权利要求6所述的方法,其特征在于,各兴趣标签具有对应的时间窗口长度;
所述根据所述兴趣向量提取评价指标,包括提取下列至少一个指标:
从所述兴趣向量中提取每个时间窗口内的用户行为频度;
从所述兴趣向量中提取每个时间窗口的用户行为分布均匀度;
从所述兴趣向量中提取最近的活跃日期距离当前时间的天数,所述活跃日期为产生所述兴趣标签对应的用户行为的日期;
相应的,所述对所提取的各个评价指标进行加权,包括:
针对各兴趣标签,采用各个评价指标对应的权重值对各个评价指标进行加权。


8.根据权利要求7所述的方法,其特征在于,各兴趣标签还具有对应的衰减系数,所述从所述兴趣向量中提取每个时间窗口内的用户行为频度,包括:
根据所述兴趣标签对应的衰减系数,从所述兴趣向量中提取每个时间窗口内的用户行为频度。


9.根据权利要求6所述的方法,其特征在于,将所述兴趣强度转换为兴趣投入度评价数据,包括:
将所述用户的一兴趣标签所对应的兴趣强度除以所述用户所有兴趣标签所对应的兴趣强度,得到该兴趣标签所对应的兴趣投入度评价数据。


10.根据权利要求9所述的方法,其特征在于,所述将所述兴趣投入度转换为兴趣分数评价数据...

【专利技术属性】
技术研发人员:刘鹏杨胜文周俊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1