一种用户行为模式的识别方法、装置及可读存储介质制造方法及图纸

技术编号:35453139 阅读:25 留言:0更新日期:2022-11-03 12:08
本发明专利技术提供了一种用户行为模式的识别方法、装置及可读存储介质,其中,所述识别方法包括:获取用户的上网日志数据;基于黑名单对所述上网日志数据进行过滤,获得过滤后的数据;其中,所述黑名单是基于所述用户的历史上网日志数据所构建的,用于筛选所述历史上网日志数据的URL字段;对所述过滤后的数据进行多级分类,获得分类后的结果;基于所述分类后的结果,识别出所述用户的当前行为模式。用于实现用户行为模式的识别效率。行为模式的识别效率。行为模式的识别效率。

【技术实现步骤摘要】
一种用户行为模式的识别方法、装置及可读存储介质


[0001]本专利技术涉及电子
,尤其涉及一种用户行为模式的识别方法、装置及可读存储介质。

技术介绍

[0002]随着网络的发展,行为模式识别在日常生活中广泛应用。比如,识别用户在运动检测、智能家居、互动游戏、健康看护等场景中的行为模式,从而进行合理推荐。再比如,识别用户在上网购物过程中的行为模式,从而进行精准营销。
[0003]如何实现用户行为模式的准确识别成为急需解决的技术问题。

技术实现思路

[0004]本专利技术提供了一种用户行为模式的识别方法、装置及可读存储介质,用于实现用户行为模式的识别效率。
[0005]第一方面,本专利技术实施例提供了一种用户行为模式的识别方法,包括:
[0006]获取用户的上网日志数据;
[0007]基于黑名单对所述上网日志数据进行过滤,获得过滤后的数据;其中,所述黑名单是基于所述用户的历史上网日志数据所构建的,用于筛选所述历史上网日志数据的URL字段;
[0008]对所述过滤后的数据进行多级分类,获得分类后的结果;
[0009]基于所述分类后的结果,识别出所述用户的当前行为模式。
[0010]在其中一种可能的实现方式中,在所述获取用户的上网日志数据之前,所述方法还包括:
[0011]获得所述用户的历史上网日志数据;
[0012]从所述历史上网日志数据中,筛选出信息值大于第一预设阈值的目标数据,其中,所述信息值用于表征相应数据的特征重要程度;<br/>[0013]基于弱分类器将所述目标数据分为黑名单临时库,所述黑名单临时库由非主动访问的URL字段组成;
[0014]从所述黑名单临时库中,筛选出提升度大于第二预设阈值的目标库,其中,所述提升度用于表征数据过滤强度;
[0015]将所述目标库作为所述黑名单。
[0016]在其中一种可能的实现方式中,所述对所述过滤后的数据进行多级分类,获得分类后的结果,包括:
[0017]根据预设的分解层级深度,采用信息熵对所述过滤后的数据进行二叉树分解,获得对应数据的多个层级的分类,其中,所述信息熵越小表明相应层级的分类的特征越相似。
[0018]在其中一种可能的实现方式中,所述基于所述分类后的结果,识别出所述用户的当前行为模式,包括:
[0019]用预设标准标签库对所述分类后的结果的各个层级的分类进行校验,得到校验后的标签库,所述校验后的标签库用于存放校验后的各个层级的分类对应的行为特征标签;
[0020]根据所述校验后的标签库,对所述过滤后的数据进行特征识别,获得所述用户的基础行为特征;
[0021]基于聚类算法和多层分析法将所述用户的基础行为特征进行聚合,识别出用户当前的行为模式。
[0022]第二方面,本专利技术实施例还提供了一种用户行为模式的识别装置,包括:
[0023]获取单元,用于获取用户的上网日志数据;
[0024]过滤单元,基于黑名单对所述上网日志数据进行过滤,获得过滤后的数据;其中,所述黑名单是基于所述用户的历史上网日志数据所构建的,用于筛选所述历史上网日志数据的URL字段;
[0025]分类单元,用于对所述过滤后的数据进行多级分类,获得分类后的结果;
[0026]识别单元,基于所述分类后的结果,识别出所述用户的当前行为模式。
[0027]在其中一种可能的实现方式中,在所述获取单元获取用户的上网日志数据之前,所述识别装置还包括构建单元,所述构建单元用于:
[0028]获得所述用户的历史上网日志数据;
[0029]从所述历史上网日志数据中,筛选出信息值大于第一预设阈值的目标数据,其中,所述信息值用于表征相应数据的特征重要程度;
[0030]基于弱分类器将所述目标数据分为黑名单临时库,所述黑名单临时库由非主动访问的URL字段组成;
[0031]从所述黑名单临时库中,筛选出提升度大于第二预设阈值的目标库,其中,所述提升度用于表征数据过滤强度;
[0032]将所述目标库作为所述黑名单。
[0033]在其中一种可能的实现方式中,所述分类单元用于:
[0034]根据预设的分解层级深度,采用信息熵对所述过滤后的数据进行二叉树分解,获得对应数据的多个层级的分类,其中,所述信息熵越小表明相应层级的分类的特征越相似。
[0035]在其中一种可能的实现方式中,所述识别单元用于:
[0036]用预设标准标签库对所述分类后的结果的各个层级的分类进行校验,得到校验后的标签库,所述校验后的标签库用于存放校验后的各个层级的分类对应的行为特征标签;
[0037]根据所述校验后的标签库,对所述过滤后的数据进行特征识别,获得所述用户的基础行为特征;
[0038]基于聚类算法和多层分析法将所述用户的基础行为特征进行聚合,识别出用户当前的行为模式。
[0039]第三方面,本专利技术实施例还提供了一种识别装置,包括,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前面任一项所述的用户行为模式的识别方法的步骤。
[0040]第四方面,本专利技术实施例还提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前面任一项所述的用户行为模式的识别方法的步骤。
[0041]本专利技术的有益效果如下:
[0042]本专利技术实施例提供了一种用户行为模式的识别方法、装置及可读存储介质,首先,获取用户的上网日志数据;然后,基于用户的历史上网日志数据所构建的黑名单,对用户的上网日志数据进行过滤,过滤掉黑名单中URL字段所对应的数据;然后,对过滤后的数据进行多级分类,从而获得分类后的结果;然后,基于该分类后的结果,识别出用户的当前行为模式。也就是说,基于用户的历史上网日志数据所构建的黑名单,对用户的当前上网日志数据进行过滤,增加了数据的清洗力度,减少了数据量,从而提高了后续基于过滤后的数据进行多级分类以及行为模式识别的效率。
附图说明
[0043]图1为本专利技术实施例提供的一种用户行为模式的识别方法的方法流程图;
[0044]图2为本专利技术实施例提供的一种用户行为模式的识别方法中其中一种多级分类示意图;
[0045]图3为图1中在步骤S101之前的其中一种方法流程图;
[0046]图4为本专利技术实施例提供的一种用户行为模式的识别方法中其中一种多级分类示意图;
[0047]图5为图1中步骤S104的其中一种方法流程图;
[0048]图6为本专利技术实施例提供的一种用户行为模式的识别装置的其中一种结构示意图。
具体实施方式
[0049]本专利技术的说明书和权利要求书及上述附图中,术语“包括”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为模式的识别方法,其特征在于,包括:获取用户的上网日志数据;基于黑名单对所述上网日志数据进行过滤,获得过滤后的数据;其中,所述黑名单是基于所述用户的历史上网日志数据所构建的,用于筛选所述历史上网日志数据的URL字段;对所述过滤后的数据进行多级分类,获得分类后的结果;基于所述分类后的结果,识别出所述用户的当前行为模式。2.如权利要求1所述的方法,其特征在于,在所述获取用户的上网日志数据之前,所述方法还包括:获得所述用户的历史上网日志数据;从所述历史上网日志数据中,筛选出信息值大于第一预设阈值的目标数据,其中,所述信息值用于表征相应数据的特征重要程度;基于弱分类器将所述目标数据分为黑名单临时库,所述黑名单临时库由非主动访问的URL字段组成;从所述黑名单临时库中,筛选出提升度大于第二预设阈值的目标库,其中,所述提升度用于表征数据过滤强度;将所述目标库作为所述黑名单。3.如权利要求2所述的方法,其特征在于,所述对所述过滤后的数据进行多级分类,获得分类后的结果,包括:根据预设的分解层级深度,采用信息熵对所述过滤后的数据进行二叉树分解,获得对应数据的多个层级的分类,其中,所述信息熵越小表明相应层级的分类的特征越相似。4.如权利要求3所述的方法,其特征在于,所述基于所述分类后的结果,识别出所述用户的当前行为模式,包括:用预设标准标签库对所述分类后的结果的各个层级的分类进行校验,得到校验后的标签库,所述校验后的标签库用于存放校验后的各个层级的分类对应的行为特征标签;根据所述校验后的标签库,对所述过滤后的数据进行特征识别,获得所述用户的基础行为特征;基于聚类算法和多层分析法将所述用户的基础行为特征进行聚合,识别出用户当前的行为模式。5.一种用户行为模式的识别装置,其特征在于,包括:获取单元,用于获取用户的上网日志数据;过滤单元,基于黑名单对所述上网日志数据进行过滤,获得过滤后的数据;其中,所述黑名单是基于所述用户的历史上网日...

【专利技术属性】
技术研发人员:安翔宇
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1