System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及用户行为挖掘领域,尤其涉及一种用户上网行为画像构建方法。
技术介绍
1、随着互联网技术的不断发展与普及应用,应运而生的是对其背后蕴藏的大量潜在信息的大数据的挖掘和研究。通过对用户上网行为日志的分析挖掘,将用户行为所蕴含的信息标签化,通过一系列标签性的词语描述用户特点,可以对用户后续的分析提供技术支持。
2、当前对于用户画像构建,主要依赖于规则的特征提取,然而这些方法通常需要人工设计规则,无法应对当前大规模和复杂的数据环境。
3、有鉴于此,如何基于用户上网行为,自动构建全面、准确的用户画像,成为亟需解决的问题。
技术实现思路
1、本专利技术提供一种用户上网行为画像构建方法,用户上网行为画像构建系统,用户上网行为画像构建装置,一种电子设备,以及一种计算机可读存储介质,用以至少解决当前依赖人工设定规则实现用户画像构建的问题。
2、根据本专利技术实施例的第一方面,提供一种用户上网行为画像构建方法,包括:
3、对用户上网行为日志进行预处理,生成用于构建用户上网行为画像的特征数据集;
4、基于预设的用户画像标签体系中,对用户标签和所述用户标签对应的特征数据的确定,将所述特征数据集中的特征数据进行划分,得到自然属性特征数据集和行为属性特征数据集,其中,所述预设的画像标签体系,将特征数据对应的标签类型,划分为自然属性标签和行为属性标签;
5、根据所述自然属性标签的标签规则,对所述自然属性特征数据集中的特征数据进行
6、根据所述行为属性标签,对所述行为属性特征数据集中的特征数据进行划分,生成用户上网行为,并基于目标算法对用户不同上网行为对应的特征数据进行处理,生成用户行为属性画像;
7、根据所述自然属性画像和所述行为属性画像,生成用户上网行为画像。
8、根据本专利技术实施例的第二方面,提供一种用户上网行为画像构建系统,所述系统包括数据处理层、特征提取层、数据关联层和画像计算层,其中,
9、所述数据处理层,用于对用户上网行为日志进行预处理,生成用于构建用户上网行为画像的特征数据集;
10、所述特征提取层,用于基于预设的用户画像标签体系中,对用户标签和所述用户标签对应的特征数据的确定,将所述特征数据集中的特征数据进行划分,得到自然属性特征数据集和行为属性特征数据集,其中,所述预设的画像标签体系,将特征数据对应的标签类型,划分为自然属性标签和行为属性标签;
11、所述数据关联层,用于根据所述自然属性标签的标签规则,对所述自然属性特征数据集中的特征数据进行统计,生成用户自然属性画像;并根据所述行为属性标签,对所述行为属性特征数据集中的特征数据进行划分,生成用户上网行为,并基于目标算法对用户不同上网行为对应的特征数据进行处理,生成用户行为属性画像;
12、所述画像计算层,用于根据所述自然属性画像和所述行为属性画像,生成用户上网行为画像。
13、根据本专利技术实施例的第三方面,提供一种用户上网行为画像构建装置,包括:
14、数据处理模块,被配置为对用户上网行为日志进行预处理,生成用于构建用户上网行为画像的特征数据集;
15、特征划分模块,被配置为基于预设的用户画像标签体系中,对用户标签和所述用户标签对应的特征数据的确定,将所述特征数据集中的特征数据进行划分,得到自然属性特征数据集和行为属性特征数据集,其中,所述预设的画像标签体系,将特征数据对应的标签类型,划分为自然属性标签和行为属性标签;
16、第一生成模块,被配置为根据所述自然属性标签的标签规则,对所述自然属性特征数据集中的特征数据进行统计,生成用户自然属性画像;
17、第二生成模块,被配置为根据所述行为属性标签,对所述行为属性特征数据集中的特征数据进行划分,生成用户上网行为,并基于目标算法对用户不同上网行为对应的特征数据进行处理,生成用户行为属性画像;
18、第三生成模块,被配置为根据所述自然属性画像和所述行为属性画像,生成用户上网行为画像。
19、根据本说明书实施例的第四方面,提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如本说明书实施例第一方面所述的用户上网行为画像构建方法的步骤。
20、根据本说明书实施例的第五方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如本说明书实施例第一方面所述的用户上网行为画像构建方法的步骤。
21、应用本说明书实施例提供的方法,首先随用户上网行为日志进行预处理,然后对预处理后得到的上网行为日志数据,根据预设的用户画像标签体系进行特征数据的划分,得到自然属性特征数据集和行为属性特征数据集,其次通过对自然属性特征数据集和行为属性特征数据集,分别按照相应的特征数据处理方法,生成用户自然属性画像和用户行为属性画像,最后基于用户自然属性画像和用户行为属性画像,生成全面、准确的用户行为画像,增强优化上网行为画像的可扩展性。
22、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
本文档来自技高网...【技术保护点】
1.一种用户上网行为画像构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对用户上网行为日志进行预处理,生成用于构建用户上网行为画像的特征数据集,包括:
3.根据权利要求1所述的方法,其他特征在于,所述根据所述自然属性标签的标签规则,对所述自然属性特征数据集中的特征数据进行统计,生成用户自然属性画像,包括:
4.根据权利要求1所述的方法,其特征在于,所述基于目标算法对用户不同上网行为对应的特征数据进行处理,生成用户行为属性画像,包括:
5.根据权利要求4所述的方法,其他特征在于,所述基于模拟TF-IDF算法,计算用户不同上网行为的权重,包括:
6.一种用户上网行为画像构建系统,其特征在于,所述系统包括数据处理层、特征提取层、数据关联层和画像计算层,其中,
7.一种用户上网行为画像构建装置,其特征在于,包括:
8.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-5中任
9.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-5中任一项所述方法对应的步骤。
...【技术特征摘要】
1.一种用户上网行为画像构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对用户上网行为日志进行预处理,生成用于构建用户上网行为画像的特征数据集,包括:
3.根据权利要求1所述的方法,其他特征在于,所述根据所述自然属性标签的标签规则,对所述自然属性特征数据集中的特征数据进行统计,生成用户自然属性画像,包括:
4.根据权利要求1所述的方法,其特征在于,所述基于目标算法对用户不同上网行为对应的特征数据进行处理,生成用户行为属性画像,包括:
5.根据权利要求4所述的方法,其他特征在于,所述基于模拟tf-idf算法...
【专利技术属性】
技术研发人员:陈苏,王晗,赵宁,赵悦楷,吕青,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。