用户行为预测方法及装置制造方法及图纸

技术编号:36709835 阅读:24 留言:0更新日期:2023-03-01 09:35
本发明专利技术提供了一种用户行为预测方法及装置,涉及数据分析技术领域。方法包括:对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。因此,本发明专利技术能够解决现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。率的问题。率的问题。

【技术实现步骤摘要】
用户行为预测方法及装置


[0001]本专利技术涉及数据分析
,尤其涉及一种用户行为预测方法及装置。

技术介绍

[0002]近年来,随着大数据的兴起,消费者行为分析的研究方兴未艾,数据库与数据挖掘、信息系统与信息管理、图像处理与计算机视觉、社会网络分析、电子商务等很多领域的学者加人消费者行为研究的队伍。同时,消费者行为分析这一研究领域也受到了电子商务、社交网络等数字经济形态下的企业的高度关注,消费者行为分析被视为数字经济形态下企业了解其消费者并开展营销活动的有效手段之。
[0003]在聚类分析的实际应用中,针对分类结果的评估也有很多的维度和指标。但是,从数据化运营的实践经验来看,任何模型的数据评估,包括聚类分析的数据评估既要考虑统计学意义上的指标、维度,同时更要关注其实践效果上的价值及业务背景下的价值。尤具聚类项目来说,跟分类(预测)项目的一个显著不同之处在于,分类(预测)项目的评判有训练集、验证集、测试集的客观参照,而对于聚类结果的评判来说,一个对象分配到A类与分配到B类,中间并没有太明确、太客观的参照依据。
[0004]鉴于此,聚类结果的评判常常更加复杂和困难。

技术实现思路

[0005]本专利技术实施例提供一种用户行为预测方法及装置,以解决现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
[0006]为了解决上述技术问题,本专利技术是这样实现的:
[0007]第一方面,本专利技术实施例提供了一种用户行为预测方法,所述方法包括:对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
[0008]进一步地,所述对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,包括:根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
[0009]进一步地,所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
[0010]进一步地,所述根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,包括:通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;根据所述拟合阈值确定所述过拟合数据;剔除所述优化数据集合
中的所述过拟合数据,以得到所述第三数据集合。
[0011]进一步地,所述通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,包括:将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。
[0012]进一步地,所述方法还包括:向用户行为转化率大于预设转化率阈值的意向用户的终端设备,发送预设推送信息。
[0013]第二方面,本专利技术实施例还提供了一种用户行为预测装置,所述装置包括:分析模块,用于对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;处理模块,用于根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;确定模块,用于通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
[0014]进一步地,所述分析模块包括:分析子模块,用于根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
[0015]进一步地,所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
[0016]进一步地,所述处理模块包括:第一确定子模块,用于通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;第二确定子模块,用于根据所述拟合阈值确定所述过拟合数据;处理子模块,用于剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。
[0017]进一步地,所述确定模块包括:输入子模块,用于将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;第三确定子模块,用于根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。
[0018]进一步地,所述装置还包括:发送模块,向用户行为转化率大于预设概率阈值的意向用户的终端设备,发送预设推送信息。
[0019]第三方面,本专利技术实施例另外提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如前第一方面所述的用户行为预测方法的步骤。
[0020]第四方面,本专利技术实施例另外提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前第一方面所述的用户行为预测方法的步骤。
[0021]在本专利技术实施例中,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的
行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。本实施例中对分别对应不同用户行为的第一数据集合以及第二数据集合进行聚类分析,以得到共同网络行为的优化数据集合,然后根据拟合阈值剔除优化数据集合中的过拟合数据,以降低显性数据与隐性数据的差异化,最后通过行为转化模型对第三数据集合进行预测,保证了预测得到用户行为转化率的准确性。本专利技术解决了现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
[0022]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为预测确定方法,其特征在于,所述方法包括:对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。2.根据权利要求1所述的方法,其特征在于,所述对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,包括:根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。3.根据权利要求2所述的方法,其特征在于,所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。4.根据权利要求1所述的方法,其特征在于,所述根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,包括:通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;根据所述拟合阈值确定所述过拟合数据;剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。5.根据权利要求1所述的方法,其特征在于,所述通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,包括:将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:向用户行为转化率大于预设转化率阈...

【专利技术属性】
技术研发人员:槐正徐冬冬姜承祥付迎鑫崔明徐锐王健魏丫丫徐蕾
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1