基于云计算的移动互联网大数据用户行为分析系统技术方案

技术编号:38382752 阅读:14 留言:0更新日期:2023-08-05 17:40
本发明专利技术公开了一种基于云计算的移动互联网大数据用户行为分析系统,属于互联网技术领域,该系统通过对各初选资料进行二次筛选,且二次筛选是根据对应的用户在过去的一段时间内的阅览记录来进行的,因此能够尽可能为用户提供对应的合适的资料推荐顺序,使用户能够快速的获得理想的检索结果,降低用户的自我筛选时间与筛选难度,提升检索体验。具体的本发明专利技术通过各对应的敏感系数来对各初选资料的好评率、点击率以及时长进行权重的重新分配计算,降低各对应资料的好评率、点击率、资料时长等参数对推荐结果的影响,有利于为用户推荐最合适的视频资料,提升用户的检索体验。提升用户的检索体验。

【技术实现步骤摘要】
基于云计算的移动互联网大数据用户行为分析系统


[0001]本专利技术属于互联网
,具体的,涉及一种基于云计算的移动互联网大数据用户行为分析系统。

技术介绍

[0002]互联网技术的快速发展为人们的生活带来了便利,在互联网的应用于发展过程中,大量的信息被存储保留,当用户需要获取想要的信息时,就会出现较大的难度,而检索功能的出现能够根据关键词获取用户可能想要的部分资料,然后用户再根据检索结果来进行筛选。
[0003]但是随着互联网中信息的日益增多,在输入关键词进行检索时,可能会出现检索结果过多的问题,虽然现在的很多系统会通过一定的预设规则来对检索结果进行排序,使用户能够优先获取对应预设规则下的优质对象,但是这种筛选方法并未考虑到用户本人在进行数据筛选时的习惯,导致在实际操作中,还是需要用户根据自身需要进行较多的二次筛选工作,不利于用户进行检索工作时的流畅度,为了解决上述问题,提供一种能够对用户观看短视频资料时的行为进行分析,并根据用户的行为习惯,在用户进行检索工作时,为用户推荐更加贴合的目标对象的方法,本专利技术提供了以下技术方案。

技术实现思路

[0004]本专利技术的目的在于提供一种基于云计算的移动互联网大数据用户行为分析系统,解决现有技术中在进行检索时并未考虑到用户本人在进行数据筛选时的习惯,导致在实际操作中,还是需要用户根据自身需要进行较多的二次筛选工作,不利于用户进行检索工作时的流畅度的问题。
[0005]本专利技术的目的可以通过以下技术方案实现:
[0006]基于云计算的移动互联网大数据用户行为分析系统,包括:
[0007]检索单元,通过检索关键词在数据存储单元中获取初选资料;
[0008]数据存储单元,用于对资料以及各用户的阅览记录进行存储;
[0009]用户登录单元,用户通过用户登录单元登录系统;
[0010]控制中心,用于根据用户的阅览记录以及初选资料对各初选资料进行排序,并将符合用户需求的初选资料优先推荐;
[0011]所述控制中心的工作方法包括如下步骤:
[0012]包括如下步骤:
[0013]S1、将一个用户标记为目标用户,获取在过去的预设时间T1内,目标用户的阅览记录;
[0014]所述阅览记录包括目标用户阅览资料时各对应资料的好评率、点击率、资料时长以及所属领域;
[0015]获取目标用户在同一个所属领域范围内,在过去的T1时间内的完成阅览的资料,
将这些完成阅览的资料标记为历史对照资料;
[0016]获取历史对照资料的阅览记录;
[0017]依次计算得到目标用户在对应所属领域范围内,对于好评率的敏感系数G1、对于点击率的敏感系数G2以及对于资料时长的敏感系数G3;
[0018]所述敏感系数G1的计算方法为:
[0019]获取各历史对照资料的好评率hi,其中1≤i≤n,n为历史对照资料的数量;
[0020]根据公式计算得到h1至hn这一组参数的分散值F;
[0021]其中hp=(h1+h2+

+hn)/n;
[0022]根据公式G1=α3/(α1*F+α2*hp)计算得到目标用户对于好评率的敏感系数G1,其中α1、α2、α3均为预设值,且α1+α2=1;
[0023]所述敏感系数G2根据各历史对照资料的点击率di进行计算;
[0024]所述敏感系数G3根据各历史对照资料的资料时长ti进行计算;
[0025]G2与G3的计算方法均与G1相同;
[0026]S2、目标用户通过检索单元输入检索关键词,检索单元根据检索关键词在数据存储单元中获取对应的资料,将这些对应的资料标记为初选资料;
[0027]S3、获取各初选资料的关键词契合度R1;
[0028]获取各初选资料对应的领域附加值β;
[0029]获取各初选资料在过去的预设时间T1内的话题强度R2;
[0030]获取各初选资料在当前时刻对应的好评率hk以及点击率dk;
[0031]获取各初选资料对应的时长tk;
[0032]根据公式:
[0033]U=γ1*R1+γ2*R2+γ3*hk
G1/α4
+γ4*dk
G2/α4
+γ5*|tk

tp|
G3/α4
+β计算
[0034]得到各初选资料的复合贴合系数U;
[0035]其中α4为预设值,且当G1/α4<σ时,则G1/α4取值为σ,σ为大于0小于1的参数;当G1/α4>1时,则G1/α4取值为1;
[0036]式中,γ1、γ2、γ3、γ4与|γ5|均为预设的参数,且γ1、γ2、γ3与γ4均为正值,当tk

tp大于等于0时,γ5取负值,当tk

tp小于0时,γ5取正值;
[0037]tp=(t1+t2+

+tn)/n;
[0038]S4、将各初选资料按照复合贴合系数U从大到小的顺序依次推荐至目标用户。
[0039]作为本专利技术的进一步方案,所述完成阅览的资料是指对应的用户对对应资料的实际播放部分的时长与对应资料的全部时长之比大于预设比例值θ。
[0040]作为本专利技术的进一步方案,所述θ取值为70%。
[0041]作为本专利技术的进一步方案,所述σ取值为0.25。
[0042]作为本专利技术的进一步方案,各初选资料的所述关键词契合度R1的计算方法为:
[0043]对于一个初选资料,获取在该初选资料中出现的检索关键词的数量q1;
[0044]获取检索关键词的总数量q;
[0045]根据公式R1=q1/q计算得到对应初选资料的关键词契合度R1。
[0046]作为本专利技术的进一步方案,所述领域附加值β的计算方法为:
[0047]获取目标用户在过去的T1时间内的所有的完成阅览的资料,将这些完成阅览的资料标记为分类子资料;
[0048]获取各分类子资料对应的所属领域,按照所属领域不同对各分类子资料进行分组;
[0049]获取各所属领域对应的分类子资料的数量e1;
[0050]计算获取对于目标用户,各所属领域对应的领域附加值β,β=β1*e1/e,其中β1为预设值,e为分类子资料的数量。
[0051]作为本专利技术的进一步方案,所述各初选资料的话题强度R2的计算方法为:
[0052]获取一初选资料在过去的预设时间T1内被引用和被转发的次数r,将引用或转发后的对应初选资料标记为二级资料;
[0053]根据公式r*μ1计算得到对应初选资料的一级影响值;
[0054]获取各二级资料在过去的预设时间T1内被引用或转发的次数r2j,将引用和转发后的对应二级资料标记为三级资料,其中1≤j≤m,m为二级资料的数量;
[0055]根据公式μ2*(r21+r22+,

,+r2m)计算得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于云计算的移动互联网大数据用户行为分析系统,其特征在于,包括:检索单元,通过检索关键词在数据存储单元中获取初选资料;数据存储单元,用于对资料以及各用户的阅览记录进行存储;用户登录单元,用户通过用户登录单元登录系统;控制中心,用于根据用户的阅览记录以及初选资料对各初选资料进行排序,并将符合用户需求的初选资料优先推荐;所述控制中心的工作方法包括如下步骤:包括如下步骤:S1、将一个用户标记为目标用户,获取在过去的预设时间T1内,目标用户的阅览记录;所述阅览记录包括目标用户阅览资料时各对应资料的好评率、点击率、资料时长以及所属领域;获取目标用户在同一个所属领域范围内,在过去的T1时间内的完成阅览的资料,将这些完成阅览的资料标记为历史对照资料;获取历史对照资料的阅览记录;依次计算得到目标用户在对应所属领域范围内,对于好评率的敏感系数G1、对于点击率的敏感系数G2以及对于资料时长的敏感系数G3;所述敏感系数G1的计算方法为:获取各历史对照资料的好评率hi,其中1≤i≤n,n为历史对照资料的数量;根据公式计算得到h1至hn这一组参数的分散值F;其中hp=(h1+h2+

+hn)/n;根据公式G1=α3/(α1*F+α2*hp)计算得到目标用户对于好评率的敏感系数G1,其中α1、α2、α3均为预设值,且α1+α2=1;所述敏感系数G2根据各历史对照资料的点击率di进行计算;所述敏感系数G3根据各历史对照资料的资料时长ti进行计算;G2与G3的计算方法均与G1相同;S2、目标用户通过检索单元输入检索关键词,检索单元根据检索关键词在数据存储单元中获取对应的资料,将这些对应的资料标记为初选资料;S3、获取各初选资料的关键词契合度R1;获取各初选资料对应的领域附加值β;获取各初选资料在过去的预设时间T1内的话题强度R2;获取各初选资料在当前时刻对应的好评率hk以及点击率dk;获取各初选资料对应的时长tk;根据公式:U=γ1*R1+γ2*R2+γ3*hk
G1/α4
+γ4*dk
G2/α4
+γ5*|tk

tp|
G3/α4
+β计算得到各初选资料的复合贴合系数U;其中α4为预设值,且当G1/α4<σ时,则G1/α4取值为σ,σ为大于0小于1的参数;当G1/α4>1时,则G1/α4取值为1;
式中,γ1、γ2、γ3、γ4与|γ5|均为预设的参数,且γ1、γ2、γ3与γ4均为正值,当tk

tp大于等于0时,γ5取负值,当tk

【专利技术属性】
技术研发人员:张世联王洪伟王俊王培栋
申请(专利权)人:江苏智慧工场技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1