【技术实现步骤摘要】
基于云计算的移动互联网大数据用户行为分析系统
[0001]本专利技术属于互联网
,具体的,涉及一种基于云计算的移动互联网大数据用户行为分析系统。
技术介绍
[0002]互联网技术的快速发展为人们的生活带来了便利,在互联网的应用于发展过程中,大量的信息被存储保留,当用户需要获取想要的信息时,就会出现较大的难度,而检索功能的出现能够根据关键词获取用户可能想要的部分资料,然后用户再根据检索结果来进行筛选。
[0003]但是随着互联网中信息的日益增多,在输入关键词进行检索时,可能会出现检索结果过多的问题,虽然现在的很多系统会通过一定的预设规则来对检索结果进行排序,使用户能够优先获取对应预设规则下的优质对象,但是这种筛选方法并未考虑到用户本人在进行数据筛选时的习惯,导致在实际操作中,还是需要用户根据自身需要进行较多的二次筛选工作,不利于用户进行检索工作时的流畅度,为了解决上述问题,提供一种能够对用户观看短视频资料时的行为进行分析,并根据用户的行为习惯,在用户进行检索工作时,为用户推荐更加贴合的目标对象的方法,本专利技术提供了以下技术方案。
技术实现思路
[0004]本专利技术的目的在于提供一种基于云计算的移动互联网大数据用户行为分析系统,解决现有技术中在进行检索时并未考虑到用户本人在进行数据筛选时的习惯,导致在实际操作中,还是需要用户根据自身需要进行较多的二次筛选工作,不利于用户进行检索工作时的流畅度的问题。
[0005]本专利技术的目的可以通过以下技术方案实现:
[0006]基于 ...
【技术保护点】
【技术特征摘要】
1.基于云计算的移动互联网大数据用户行为分析系统,其特征在于,包括:检索单元,通过检索关键词在数据存储单元中获取初选资料;数据存储单元,用于对资料以及各用户的阅览记录进行存储;用户登录单元,用户通过用户登录单元登录系统;控制中心,用于根据用户的阅览记录以及初选资料对各初选资料进行排序,并将符合用户需求的初选资料优先推荐;所述控制中心的工作方法包括如下步骤:包括如下步骤:S1、将一个用户标记为目标用户,获取在过去的预设时间T1内,目标用户的阅览记录;所述阅览记录包括目标用户阅览资料时各对应资料的好评率、点击率、资料时长以及所属领域;获取目标用户在同一个所属领域范围内,在过去的T1时间内的完成阅览的资料,将这些完成阅览的资料标记为历史对照资料;获取历史对照资料的阅览记录;依次计算得到目标用户在对应所属领域范围内,对于好评率的敏感系数G1、对于点击率的敏感系数G2以及对于资料时长的敏感系数G3;所述敏感系数G1的计算方法为:获取各历史对照资料的好评率hi,其中1≤i≤n,n为历史对照资料的数量;根据公式计算得到h1至hn这一组参数的分散值F;其中hp=(h1+h2+
…
+hn)/n;根据公式G1=α3/(α1*F+α2*hp)计算得到目标用户对于好评率的敏感系数G1,其中α1、α2、α3均为预设值,且α1+α2=1;所述敏感系数G2根据各历史对照资料的点击率di进行计算;所述敏感系数G3根据各历史对照资料的资料时长ti进行计算;G2与G3的计算方法均与G1相同;S2、目标用户通过检索单元输入检索关键词,检索单元根据检索关键词在数据存储单元中获取对应的资料,将这些对应的资料标记为初选资料;S3、获取各初选资料的关键词契合度R1;获取各初选资料对应的领域附加值β;获取各初选资料在过去的预设时间T1内的话题强度R2;获取各初选资料在当前时刻对应的好评率hk以及点击率dk;获取各初选资料对应的时长tk;根据公式:U=γ1*R1+γ2*R2+γ3*hk
G1/α4
+γ4*dk
G2/α4
+γ5*|tk
‑
tp|
G3/α4
+β计算得到各初选资料的复合贴合系数U;其中α4为预设值,且当G1/α4<σ时,则G1/α4取值为σ,σ为大于0小于1的参数;当G1/α4>1时,则G1/α4取值为1;
式中,γ1、γ2、γ3、γ4与|γ5|均为预设的参数,且γ1、γ2、γ3与γ4均为正值,当tk
‑
tp大于等于0时,γ5取负值,当tk
【专利技术属性】
技术研发人员:张世联,王洪伟,王俊,王培栋,
申请(专利权)人:江苏智慧工场技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。