The invention discloses a user online activity onset time calculating method and system prediction, the method comprises the following steps: extracting the outbreak cluster structure from the user's online activities in time history records; the outbreak of the cluster structure to obtain user outbreak time interval sequence utilization; to discretize the outbreak time interval sequence of users, get the outbreak interval symbol sequence; calculating the user time interval symbol sequence entropy of the outbreak rate; according to the calculation of user online activity outbreak time prediction rate of user time interval symbol sequence entropy of the outbreak. The invention provides a method for online user activity onset time calculation method for the prediction of, this method can better predict the next online behavior of users, to help developers to design better and improve the online service platform.
【技术实现步骤摘要】
用户在线活动爆发时间的可预测度计算方法及系统
本专利技术涉及互联网
,尤其涉及一种用户在线活动爆发时间的可预测度计算方法。
技术介绍
随着互联网特别是移动互联网技术的快速发展,过去人们需要在现实生活中完成的很多活动可以选择在网络上进行,同时互联网技术也为人们的日常生活提供了越来越多的新的服务和应用。互联网技术的广泛使用使得在线活动在人们的日常生活中发挥了越来越重要的作用。对于人类在互联网上的行为,即用户的在线行为,能够预先知道用户的下一个活动能够帮助开发者更好地设计以及改进在线服务平台。相较于用户在线行为预测算法的设计,一个更加基本的问题是得到用户在线行为的预测性能界,即预测算法能够达到的预测准确率的上界。该预测准确率上界的计算能够指导预测算法的设计,帮助综合分析算法优化空间以及研究成本控制。用户在互联网上的活动呈现爆发特征,即在长时间没有活动后会在短时间内会产生大量的活动。用户在线活动的爆发时间是刻画用户在线行为的关键维度,目前还没有对于用户在线活动爆发时间可预测度的计算方法。
技术实现思路
本专利技术的主要目的为提供一种用户在线活动爆发时间的可预测度计算方法。本专利技术提出一种用户在线活动爆发时间的可预测度计算方法,包括以下步骤:从用户的历史在线活动时间记录中提取爆发簇结构;利用爆发簇结构获取用户爆发时间间隔序列;对用户的爆发时间间隔序列进行离散化,得到爆发时间间隔符号序列;计算用户爆发时间间隔符号序列的熵率;根据用户爆发时间间隔符号序列的熵率计算用户在线活动爆发时间可预测度。进一步的,所述从用户的历史在线活动时间记录中提取爆发簇结构之前,包括,获取 ...
【技术保护点】
一种用户在线活动爆发时间的可预测度计算方法,其特征在于,包括以下步骤:从用户的历史在线活动时间记录中提取爆发簇结构;利用爆发簇结构获取用户爆发时间间隔序列;对用户的爆发时间间隔序列进行离散化,得到爆发时间间隔符号序列;计算用户爆发时间间隔符号序列的熵率;根据用户爆发时间间隔符号序列的熵率计算用户在线活动爆发时间可预测度。
【技术特征摘要】
1.一种用户在线活动爆发时间的可预测度计算方法,其特征在于,包括以下步骤:从用户的历史在线活动时间记录中提取爆发簇结构;利用爆发簇结构获取用户爆发时间间隔序列;对用户的爆发时间间隔序列进行离散化,得到爆发时间间隔符号序列;计算用户爆发时间间隔符号序列的熵率;根据用户爆发时间间隔符号序列的熵率计算用户在线活动爆发时间可预测度。2.如权利要求1所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述从用户的历史在线活动时间记录中提取爆发簇结构之前,包括,获取所述用户在指定平台的所有活动时间记录。3.如权利要求1所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述从用户的历史在线活动时间记录中提取爆发簇结构步骤,包括,设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构。4.如权利要求3所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构步骤,包括,设置一个相关活动时间间隔门限,判断两个活动的时间间隔是否小于门限,若是,则判定这两个活动是相关的,并将两个活动作为同一爆发簇;若否,则判定这两个活动是不相关的。5.如权利要求3所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构步骤,还包括,将用户的第一条活动时间记录设置为第一个爆发簇内的第一个活动,从用户的第二条活动时间记录开始,逐个进行如下判断,若其与前一条活动的时间间隔小于设置的相关活动时间间隔门限,则将其划入到前一条活动记录所在簇中,若其与前一条活动的时间间隔大于设置的相关活动时间间隔门限,则将其作为一个新的爆发活动簇的第一个活动,...
【专利技术属性】
技术研发人员:曾尔阳,陈旺,
申请(专利权)人:深圳新基点智能股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。