【技术实现步骤摘要】
一种行为数据的可预测性评估方法、系统及介质
本专利技术涉及行为数据分析、行为序列数据预测领域,具体地,涉及一种行为数据的可预测性评估方法、系统及介质。
技术介绍
随着互联网技术的发展,人们的行为越来越多元化,相应的,也通过各种渠道留下了海量的行为数据。这些行为数据涉及到了众多的领域,具有多种类型,增长速度非常迅速,这些数据中蕴含了越来越多的可挖掘价值。将发生在特定时间的行为次数按照一定的时间单位进行累计后,形成行为时间序列数据。为了确定未来的行为规律,需要对行为时间序列进行预测。但是每一个人的行为(具体而言是未来各个单位时间内的行为次数)是否可以(是否值得)预测需要评估。本专利技术中提出了评估行为序列数据可预测性的方法。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种行为数据的可预测性评估方法、系统及介质。根据本专利技术提供的一种行为数据的可预测性评估方法,包括:步骤M1:通过探针采集行为数据;步骤M2:根据不同的时间间隔单元将行为数据转换为各个时间点上的行
【技术保护点】
1.一种行为数据的可预测性评估方法,其特征在于,包括:/n步骤M1:通过探针采集行为数据;/n步骤M2:根据不同的时间间隔单元将行为数据转换为各个时间点上的行为次数时间序列;/n步骤M3:从各个时间点上的行为次数时间序列中提取出活跃片段;/n步骤M4:计算所有活跃片段的相邻值,比较排列熵;/n步骤M5:比较在不同时间间隔单元设置下获得的活跃片段的相邻值比较排列熵高低,根据排列熵的高低,确定行为序列数据的可预测性高低。/n
【技术特征摘要】
1.一种行为数据的可预测性评估方法,其特征在于,包括:
步骤M1:通过探针采集行为数据;
步骤M2:根据不同的时间间隔单元将行为数据转换为各个时间点上的行为次数时间序列;
步骤M3:从各个时间点上的行为次数时间序列中提取出活跃片段;
步骤M4:计算所有活跃片段的相邻值,比较排列熵;
步骤M5:比较在不同时间间隔单元设置下获得的活跃片段的相邻值比较排列熵高低,根据排列熵的高低,确定行为序列数据的可预测性高低。
2.根据权利要求1所述的一种行为数据的可预测性评估方法,其特征在于,所述步骤M2中的时间间隔单元是能体现出行为规律的时间间隔单元,记录每个时间间隔内的行为总次数从而形成行为次数时间序列。
3.根据权利要求1所述的一种行为数据的可预测性评估方法,其特征在于,所述步骤M3包括:
步骤M3.1:取出行为次数时间序列的最后一个非0值;
步骤M3.2:行为次数时间序列从最后一个非0值往前遍历索引,直到行为次数时间序列当前值到最后一个非0值中的0值数量占当前索引行为次数时间序列段中所有值的数量占比高于预设值;
步骤M3.3:从行为次数时间序列中当前值往前遍历索引,去除前置的连续0值,将当前次数时间序列保存入活跃片段集中;
步骤M3.4:重复执行步骤M3.1至步骤M3.3,直至得到各个时间点上的行为次数时间序列的所有活跃片段。
4.根据权利要求1所述的一种行为数据的可预测性评估方法,其特征在于,所述步骤M4包括:
步骤M4.1:预设相邻值比较排列熵的嵌入维度m,表示计算相邻值比较排列熵时取出的子序列的长度;预设相邻值比较排列熵的时间延迟算子L,表示计算相邻比较排列熵时,从序列中每隔预设值取出一个序列值;将活跃片段序列重构成N-m+1子序列X(1),X(2),…,X(N-m+1);其中,X(i)={u(i),u(i+L),u(i+2L),…,u(i+(m-1)L)}为重构后的行为次数子序列,u(i)表示第i个时间点的行为次数值;
步骤M4.2:根据行为次数子序列中相邻序列值的大小关系,将每一条行为次数子序列映射到相应的一种排列上,则X(i)被映射到由m-1个大小关系构成的排列空间中,|S|=3m-1;其中,S表示长度为m的行为次数子序列映射到的排列空间,|S|表示排列空间的大小;
步骤M4.3:对于每一种排列,根据每一种排列出现的概率计算排列熵,公式如下:
步骤M4.4:根据计算得到的排列熵进行归一化,得到时间序列活跃片段的整体排列熵。
5.一种行为数据的可预测性评估系统,其特征在于,包括:
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。