The invention discloses a user activity anomaly detection and traffic prediction method based on large data analysis, which includes the following steps: 1) obtaining the area number and time information of the anomaly area to be determined; 2) evaluating the empirical cumulative probability curve of the activity of the anomaly area to be determined in the time period by using historical large data, and then determining the flow at each time in the prediction area by using the empirical cumulative probability curve. Activity anomaly value; (3) Take the prediction area as the center, find eight regions adjacent to the prediction area space, then use the SIM (i, j) to measure the spatial similarity of two adjacent regions to find the spatial similarity area K of the prediction area, and then fill in the vacancy value yi, t of the prediction area time series; (4) Predict the time series of the prediction area obtained in step 3, and complete the flow prediction. User activity anomaly detection and traffic prediction based on large data analysis, this method can achieve accurate traffic prediction in the prediction area.
【技术实现步骤摘要】
一种基于大数据分析的用户活动异常检测和流量预测方法
本专利技术属于移动无线网络
,涉及一种基于大数据分析的用户活动异常检测和流量预测方法。
技术介绍
在移动无线网络中,用户体验受无线覆盖、流量负载和基站配置等多种因素影响,用户体验可能会因网络条件的变化而波动。例如,某一热点区域数据流量需求突然增长不利于用户体验,在某些情况下可能最终导致服务中断。因此,用户活动的异常检测和流量预测对于移动无线网络资源的有效分配和调整至关重要。目前,网络异常检测方法已有大量研究,基于已有工作,我们选择了基于聚类的异常检测方法。然而,我们工作区别于他们仅限于检测异常,我们增加历史大数据设定恒定阈值评估异常区域,考察已分配网络资源是否合理;并且我们加入区域流量预测,为下一步网络资源调整提供参考依据,提高资源的利用率。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺点,提供了一种基于大数据分析的用户活动异常检测和流量预测方法,该方法能够实现对预测区域的流量准确预测。为达到上述目的,本专利技术所述的基于大数据分析的用户活动异常检测和流量预测方法包括以下步骤:1)利用机器学习技术对移动网络大数据CDR进行异常检测,以识别移动网络大数据CDR中的待定异常区域,然后获取待定异常区域的区域编号及时段信息;2)利用历史大数据评估待定异常区域在该时段活跃度的经验累积概率曲线,然后利用经验累积概率曲线设定经验异常概率值,当待定异常区域任一时刻的流量活跃度超过经验异常累积概率的95%时,则认定待定异常区域该时刻的流量活跃度异常,即该区域分配的资源不能满足用户活动需求;当待定异常区域任一时刻 ...
【技术保护点】
1.一种基于大数据分析的用户活动异常检测和流量预测方法,其特征在于,包括以下步骤:1)利用机器学习技术对移动网络大数据CDR进行异常检测,以识别移动网络大数据CDR中的待定异常区域,然后获取待定异常区域的区域编号及时段信息;2)利用历史大数据评估待定异常区域在该时段活跃度的经验累积概率曲线,然后利用经验累积概率曲线设定经验异常概率值,当待定异常区域任一时刻的流量活跃度超过经验异常累积概率的95%时,则认定待定异常区域该时刻的流量活跃度异常,即该区域分配的资源不能满足用户活动需求;当待定异常区域任一时刻的流量活跃度小于等于经验异常累积概率的95%时,则说明待定异常区域该时刻的流量活跃度正常,该区域分配的资源能够满足用户活动需求;3)去除预测区域中异常的流量活跃度,使得预测区域的时间序列存在采样值空缺和异常值空缺,以预测区域为中心,查找与预测区域空间相邻的八个区域,然后利用相邻两个区域i,j空间相似性的衡量sim(i,j)找到预测区域的空间相似区域k,然后将预测区域时间序列的空缺值yi,t填补为
【技术特征摘要】
1.一种基于大数据分析的用户活动异常检测和流量预测方法,其特征在于,包括以下步骤:1)利用机器学习技术对移动网络大数据CDR进行异常检测,以识别移动网络大数据CDR中的待定异常区域,然后获取待定异常区域的区域编号及时段信息;2)利用历史大数据评估待定异常区域在该时段活跃度的经验累积概率曲线,然后利用经验累积概率曲线设定经验异常概率值,当待定异常区域任一时刻的流量活跃度超过经验异常累积概率的95%时,则认定待定异常区域该时刻的流量活跃度异常,即该区域分配的资源不能满足用户活动需求;当待定异常区域任一时刻的流量活跃度小于等于经验异常累积概率的95%时,则说明待定异常区域该时刻的流量活跃度正常,该区域分配的资源能够满足用户活动需求;3)去除预测区域中异常的流量活跃度,使得预测区域的时间序列存在采样值空缺和异常值空缺,以预测区域为中心,查找与预测区域空间相邻的八个区域,然后利用相邻两个区域i,j空间相似性的衡量sim(i,j)找到预测区域的空间相似区域k,然后将预测区域时间序列的空缺值yi,t填补为以实现预测区域的时间序列中空缺值的填...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。