基于密度峰值多属性聚类的网络日志分析方法技术

技术编号:26975794 阅读:41 留言:0更新日期:2021-01-06 00:11
本发明专利技术公开了一种基于密度峰值多属性聚类的网络日志分析方法,包括如下步骤:步骤一,将网络日志数据输入到分布模型内,通过分布模型输出网络日志数据分布图;步骤二,针对离散点状分布的网络日志数据采用密度峰值聚类算法进行聚类,得到聚类结果;步骤三,对步骤二中获得的聚类结果进行分析,输出分析结果;其中,步骤一中的分布模型内具有若干个选择权项,通过选择不同的选择权项,使得网络日志数据在分布模型输出不同样式的网络日志数据分布图。本发明专利技术的基于密度峰值多属性聚类的网络日志分析方法,通过分布模型的设置,便可有效的实现将网络日志数据根据选择权项进行分别聚类。

【技术实现步骤摘要】
基于密度峰值多属性聚类的网络日志分析方法
本专利技术涉及一种网络日志分析方法,更具体的说是涉及一种基于密度峰值多属性聚类的网络日志分析方法。
技术介绍
网络日志是用户单位在连接服务器的过程中,对于用户在使用互联网的过程中的相关选择情况都有详细的记录,因此通过对于网络日志内容进行分析可以有效的了解到每个用户连接服务器时的大致需求。然而由于网络日志是实时记录的因此其内所存在的数据量便十分的大,而现有技术中对于网络日志进行分析的方式主要是参数分析的方式,然而现有的分析方式主要是通过对数据进行聚类,然后根据聚类结果分析出用户在访问服务器的时候的喜好以及用户行为习惯,以此实现在用户访问服务器时提供给用户有用的访问信息,一方面可以降低用户的反感度,另一方面可以增加用户的粘性,然而现有聚类方法主要采用根据数值规律进行聚类,因而需要人为的去设定聚类数值,如此便会增加人的工作量,并且现有的数据量属性繁多,因此在聚类的过程中,便需要人去设定过多的聚类参数,以此实现对数据进行分属性聚类,如此使得人的工作量较大。
技术实现思路
针对现有技术存在的不本文档来自技高网...

【技术保护点】
1.一种基于密度峰值多属性聚类的网络日志分析方法,其特征在于:包括如下步骤:/n步骤一,将网络日志数据输入到分布模型内,通过分布模型输出网络日志数据分布图;/n步骤二,针对离散点状分布的网络日志数据采用密度峰值聚类算法进行聚类,得到聚类结果;/n步骤三,对步骤二中获得的聚类结果进行分析,输出分析结果;/n其中,步骤一中的分布模型内具有若干个选择权项,通过选择不同的选择权项,使得网络日志数据在分布模型输出不同样式的网络日志数据分布图。/n

【技术特征摘要】
1.一种基于密度峰值多属性聚类的网络日志分析方法,其特征在于:包括如下步骤:
步骤一,将网络日志数据输入到分布模型内,通过分布模型输出网络日志数据分布图;
步骤二,针对离散点状分布的网络日志数据采用密度峰值聚类算法进行聚类,得到聚类结果;
步骤三,对步骤二中获得的聚类结果进行分析,输出分析结果;
其中,步骤一中的分布模型内具有若干个选择权项,通过选择不同的选择权项,使得网络日志数据在分布模型输出不同样式的网络日志数据分布图。


2.根据权利要求1所述的基于密度峰值多属性聚类的网络日志分析方法,其特征在于:所述步骤一中分布模型的选择权项包括用户内容权项、用户点击权项和用户访问时间权项,所述步骤一的分布模型进行如下步骤:
步骤一一,输入网络日志数据前,先让工作人员选择选择权项,在选择完成以后进行后续步骤;
步骤一二,当工作人员选择用户内容权项时,以服务器所能够提供的站点内容作为竖轴,以用户查看站点内容的时间作为横轴,将网络日志数据输入到该坐标轴内,使得网络日志数据在坐标轴上形成离散的多个数据点;
步骤一三,当工作人员选择用户点击权项时,以用户访问服务器总体时间作为竖轴,以用户点击次数作为横轴,将网络日志数据输入到该坐标轴内,使得网络日志数据在坐标轴上形成离散的多个数据点;
步骤一四,当工作人员选择用户访问时间权项时,以用户访问服务器的单次时间为竖轴,以用户点击次数作为横轴,将网络日志数据输入到该坐标轴内,使得网络日志数据在坐标轴上形成离散的多个数据点。


3.根据权利要求2所述的基于密度峰值多属性聚类的网络日志分析方法,其特征在于:所述步骤三中对步骤二中获得聚类结果进行分析...

【专利技术属性】
技术研发人员:刘世华张浩吴刚
申请(专利权)人:温州职业技术学院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1