基于多源数据融合的用户行为检测方法及装置制造方法及图纸

技术编号:22722625 阅读:28 留言:0更新日期:2019-12-04 05:33
本发明专利技术实施例提供一种基于多源数据融合的用户行为检测方法及装置,所述方法包括:基于校园无线网络用户日志获取目标用户的当前行为特征向量和目标用户班级内其他用户的当前行为平均特征向量;获取目标用户的第一历史行为平均特征向量,以及目标用户班级内其他用户的第二历史行为平均特征向量;计算当前行为特征向量与第一历史行为平均特征向量的第一差异程度;计算当前行为特征向量与当前行为平均特征向量之间的第一差值,计算第一与第二历史行为平均特征向量之间的第二差值,基于第一差值和第二差值计算第二差异程度;根据第一差异程度与第二差异程度获得目标用户的行为检测结果。本发明专利技术实施例可有效获取用户行为并检测出异常用户行为。

User behavior detection method and device based on multi-source data fusion

The embodiment of the invention provides a user behavior detection method and device based on multi-source data fusion, the method includes: obtaining the current behavior characteristic vector of the target user and the current behavior average characteristic vector of other users in the target user class based on the campus wireless network user log; obtaining the first history behavior average characteristic vector of the target user and the target user class The second historical behavior average eigenvector of other users in the level; calculate the first difference between the current behavior eigenvector and the first historical behavior average eigenvector; calculate the first difference between the current behavior eigenvector and the current behavior average eigenvector, and calculate the second difference between the first and the second historical behavior average eigenvector, based on the first difference and the second difference The second difference degree is calculated, and the behavior detection result of the target user is obtained according to the first difference degree and the second difference degree. The embodiment of the invention can effectively acquire user behavior and detect abnormal user behavior.

【技术实现步骤摘要】
基于多源数据融合的用户行为检测方法及装置
本专利技术涉及网络通信
,更具体地,涉及一种基于多源数据融合的用户行为检测方法及装置。
技术介绍
近年来,随着移动互联网的迅速发展和智能终端的广泛普及,我国许多高校都实现了校园无线网络的全覆盖。校园无线网作为互联网的重要组成部分,同互联网一样在高速发展中面临着网络管理等方面的问题。学校网络中心、教务处、学生处等部门掌握大量的学生和职工信息,如性别、年龄、年级、课程表、成绩、上网时间、上网地点、网络业务类型等。如何从用户在校园生活中所产生的多源数据中获取有效信息,精准分析用户行为并检测出其中的异常行为的方法或系统,从而更有效地对校园用户进行管理并对学生心理健康做出即时防控,已成为整个社会关注的焦点。网络用户行为是指网络用户在网络生活中所表现出来的行为规律,通常采用网络数据中的相关特征量的统计学特点或相互关系可以定量或定性表示这种行为规律。但是,不同类别网络的用户,分析方法与侧重点存在差异,目前尚未有对于校园网用户的行为进行分析和检测的方法或系统。
技术实现思路
本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的基于多源数据融合的用户行为检测方法及装置。第一方面,本专利技术实施例提供一种基于多源数据融合的用户行为检测方法,包括:基于当前时间段内的校园无线网络用户日志信息分别对目标用户和目标用户所在班级内的各其他用户在所述当前时间段内的上网行为进行分析,获取所述目标用户的当前行为特征向量和所述目标用户所在班级内的各其他用户的当前行为特征向量,并对所述目标用户所在班级内的各其他用户的当前行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量;基于预先构建的历史行为特征数据库,获取所述目标用户在某个历史时间段内的第一历史行为平均特征向量,以及所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量,并对所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的第二历史行为平均特征向量;计算所述目标用户的当前行为特征向量与所述目标用户在所述历史时间段内的第一历史行为平均特征向量之间的第一差异程度;计算所述目标用户的当前行为特征向量与所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量之间的第一差值,计算所述目标用户在所述历史时间段内的第一历史行为平均特征向量与所述目标用户所在班级内的所有其他用户的第二历史行为平均特征向量之间的第二差值,基于所述第一差值和第二差值计算获得第二差异程度;根据所述第一差异程度与第二差异程度对所述目标用户的异常行为进行判定,获得所述目标用户的行为检测结果;其中,所述第一差异程度用于表征用户行为的自我异常程度,所述第二差异程度用于表征用户行为的类比异常程度。第二方面,本专利技术实施例提供一种基于多源数据融合的用户行为检测装置,包括:用户行为分析模块,用于基于当前时间段内的校园无线网络用户日志信息分别对目标用户和目标用户所在班级内的各其他用户在所述当前时间段内的上网行为进行分析,获取所述目标用户的当前行为特征向量和所述目标用户所在班级内的各其他用户的当前行为特征向量,并对所述目标用户所在班级内的各其他用户的当前行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量;历史行为特征获取模块,用于基于预先构建的历史行为特征数据库,获取所述目标用户在某个历史时间段内的第一历史行为平均特征向量,以及所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量,并对所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的第二历史行为平均特征向量;第一差异程度计算模块,用于计算所述目标用户的当前行为特征向量与所述目标用户在所述历史时间段内的第一历史行为平均特征向量之间的第一差异程度;第二差异程度计算模块,用于计算所述目标用户的当前行为特征向量与所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量之间的第一差值,计算所述目标用户在所述历史时间段内的第一历史行为平均特征向量与所述目标用户所在班级内的所有其他用户的第二历史行为平均特征向量之间的第二差值,基于所述第一差值和第二差值计算获得第二差异程度;检测模块,用于根据所述第一差异程度与第二差异程度对所述目标用户的异常行为进行判定,获得所述目标用户的行为检测结果;其中,所述第一差异程度用于表征用户行为的自我异常程度,所述第二差异程度用于表征用户行为的类比异常程度。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的基于多源数据融合的用户行为检测方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的基于多源数据融合的用户行为检测方法的步骤。本专利技术实施例提供的基于多源数据融合的用户行为检测方法及装置,以网络日志数据为基础,通过对数据进行特征提取,获取用户行为,并检测出异常的用户行为,有利于管理部门对异常行为用户进行提前干预,降低异常行为导致的安全风险,方法操作简单,具有较高的实用性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于多源数据融合的用户行为检测方法的流程示意图;图2为本专利技术实施例提供的基于多源数据融合的用户行为检测装置的结构示意图;图3为本专利技术实施例提供的电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例主要针对校园网用户中的学生群体进行研究,通过引入数据挖掘算法对校园网用户行为进行分析和特征描述,得出其行为模式,并检测出异常用户行为,为网络管理者提供决策支持。如图1所示,为本专利技术实施例提供的基于多源数据融合的用户行为检测方法的流程示意图,包括:步骤100、基于当前时间段内的校园无线网络用户日志信息分别对目标用户和目标用户所在班级内的各其他用户在所述当前时间段内的上网行为进行分析,获取所述目标用户的当前行为特征向量和所述目标用户所在班级内的本文档来自技高网...

【技术保护点】
1.一种基于多源数据融合的用户行为检测方法,其特征在于,包括:/n基于当前时间段内的校园无线网络用户日志信息分别对目标用户和目标用户所在班级内的各其他用户在所述当前时间段内的上网行为进行分析,获取所述目标用户的当前行为特征向量和所述目标用户所在班级内的各其他用户的当前行为特征向量,并对所述目标用户所在班级内的各其他用户的当前行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量;/n基于预先构建的历史行为特征数据库,获取所述目标用户在某个历史时间段内的第一历史行为平均特征向量,以及所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量,并对所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的第二历史行为平均特征向量;/n计算所述目标用户的当前行为特征向量与所述目标用户在所述历史时间段内的第一历史行为平均特征向量之间的第一差异程度;/n计算所述目标用户的当前行为特征向量与所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量之间的第一差值,计算所述目标用户在所述历史时间段内的第一历史行为平均特征向量与所述目标用户所在班级内的所有其他用户的第二历史行为平均特征向量之间的第二差值,基于所述第一差值和第二差值计算获得第二差异程度;/n根据所述第一差异程度与第二差异程度对所述目标用户的异常行为进行判定,获得所述目标用户的行为检测结果;/n其中,所述第一差异程度用于表征用户行为的自我异常程度,所述第二差异程度用于表征用户行为的类比异常程度。/n...

【技术特征摘要】
1.一种基于多源数据融合的用户行为检测方法,其特征在于,包括:
基于当前时间段内的校园无线网络用户日志信息分别对目标用户和目标用户所在班级内的各其他用户在所述当前时间段内的上网行为进行分析,获取所述目标用户的当前行为特征向量和所述目标用户所在班级内的各其他用户的当前行为特征向量,并对所述目标用户所在班级内的各其他用户的当前行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量;
基于预先构建的历史行为特征数据库,获取所述目标用户在某个历史时间段内的第一历史行为平均特征向量,以及所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量,并对所述目标用户所在班级内的各其他用户在所述历史时间段内的历史行为特征向量求平均,获得所述目标用户所在班级内的所有其他用户对应的第二历史行为平均特征向量;
计算所述目标用户的当前行为特征向量与所述目标用户在所述历史时间段内的第一历史行为平均特征向量之间的第一差异程度;
计算所述目标用户的当前行为特征向量与所述目标用户所在班级内的所有其他用户对应的当前行为平均特征向量之间的第一差值,计算所述目标用户在所述历史时间段内的第一历史行为平均特征向量与所述目标用户所在班级内的所有其他用户的第二历史行为平均特征向量之间的第二差值,基于所述第一差值和第二差值计算获得第二差异程度;
根据所述第一差异程度与第二差异程度对所述目标用户的异常行为进行判定,获得所述目标用户的行为检测结果;
其中,所述第一差异程度用于表征用户行为的自我异常程度,所述第二差异程度用于表征用户行为的类比异常程度。


2.根据权利要求1所述的基于多源数据融合的用户行为检测方法,其特征在于,所述行为特征向量包括:度量用户上网时间段分布的特征,度量用户上网位置分布的特征,度量用户上网喜好的特征,以及度量用户合群程度的特征。


3.根据权利要求2所述的基于多源数据融合的用户行为检测方法,其特征在于,所述基于当前时间段内的校园无线网络用户日志信息分别对目标用户和目标用户所在班级内的各其他用户在所述当前时间段内的上网行为进行分析,获取所述目标用户的当前行为特征向量和所述目标用户所在班级内的各其他用户的当前行为特征向量的步骤,具体为:
获取当前时间段内的校园无线网络用户日志信息,所述校园无线网络用户日志信息包括:用户ID、用户上下线时间、目标URL、终端MAC地址、网络接入点MAC地址;
将每天按小时为单位划分为24个时段,基于所述当前时间段内的校园无线网络用户日志信息中的用户上下线时间,确定目标用户和目标用户所在班级内的各其他用户在各时段内的上网时间,获得度量所述目标用户和目标用户所在班级内的各其他用户上网时间段分布的特征;
基于所述当前时间段内的校园无线网络用户日志信息中的网络接入点MAC地址标识目标用户和目标用户所在班级内的各其他用户的位置,并统计单位时间内通过各个接入点上网的时长,确定目标用户和目标用户所在班级内的各其他用户在各个位置的上网时间,获得度量所述目标用户和目标用户所在班级内的各其他用户上网位置分布的特征;
将网络日志中的目标URL分为多个网络业务类别,基于所述当前时间段内的校园无线网络用户日志信息中的目标URL,确定目标用户和目标用户所在班级内的各其他用户在各个网络业务的所耗时长,获得度量所述目标用户和目标用户所在班级内的各其他用户上网喜好的特征;
基于所述当前时间段内的校园无线网络用户日志信息中的终端MAC地址和网络接入点MAC地址,计算用户与其同班同学的关系度均值,获得度量所述目标用户和目标用户所在班级内的各其他用户合群程度的特征;
其中,所述关系度具体为两个用户同时接入同一网络接入点的时间占比。


4.根据权利要求1所述的基于多源数据融合的用户行为检测方法,其特征在于,采用如下公式计算所述目标用户的当前行为特征向量与所...

【专利技术属性】
技术研发人员:刘银龙耿立茹王旭仁付佳田野谢菲冯祥虎
申请(专利权)人:中国科学院信息工程研究所首都师范大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1