互联网行为数据监控方法、装置、设备及存储介质制造方法及图纸

技术编号:37139892 阅读:25 留言:0更新日期:2023-04-06 21:43
本发明专利技术涉及数据处理领域,公开了一种互联网行为数据监控方法、装置、设备及存储介质,用于提高互联网行为数据监控的准确率。所述方法包括:获取目标网页的页面配置数据,并根据页面配置数据确定页面交互数据;对页面交互数据进行解析,得到行为指标数据,并对行为指标数据进行特征提取,得到特征行为数据集;将特征行为数据集输入特征归类模型进行行为特征归类,得到行为特征归类结果;根据行为特征归类结果对行为指标数据进行行为异常检测,得到异常检测结果;根据异常检测结果确定异常指标数据,并根据异常指标数据查找页面异常统计节点;根据页面异常统计节点和页面配置数据生成行为数据监控结果。行为数据监控结果。行为数据监控结果。

【技术实现步骤摘要】
互联网行为数据监控方法、装置、设备及存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种互联网行为数据监控方法、装置、设备及存储介质。

技术介绍

[0002]常见互联网网站服务产品中,需要合理地收集终端(统计器)用户对网站交互行为来不断改善网站用户交互体验,如收集分析用户对具体网站页面访问、网站上某一功能按钮点击行为等用作进一步分析解读。
[0003]目前互联网技术一般采用在用户进行交互时,使用Javascript对用户交互信息进行记录,记录内容一般为:交互所在页面信息、交互对象、交互时间等,并在合适时机发送该部分信息到网站服务器上进行收集汇总,最后根据需求提取分析该部分数据。但是现有方案对互联网行为数据的监控分析准确率低。

技术实现思路

[0004]本专利技术提供了一种互联网行为数据监控方法、装置、设备及存储介质,用于提高互联网行为数据监控的准确率。
[0005]本专利技术第一方面提供了一种互联网行为数据监控方法,所述互联网行为数据监控方法包括:获取目标网页的页面配置数据,并根据所述页面配置数据确定目标用户的页面交互数据;对所述页面交互数据进行解析,得到所述目标用户的行为指标数据,并对所述行为指标数据进行特征提取,得到特征行为数据集;将所述特征行为数据集输入预置的特征归类模型进行行为特征归类,得到行为特征归类结果;根据所述行为特征归类结果对所述行为指标数据进行行为异常检测,得到异常检测结果;根据所述异常检测结果确定异常指标数据,并根据所述异常指标数据查找所述目标用户对应的页面异常统计节点;根据所述页面异常统计节点和所述页面配置数据生成所述目标用户对应的行为数据监控结果。
[0006]可选的,在本专利技术第一方面的第一种实现方式中,所述对所述页面交互数据进行解析,得到所述目标用户的行为指标数据,并对所述行为指标数据进行特征提取,得到特征行为数据集,包括:对所述页面交互数据进行配置特征分析,得到目标配置特征;基于所述目标配置特征和所述页面交互数据生成所述目标用户的行为指标数据;对所述行为指标数据进行噪声去除,得到标准指标数据;根据预设的特征节点对所述标准指标数据进行特征提取,得到特征行为数据集。
[0007]可选的,在本专利技术第一方面的第二种实现方式中,所述将所述特征行为数据集输入预置的特征归类模型进行行为特征归类,得到行为特征归类结果,包括:将所述特征行为数据集输入预置的特征归类模型;通过所述特征归类模型对所述特征行为数据集进行分簇,得到多个特征数据簇;根据所述多个特征数据簇获取聚类中心,并根据所述聚类中心生成所述特征指标数据对应的行为特征归类结果。
[0008]可选的,在本专利技术第一方面的第三种实现方式中,所述根据所述行为特征归类结
果对所述行为指标数据进行行为异常检测,得到异常检测结果,包括:提取所述行为特征归类结果中的聚类中心和多个数据点;分别计算所述多个数据点和所述聚类中心的距离参数,得到每个数据点对应的目标距离参数;根据每个数据点对应的目标距离参数生成目标均值;判断所述目标距离参数是否大于所述目标均值;若是,则确定异常检测结果为所述行为指标数据存在异常;若否,则确定异常检测结果为所述行为指标数据不存在异常。
[0009]可选的,在本专利技术第一方面的第四种实现方式中,所述根据所述异常检测结果确定异常指标数据,并根据所述异常指标数据查找所述目标用户对应的页面异常统计节点,包括:若所述异常检测结果为所述行为指标数据存在异常,则查找所述目标距离参数对应的异常数据点;获取所述异常数据点对应的指标数据,得到异常指标数据;根据所述异常指标数据匹配所述目标用户对应的异常节点,并将所述异常节点作为页面异常统计节点。
[0010]可选的,在本专利技术第一方面的第五种实现方式中,所述根据所述页面异常统计节点和所述页面配置数据生成所述目标用户对应的行为数据监控结果,包括:根据所述页面异常统计节点和所述页面配置数据确定行为异常信息;根据所述页面异常统计节点确定所述目标用户的监控异常类型;根据所述行为异常信息和所述监控异常类型生成行为数据监控结果。
[0011]可选的,在本专利技术第一方面的第六种实现方式中,所述互联网行为数据监控方法还包括:提取所述行为指标数据对应的疑似异常点和质心,并计算所述疑似异常点到质心的第一距离,以及计算所述第一距离和距离均值对应的差值;计算所述疑似异常点的数据点到质心的第二距离,并计算所述第二距离对应的预设倍数值,得到特征值;对比所述差值和所述特征值,若所述差值大于所述特征值,则确定所述行为指标数据异常,输出异常数据坐标;根据所述异常数据坐标生成页面异常统计节点。
[0012]本专利技术第二方面提供了一种互联网行为数据监控装置,所述互联网行为数据监控装置包括:获取模块,用于获取目标网页的页面配置数据,并根据所述页面配置数据确定目标用户的页面交互数据;解析模块,用于对所述页面交互数据进行解析,得到所述目标用户的行为指标数据,并对所述行为指标数据进行特征提取,得到特征行为数据集;归类模块,用于将所述特征行为数据集输入预置的特征归类模型进行行为特征归类,得到行为特征归类结果;检测模块,用于根据所述行为特征归类结果对所述行为指标数据进行行为异常检测,得到异常检测结果;查找模块,用于根据所述异常检测结果确定异常指标数据,并根据所述异常指标数据查找所述目标用户对应的页面异常统计节点;生成模块,用于根据所述页面异常统计节点和所述页面配置数据生成所述目标用户对应的行为数据监控结果。
[0013]可选的,在本专利技术第二方面的第一种实现方式中,所述解析模块具体用于:对所述页面交互数据进行配置特征分析,得到目标配置特征;基于所述目标配置特征和所述页面交互数据生成所述目标用户的行为指标数据;对所述行为指标数据进行噪声去除,得到标准指标数据;根据预设的特征节点对所述标准指标数据进行特征提取,得到特征行为数据集。
[0014]可选的,在本专利技术第二方面的第二种实现方式中,所述归类模块具体用于:将所述特征行为数据集输入预置的特征归类模型;通过所述特征归类模型对所述特征行为数据集进行分簇,得到多个特征数据簇;根据所述多个特征数据簇获取聚类中心,并根据所述聚类中心生成所述特征指标数据对应的行为特征归类结果。
[0015]可选的,在本专利技术第二方面的第三种实现方式中,所述检测模块具体用于:提取所述行为特征归类结果中的聚类中心和多个数据点;分别计算所述多个数据点和所述聚类中心的距离参数,得到每个数据点对应的目标距离参数;根据每个数据点对应的目标距离参数生成目标均值;判断所述目标距离参数是否大于所述目标均值;若是,则确定异常检测结果为所述行为指标数据存在异常;若否,则确定异常检测结果为所述行为指标数据不存在异常。
[0016]可选的,在本专利技术第二方面的第四种实现方式中,所述查找模块具体用于:若所述异常检测结果为所述行为指标数据存在异常,则查找所述目标距离参数对应的异常数据点;获取所述异常数据点对应的指标数据,得到异常指标数据;根据所述异常指标数据匹配所述目标用户对应的异常节点,并将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种互联网行为数据监控方法,其特征在于,所述互联网行为数据监控方法包括:获取目标网页的页面配置数据,并根据所述页面配置数据确定目标用户的页面交互数据;对所述页面交互数据进行解析,得到所述目标用户的行为指标数据,并对所述行为指标数据进行特征提取,得到特征行为数据集;将所述特征行为数据集输入预置的特征归类模型进行行为特征归类,得到行为特征归类结果;根据所述行为特征归类结果对所述行为指标数据进行行为异常检测,得到异常检测结果;根据所述异常检测结果确定异常指标数据,并根据所述异常指标数据查找所述目标用户对应的页面异常统计节点;具体的,通过获取的原始时间序列数据以及异常数据点位置,采用最近的k个非异常数据点的均值对异常数据点进行初始化,将相似的子序列数据聚到同一个类簇中,查找相似的已修复子序列数据,时间序列数据中的相似子序列数据作为一种全局信息,最后使用多个相似子序列数据的均值的加权累加值作为修复后异常数据点的值,根据异常指标数据匹配目标用户对应的异常节点,并将异常节点作为页面异常统计节点;根据所述页面异常统计节点和所述页面配置数据生成所述目标用户对应的行为数据监控结果。2.根据权利要求1所述的互联网行为数据监控方法,其特征在于,所述对所述页面交互数据进行解析,得到所述目标用户的行为指标数据,并对所述行为指标数据进行特征提取,得到特征行为数据集,包括:对所述页面交互数据进行配置特征分析,得到目标配置特征;基于所述目标配置特征和所述页面交互数据生成所述目标用户的行为指标数据;对所述行为指标数据进行噪声去除,得到标准指标数据;根据预设的特征节点对所述标准指标数据进行特征提取,得到特征行为数据集。3.根据权利要求1所述的互联网行为数据监控方法,其特征在于,所述将所述特征行为数据集输入预置的特征归类模型进行行为特征归类,得到行为特征归类结果,包括:将所述特征行为数据集输入预置的特征归类模型;通过所述特征归类模型对所述特征行为数据集进行分簇,得到多个特征数据簇;根据所述多个特征数据簇获取聚类中心,并根据所述聚类中心生成所述特征指标数据对应的行为特征归类结果。4.根据权利要求1所述的互联网行为数据监控方法,其特征在于,所述根据所述行为特征归类结果对所述行为指标数据进行行为异常检测,得到异常检测结果,包括:提取所述行为特征归类结果中的聚类中心和多个数据点;分别计算所述多个数据点和所述聚类中心的距离参数,得到每个数据点对应的目标距离参数;根据每个数据点对应的目标距离参数生成目标均值;判断所述目标距离参数是否大于所述目标均值;若是,则确定异常检测结果为所述行为指标数据存在异常;
若否,则确定异常检测结果为所述行为指标数据不存在异常。5.根据权利要求4所述的互联网行为数据监控方法,其特征在于,所述根据所述异常检测结果确定异常指标数据,并根据所述异常指标数据查找所述目标用户对应的页面异常统计节点,包括:若所述异常检测结果为所述行为指标数据存在异常,则查找所述目标距离参数对应的异常数据点;获取...

【专利技术属性】
技术研发人员:黄仕荣
申请(专利权)人:深圳小鹅网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1