互联网流量平台监测方法和系统技术方案

技术编号:32732893 阅读:11 留言:0更新日期:2022-03-20 08:38
本发明专利技术提供一种互联网流量平台监测方法和系统,通过搭建云计算平台,获取互联网数据流,按照对象标识字符的相似度聚类,将相似的对象聚类成簇,并结合时间戳得到带有方向的簇状结构,进一步句法分析和语义分析特征向量,得到信息和话题的大类,从而更加容易判断是否合规,对于不合规的数据流调用云计算溯源,利用边缘和中心两种不同的实体服务器,极大地提高了防护效率。高了防护效率。高了防护效率。

【技术实现步骤摘要】
互联网流量平台监测方法和系统


[0001]本申请涉及网络多媒体领域,尤其涉及一种互联网流量平台监测方法和系统。

技术介绍

[0002]随着网络技术的发展,需要在安全管理过程中,增加更为详细的技术和方法,可以针对安全隐患进行全面细致的监控和把关,充分利用流量分析的优势。同时,云计算与流量监测天生可以相互契合,如何在流量平台监测中用好云计算也是本领域的重要课题。
[0003]因此,急需一种针对性的互联网流量平台监测的方法和系统。

技术实现思路

[0004]本专利技术的目的在于提供一种互联网流量平台监测方法和系统,通过搭建云计算平台,获取互联网数据流,按照对象标识字符的相似度聚类,将相似的对象聚类成簇,并结合时间戳得到带有方向的簇状结构,进一步句法分析和语义分析特征向量,得到信息和话题的大类,从而更加容易判断是否合规,对于不合规的数据流调用云计算溯源,利用边缘和中心两种不同的实体服务器,极大地提高了防护效率。
[0005]第一方面,本申请提供一种互联网流量平台监测方法,所述方法包括:
[0006]在服务器上搭建云计算平台,构建句法模型和语义分析模型,所述句法模型和语义分析模型分别位于云计算平台的不同核实体上,所述核实体是所述云计算平台中处于中心地位的实体服务器;
[0007]根据获取策略,获取互联网平台的数据流,提取特征向量和对象标识,将所述对象标识转换为字符串,将所述特征向量输入句法模型进行断句,得到词分量;
[0008]按字符分解对象标识的所述字符串,根据字符的相似度进行聚类,将相似度高于阈值的若干个对象标识组成簇,并相似度高低和时间戳形成轨迹,所述簇和轨迹构成带有方向的簇状结构;
[0009]将所述词分量输入语义分析模型,输出词含义,所述词含义为去除语气词、简洁、含义唯一、使用大类的单词的语句,将所述词含义重组成新的语句,向量化后得到第二特征向量;
[0010]计算若干个所述第二特征向量之间的相似度,将相似度高于第二阈值的第二特征向量组成类;
[0011]判断所述词含义中是否包括指定的关键词,如果是则继续判断该词含义所在的语句是否形成了指定的含义,如果该语句形成了指定的含义,则认定对应的第二特征向量属于需要报警的情形,针对所述第二特征向量所属的类一起发出报警消息;如果该语句没有形成指定的含义,则认定对应的第二特征向量合规;
[0012]所述云计算平台调用边缘地位的实体服务器,溯源对应的词分量和所述簇状结构,将疑似轨迹和疑似源点发送给中心地位的实体服务器,所述中心地位的实体服务器调用所述云计算平台的计算能力,确定对应数据流的源点,通知所述边缘地位的实体服务器
屏蔽该源点。
[0013]结合第一方面,在第一方面第一种可能的实现方式中,所述溯源还包括风险评估、攻击关联分析和态势感知。
[0014]结合第一方面,在第一方面第二种可能的实现方式中,所述获取互联网平台的数据流包括对所述数据流的编解码。
[0015]结合第一方面,在第一方面第三种可能的实现方式中,所述语义分析模型和句法模型的内核均使用神经网络模型。
[0016]第二方面,本申请提供一种互联网流量平台监测系统,所述系统包括处理器以及存储器:
[0017]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0018]所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。
[0019]第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。
[0020]本专利技术提供一种互联网流量平台监测方法和系统,通过搭建云计算平台,获取互联网数据流,按照对象标识字符的相似度聚类,将相似的对象聚类成簇,并结合时间戳得到带有方向的簇状结构,进一步句法分析和语义分析特征向量,得到信息和话题的大类,从而更加容易判断是否合规,对于不合规的数据流调用云计算溯源,利用边缘和中心两种不同的实体服务器,极大地提高了防护效率。
附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本专利技术方法的流程图。
具体实施方式
[0023]下面结合附图对本专利技术的优选实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。
[0024]图1为本申请提供的互联网流量平台监测方法的流程图,包括:
[0025]在服务器上搭建云计算平台,构建句法模型和语义分析模型,所述句法模型和语义分析模型分别位于云计算平台的不同核实体上,所述核实体是所述云计算平台中处于中心地位的实体服务器;
[0026]根据获取策略,获取互联网平台的数据流,提取特征向量和对象标识,将所述对象标识转换为字符串,将所述特征向量输入句法模型进行断句,得到词分量;
[0027]按字符分解对象标识的所述字符串,根据字符的相似度进行聚类,将相似度高于阈值的若干个对象标识组成簇,并相似度高低和时间戳形成轨迹,所述簇和轨迹构成带有方向的簇状结构;
[0028]将所述词分量输入语义分析模型,输出词含义,所述词含义为去除语气词、简洁、
含义唯一、使用大类的单词的语句,将所述词含义重组成新的语句,向量化后得到第二特征向量;
[0029]计算若干个所述第二特征向量之间的相似度,将相似度高于第二阈值的第二特征向量组成类;
[0030]判断所述词含义中是否包括指定的关键词,如果是则继续判断该词含义所在的语句是否形成了指定的含义,如果该语句形成了指定的含义,则认定对应的第二特征向量属于需要报警的情形,针对所述第二特征向量所属的类一起发出报警消息;如果该语句没有形成指定的含义,则认定对应的第二特征向量合规;
[0031]所述云计算平台调用边缘地位的实体服务器,溯源对应的词分量和所述簇状结构,将疑似轨迹和疑似源点发送给中心地位的实体服务器,所述中心地位的实体服务器调用所述云计算平台的计算能力,确定对应数据流的源点,通知所述边缘地位的实体服务器屏蔽该源点。
[0032]在一些优选实施例中,所述溯源还包括风险评估、攻击关联分析和态势感知。
[0033]在一些优选实施例中,所述获取互联网平台的数据流包括对所述数据流的编解码。
[0034]在一些优选实施例中,所述语义分析模型和句法模型的内核均使用神经网络模型。
[0035]本申请提供一种互联网流量平台监测系统,所述系统包括:所述系统包括处理器以及存储器:
[0036]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0037]所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种互联网流量平台监测方法,其特征在于,所述方法包括:在服务器上搭建云计算平台,构建句法模型和语义分析模型,所述句法模型和语义分析模型分别位于云计算平台的不同核实体上,所述核实体是所述云计算平台中处于中心地位的实体服务器;根据获取策略,获取互联网平台的数据流,提取特征向量和对象标识,将所述对象标识转换为字符串,将所述特征向量输入句法模型进行断句,得到词分量;按字符分解对象标识的所述字符串,根据字符的相似度进行聚类,将相似度高于阈值的若干个对象标识组成簇,并相似度高低和时间戳形成轨迹,所述簇和轨迹构成带有方向的簇状结构;将所述词分量输入语义分析模型,输出词含义,所述词含义为去除语气词、简洁、含义唯一、使用大类的单词的语句,将所述词含义重组成新的语句,向量化后得到第二特征向量;计算若干个所述第二特征向量之间的相似度,将相似度高于第二阈值的第二特征向量组成类;判断所述词含义中是否包括指定的关键词,如果是则继续判断该词含义所在的语句是否形成了指定的含义,如果该语句形成了指定的含义,则认定对应的第二特征向量属于需要报警的情形,针对所述第二特征向量所属的类一起发出报警消息;如果该语句没有形成指定的含义,则认定对应的第...

【专利技术属性】
技术研发人员:苏长君曾祥禄
申请(专利权)人:北京智美互联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1