一种网络流量数据提取方法及装置制造方法及图纸

技术编号:24015048 阅读:57 留言:0更新日期:2020-05-02 03:05
公开了一种网络流量数据提取方法及装置。一种网络流量数据提取方法,其特征在于,该方法包括:获取至少一条网络流量;针对所述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;所述结构化数据记录中包含固定数量的数据项;根据解析结果,确定数据记录中至少一个数据项内容所对应的业务含义;根据预设的筛选规则,将与筛选规则相匹配的数据项内容与该数据项对应的网络流量标识进行关联存储。通过本说明书实施例所提供的方案,能够准确地从网络流量中提取出符合条件的数据,如隐私数据,再结合安全多方计算技术,能够高效地分析数据输出行为。

A network traffic data extraction method and device

【技术实现步骤摘要】
一种网络流量数据提取方法及装置
本说明书实施例涉及信息安全
,尤其涉及一种网络流量数据提取方法及装置。
技术介绍
保护用户数据是企业重要的责任,为了更好地保护用户数据,企业通常会解析网络流量获取其中包含的数据,以此监控、分析数据输出行为。但是网络流量所包含的数据往往并非标准的结构化的数据,难以直接从中获取可用于分析的有价值的数据。目前虽然可以单纯地通过正则表示式引擎来解析网络流量,但这种方式能解析的网络流量类型较少、解析准确性较低而且无法解析脱敏后的数据,所以通过这种方式得到的解析结果无法作为分析数据输出行为的可靠依据。
技术实现思路
针对上述技术问题,本说明书实施例提供一种网络流量数据提取方法及装置,技术方案如下:根据本说明书实施例的第一方面,提供一种网络流量数据提取方法,该方法包括:获取至少一条网络流量;针对上述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;上述结构化数据记录中包含固定数量的数据项;...

【技术保护点】
1.一种网络流量数据提取方法,所述方法包括:/n获取至少一条网络流量;/n针对所述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;所述结构化数据记录中包含固定数量的数据项;/n根据解析结果,确定数据记录中至少一个数据项内容所对应的业务含义;/n根据预设的筛选规则,将与筛选规则相匹配的数据项内容与该数据项对应的网络流量标识进行关联存储。/n

【技术特征摘要】
1.一种网络流量数据提取方法,所述方法包括:
获取至少一条网络流量;
针对所述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;所述结构化数据记录中包含固定数量的数据项;
根据解析结果,确定数据记录中至少一个数据项内容所对应的业务含义;
根据预设的筛选规则,将与筛选规则相匹配的数据项内容与该数据项对应的网络流量标识进行关联存储。


2.根据权利要求1所述的方法,所述确定该条网络流量的传输格式,包括:
若所获取的网络流量为请求体类型,则将该条网络流量的传输格式确定为请求体的统一传输格式。


3.根据权利要求1所述的方法,所述确定该条网络流量的传输格式,包括:
若所获取的网络流量为返回体类型,则进一步检查该条网络流量中包含的格式标记;
将所述格式标记所标识的传输格式确定为该条网络流量的传输格式。


4.根据权利要求1所述的方法,所述结构化数据以键值对方式存储,所述数据项包括:键类型数据项和值类型数据项。


5.根据权利要求4所述的方法,所述确定数据记录中至少一个数据项内容所对应的业务含义,包括:
针对所述数据记录中的任一键类型数据项,检查该键类型数据项内容中包含的关键词,将所述关键词的业务含义确定为该键类型数据项对应的值类型数据项内容的业务含义。


6.根据权利要求1所述的方法,所述确定数据记录中至少一个数据项内容所对应的业务含义,包括:
针对所述数据记录中的任一目标数据项,确定该目标数据项的关联数据项;
检查该关联数据项内容中包含的关键词,将所述关键词的业务含义确定为该目标数据项内容的业务含义。


7.根据权利要求4所述的方法,所述解析结果中包括至少两条结构化数据记录;
所述确定数据记录中至少一个数据项内容所对应的业务含义,包括:
针对所述至少两条结构化数据记录中相同键类型数据项对应的任一值类型数据项,根据预设的含义判定规则,确定该值类型数据项内容的业务含义;
按照预设的选择规则,从确定出的业务含义中选择一种业务含义,将其确定为该键类型数据项所对应的值类型数据项内容的业务含义。


8.根据权利要求7所述的方法,所述按照预设的选择规则,从确定出的业务含义中选择一种业务含义,包括:
对确定出的每种业务含义,统计被确定为该业务含义的值类型数据项的数量;
当统计结果满足预设的取值条件时,选择统计结果中数量的最大值对应的业务含义。


9.一种基于如权利要求1至8任一项所述网络流量数据的异常行为识别方法,所述网络流量标识包括:网络流量的发送方标识,和/或网络流量的接收方标识,该方法包括:
针对任一发送方标识和/或接收方标识,若该标识所关联的数据项内容满足预设异常判定条件,则确定对应的发送方和/或接收方的行为异常。


10.一种网络流量数据提取装置,所述装置...

【专利技术属性】
技术研发人员:蒋学垲
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1