【技术实现步骤摘要】
数据的处理方法及装置
[0001]本说明书涉及计算机
,尤其涉及一种数据的处理方法及装置。
技术介绍
[0002]随着互联网科技的飞速发展,互联网产品在世界范围内得到了极大的普及。人们的使用伴随着海量日志数据的产生,而这些日志数据中通常包含用户的隐私数据。随着大家对自己的隐私数据越来越关注,用户数据的隐私保护也被越来越重视,基于此,高效地进行隐私数据溯源定位变得尤为重要。
[0003]目前,日志数据产生后,直接存储在互联网产品对应的数据池中,在这种情况下,若要对隐私数据进行溯源定位,一般采用正则或者匹配的方法,从存储有海量数据的数据池中检索出相应的日志数据,这种方式不仅检索成本高,而且检索效率低。
技术实现思路
[0004]一方面,本说明书一个或多个实施例提供一种数据的处理方法,包括:获取指定时间段内产生的日志数据。针对每条所述日志数据,按照预设泛化方式对所述日志数据进行泛化处理,得到与所述日志数据对应的第一数据,所述第一数据与至少一条所述日志数据相对应。根据所述第一数据确定所述日志数据的第一索引数据,并将所述第一索引数据存储至第一存储区域。根据所述第一索引数据,对所述指定时间段内产生的日志数据进行分区处理,得到至少一个第一数据分区,并将所述第一索引数据和所述至少一个第一数据分区对应存储至第二存储区域,每个所述第一数据分区中的每条所述日志数据均与同一个所述第一索引数据相对应。
[0005]另一方面,本说明书一个或多个实施例提供一种数据的处理装置,包括:第一获取模块,用于获取指定时 ...
【技术保护点】
【技术特征摘要】
1.一种数据的处理方法,包括:获取指定时间段内产生的日志数据;针对每条所述日志数据,按照预设泛化方式对所述日志数据进行泛化处理,得到与所述日志数据对应的第一数据;所述第一数据与至少一条所述日志数据相对应;根据所述第一数据确定所述日志数据的第一索引数据,并将所述第一索引数据存储至第一存储区域;根据所述第一索引数据,对所述指定时间段内产生的日志数据进行分区处理,得到至少一个第一数据分区,并将所述第一索引数据和所述至少一个第一数据分区对应存储至第二存储区域;每个所述第一数据分区中的每条所述日志数据均与同一个所述第一索引数据相对应。2.根据权利要求1所述的方法,所述获取指定时间段内产生的日志数据之后,所述方法还包括:按照预设时间间隔,对所述指定时间段内产生的日志数据进行分区处理,得到至少一个第二数据分区;每个所述第二数据分区中包括至少一条所述日志数据;所述根据所述第一索引数据,对所述指定时间段内产生的日志数据进行分区处理,得到至少一个第一数据分区,包括:根据所述第一索引数据,对所述至少一个第二数据分区中的所述日志数据进行分区处理,得到所述至少一个第一数据分区。3.根据权利要求1所述的方法,所述按照预设泛化方式对所述日志数据进行泛化处理,得到与所述日志数据对应的第一数据,包括:根据预设的数据特征与泛化特征之间的映射关系,将所述日志数据中的每个数据特征映射为对应的泛化特征,得到与所述日志数据对应的第一数据;所述第一数据包括至少一个所述泛化特征。4.根据权利要求1所述的方法,所述第一存储区域为关系型数据库;所述根据所述第一数据确定所述日志数据的第一索引数据,包括以下其中一项:将所述第一数据确定为所述日志数据的第一索引数据;生成与所述第一数据对应的哈希值,将所述哈希值确定为所述日志数据的第一索引数据;生成与所述第一数据对应的高维矩阵,将所述高维矩阵确定为所述日志数据的第一索引数据。5.根据权利要求4所述的方法,所述将所述第一索引数据存储至第一存储区域之后,所述方法还包括:按照预设排序维度,对所述第一存储区域中存储的第一索引数据进行排序处理,得到有序排列的所述第一索引数据。6.根据权利要求1所述的方法,所述第一存储区域为前缀树;所述根据所述第一数据确定所述日志数据的第一索引数据,包括:将所述第一数据转换成对应的二进制数据;将所述二进制数据确定为所述日志数据的第一索引数据。7.根据权利要求4或6所述的方法,所述方法还包括:
获取待检索数据;按照所述预设泛化方式对所述待检索数据进行泛化处理,得到与所述待检索数据对应的第二数据;根据所述第二数据确定所述待检索数据的第二索引数据;查询所述第一存储区域中是否存在与所述第二索引数据相匹配的第一索引数据;若是,则确定所述第二存储区域中存储有所述待检索数据。8.根据权利要求7所述的方法,所述确定所述第二存储区域中存储有所述待检索数据之后,所述方法还包括:根据与所述第二索引数据相匹配的第一索引数据,在所述第二存储区域中查询对应的第一数据分区;分别对查询到的所述第一数据分区中的每条所述日志数据与所述待检索数据进行匹配处理,并输出与所述待检索数据相匹配的日志数据。9.根据权利要求7所述的方...
【专利技术属性】
技术研发人员:郭飞,刘焱,刘威歆,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。