【技术实现步骤摘要】
本专利技术涉及数据处理技术,特别是涉及一种数据处理方法和装置。
技术介绍
一个目标可能含有多种不同类型的描述信息,而在对目标的数据进行处理时,由于不同类型的描述信息是由不同的处理方法得到的,因此会对各类型的描述信息分别进行存储。上述的处理方法就使得同一目标的描述信息存储于多个不同的文件中,因而当要对该目标进行处理时,就需要分别从不同的文件中获取该目标的描述信息。在这个过程中,需要分别遍历每一个文件的数据,以查找所述目标的描述信息。例如,针对网络中不同网站的浏览数据,则所述网站的浏览数据可以包括访问量、点击率、用户的平均访问时间等,若将网站作为目标,由于对于不同的浏览数据会采用不同的处理方法,因而上述浏览数据经过处理后会保存于不同的文件中。当要对网站的浏览数据进行综合分析时,就需要分别获取每个网站的浏览数据,即针对每一个网站,要分别遍历每一个文件,查找到所述目标再获取对应的数据。但是,采用上述这种方法获取数据时,由于要多次遍历多种不同的文件,因此处理时间比较长,效率较低。
技术实现思路
本专利技术提供了一种数据处理方法和装置,以解决现有技术多次遍历多种不同的文件,导致 ...
【技术保护点】
一种数据处理方法,其特征在于,包括:获取n种目标文件,其中,所述目标文件用于存储各个目标的描述信息,一种目标文件存储一种类型的描述信息,n为正整数;对第一种目标文件进行遍历,并依次获取所述第一种目标文件中的目标,对应类型的描述信息,以及所述目标在第一种目标文件中的行数;按照在第一种目标文件中的行数确定所述目标在其他目标文件的相应行数,并依次在其他目标文件的相应行数查找所述目标,并获取对应类型的描述信息,其中,所述其他目标文件是除第一种目标文件以外的n?1种目标文件;将所述目标和对应各类型的描述信息进行关联,构成总目标文件。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括: 获取η种目标文件,其中,所述目标文件用于存储各个目标的描述信息,一种目标文件存储一种类型的描述信息,η为正整数; 对第一种目标文件进行遍历,并依次获取所述第一种目标文件中的目标,对应类型的描述信息,以及所述目标在第一种目标文件中的行数; 按照在第一种目标文件中的行数确定所述目标在其他目标文件的相应行数,并依次在其他目标文件的相应行数查找所述目标,并获取对应类型的描述信息,其中,所述其他目标文件是除第一种目标文件以外的η-1种目标文件; 将所述目标和对应各类型的描述信息进行关联,构成总目标文件。2.根据权利要求1所述的方法,其特征在于,所述获取η种目标文件之后,还包括: 获取每种目标文件的总行数,并将其他目标文件的总行数,以第一种目标文件的总行数为基准进行归一化处理,获取其他目标文件相对应第一种目标文件的行数比。3.根据权利要求2所述的方法,其特征在于,还包括: 当所述目标在第一种目标文件中的行数达到预设条件时,重新计算所述行数比。4.根据权利要求3所述的方法,其特征在于,所述重新计算所述行数比,包括: 将第一种目标文件的总行数减去所述目标在第一种目标文件中的行数,获取对应的第一行数; 获取所述目标在各其他目标文件中的各相应行数,并将各其他目标文件的总行数减去对应各相应行数,获取在各其他目标文件中对应的第二行数; 将所述在各其他目标文件中对应的第二行数,以所述第一行数为基准进行归一化处理,获取重新计算的其他目标文件相对应第一种目标文件的行数比。5.根据权利要求2或4任一所述的方法,其特征在于,所述按照在第一种目标文件中的行数确定所述目标在其他目标文件的相应行数,包括: 按照在第一种目标文件中的行数和对应的行数比,计算所述目标在其他目标文件的相应行数。6.根据权利要求5所述的方法,其特征在于,所述在其他目标文件的相应行数查找所述目标,包括: 查找其他目标文件的相应行数,检测所述相应行数上存储的是否是所述目标; 若所述相...
【专利技术属性】
技术研发人员:罗峰,黄苏支,李娜,
申请(专利权)人:北京亿赞普网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。