【技术实现步骤摘要】
基于多特征值的文件信息处理方法与系统
[0001]本专利技术属于文件信息处理
,尤其涉及一种基于多特征值的文件信息处理方法与系统。
技术介绍
[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]虚拟化移动办公逐渐成为政务移动办公领域的主要应用模式,PC端传统的轻量级数据缓存和查询方式已经无法满足可能会产生大量数据的应用程序对数据缓存和处理的需求。文件作为最常见的信息处理单元,随着用户使用频率的增加,文件量会越来越大。专利技术人发现,现有的文件缓存和过滤技术存在支撑数据量较小,缓存占用内存较多,以及查询性能消耗较大等技术问题。
技术实现思路
[0004]为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种基于多特征值的文件信息处理方法与系统,其将复杂信息抽象化,节省缓存空间,使PC端应用程序可以在有限的内存空间下缓存更多的信息。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]本专利技术的第一个方面提供一 ...
【技术保护点】
【技术特征摘要】
1.一种基于多特征值的文件信息处理方法,其特征在于,包括:获取各个待处理元素本身、属性及其对应特征值,并将这些信息组合,构成各个元素多特征待集;其中,所述元素为文件信息;利用预设哈希函数对各个所述元素多特征待集中的多特征值分别进行哈希运算,得到各个元素的哈希值集合;将每个元素的哈希值集合内的所有哈希值进行分组拆分,每一组哈希值映射到初始化多维位向量中的一维位向量,以实现对文件信息的缓存处理。2.如权利要求1所述的基于多特征值的文件信息处理方法,其特征在于,初始化的多维位向量中的各位向量位置为0。3.如权利要求1或2所述的基于多特征值的文件信息处理方法,其特征在于,每一组哈希值映射到初始化多维位向量中的一维位向量的对应位置标记为1。4.如权利要求3所述的基于多特征值的文件信息处理方法,其特征在于,所述基于多特征值的文件信息处理方法,还包括:接收待查询元素相关信息,将待查询元素的特征值基于所述预设哈希函数进行哈希计算,得到对应哈希集合,进而将其内的哈希值进行拆分;根据拆分后对应维的位向量所对应的哈希位置是否为1来判断待查询元素是否存在。5.如权利要求4所述的基于多特征值的文件信息处理方法,其特征在于,若待查询元素的所有的哈希值对应维的位向量组的哈希位置的值都是1,则待查询元素存在;否则,待查询元素不存在。6.一种基于多特征值的文件信息处理系统,其特征在于,包括:多特征待集构建模块,其用于获取各个待处理元素本身、属性及其对应特征值,并将这些信息组合,构...
【专利技术属性】
技术研发人员:张雷,苗功勋,王金国,汤海建,姚从颖,
申请(专利权)人:中孚安全技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。