一种文件处理方法、电子设备及存储介质技术

技术编号:31698966 阅读:11 留言:0更新日期:2022-01-01 10:59
本申请实施例公开了一种文件处理方法、电子设备及存储介质,其中,所述文件处理方法包括:根据文件在文件集合中的位置,确定文件的第一标识向量;根据散列函数和文件的特征向量,生成用于存储第一标识向量的第一存储位置;根据散列函数对应的散列表以及第一标识向量,确定第二标识向量;将第二标识向量存入对第一存储位置进行伪随机置换得到的第二存储位置;第二存储位置用于在搜索文件时,根据待搜索文件的第一标识向量指示用于查找待搜索文件的特征向量对应的第一存储位置。如此,根据第二存储位置,基于待搜索文件在文件集合中的位置即可查找到对应的文件,无需用户提供精准的关键词用于搜索,从而提高文件搜索效率。从而提高文件搜索效率。从而提高文件搜索效率。

【技术实现步骤摘要】
一种文件处理方法、电子设备及存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种文件处理方法、电子设备及存储介质。

技术介绍

[0002]近年来,随着云计算的发展和普及,一些云服务产品开始在云端服务器为用户保存数据文件和搭建系统,越来越多的数据拥有者选择将他们的海量数据,尤其是包括音视频在内的多媒体文件存储到云端。为了保护个人隐私及敏感数据(如个人资料档案、医疗保健记录、家庭生活录像等),用户在上传文件时需要在本地先进行加密操作。
[0003]现有技术中,用户需要搜索相关数据文件时,一种方法是将所有密文下载到本地进行解密,在解密得到的明文上搜索,但这会带来巨大的网络开销和存储开销以及加解密操作带来的计算开销。另一种就是可搜索对称加密(Searchable Symmetric Encryption,SSE),用户建立明文索引并加密上传到远端服务器,在用户搜索某个关键词时,可以生成该关键词的搜索陷门(Trapdoor)并提交到服务器。服务器收到搜索陷门后对加密的索引进行搜索,并将对应的密文结果返回给用户。最后,用户对返回的密文进行解密。但是现有的SSE方案必须要基于关键词进行精准索引查询,导致文件搜索效率低下。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种文件处理方法、电子设备及存储介质。
[0005]本专利技术的技术方案是这样实现的:
[0006]第一方面,本专利技术实施例提供一种文件处理方法,包括:
[0007]根据文件在文件集合中的位置,确定所述文件的第一标识向量;
[0008]根据散列函数和所述文件的特征向量,生成用于存储所述第一标识向量的第一存储位置;
[0009]根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量;
[0010]将所述第二标识向量存入对第一存储位置进行伪随机置换得到的第二存储位置;所述第二存储位置用于在搜索文件时,根据待搜索文件的第一标识向量指示用于查找所述待搜索文件的特征向量对应的第一存储位置。
[0011]进一步地,所述根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量,包括:
[0012]根据所述散列函数对应的散列表,确定所述第一存储位置的相邻存储位置;
[0013]基于所述相邻存储位置中存储的向量与所述第一标识向量形成并集,生成第二标识向量。
[0014]进一步地,所述方法还包括:
[0015]若所述相邻存储位置中未存储数据,则在所述相邻存储位置中写入长度与所述第一标识向量相同的全0向量。
[0016]进一步地,所述方法还包括:
[0017]将所述文件集合对应的标识信息和第二存储位置的信息拼接;
[0018]通过伪随机函数对拼接后的信息进行计算,并基于计算结果对所述第二存储位置进行加密。
[0019]进一步地,所述方法还包括:
[0020]若所述第一存储位置中已存储数据,则将所述第一标识向量与已存储的数据形成并集存入所述第一存储位置;
[0021]若所述第一存储位置中未存储数据,则将所述第一标识向量存入所述第一存储位置。
[0022]第二方面,本专利技术实施例提供一种文件处理方法,包括:
[0023]根据待搜索文件在文件集合中的位置,确定待搜索文件的第一标识向量;
[0024]确定存储的数据中包含所述第一标识向量的存储位置;
[0025]根据所述第一标识向量的存储位置和伪随机置换的反函数,确定原始存储位置;
[0026]根据所述原始存储位置对应的特征向量,查找所述待搜索文件。
[0027]进一步地,所述确定存储的数据中包含所述第一标识向量的存储位置,包括:
[0028]根据所述第一标识向量,确定第二标识向量;所述第二标识向量为第一标识向量与其他向量形成的并集;
[0029]确定所述第二标识向量的存储位置。
[0030]进一步地,所述确定所述第二标识向量的存储位置,包括:
[0031]确定所述第二标识向量对应的加密存储位置信息;
[0032]根据所述文件集合对应的标识信息以及所述第二标识向量,对所述加密存储位置信息进行解密,得到所述第二标识向量的存储位置。
[0033]第三方面,本专利技术实施例提供一种文件处理装置,包括:
[0034]第一确定单元,用于根据文件在文件集合中的位置,确定所述文件的第一标识向量;根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量;
[0035]生成单元,用于根据散列函数和所述文件的特征向量,生成用于存储所述第一标识向量的第一存储位置;
[0036]存储单元,用于将所述第二标识向量存入对第一存储位置进行伪随机置换得到的第二存储位置;所述第二存储位置用于在搜索文件时,根据待搜索文件的第一标识向量指示用于查找所述待搜索文件的特征向量对应的第一存储位置。
[0037]进一步地,所述存储单元具体用于:
[0038]根据所述散列函数对应的散列表,确定所述第一存储位置的相邻存储位置;
[0039]基于所述相邻存储位置中存储的向量与所述第一标识向量形成并集,生成第二标识向量。
[0040]进一步地,所述装置还包括:
[0041]写入单元,用于若所述相邻存储位置中未存储数据,则在所述相邻存储位置中写入长度与所述第一标识向量相同的全0向量。
[0042]进一步地,所述装置还包括:
[0043]拼接单元,用于将所述文件集合对应的标识信息和第二存储位置的信息拼接;
[0044]加密单元,用于通过伪随机函数对拼接后的信息进行计算,并基于计算结果对所
述第二存储位置进行加密。
[0045]进一步地,所述存储单元还用于:
[0046]若所述第一存储位置中已存储数据,则将所述第一标识向量与已存储的数据形成并集存入所述第一存储位置;
[0047]若所述第一存储位置中未存储数据,则将所述第一标识向量存入所述第一存储位置。
[0048]第四方面,本专利技术实施例提供一种文件处理装置,包括:
[0049]第二确定单元,用于根据待搜索文件在文件集合中的位置,确定待搜索文件的第一标识向量;确定存储的数据中包含所述第一标识向量的存储位置;根据所述第一标识向量的存储位置和伪随机置换的反函数,确定原始存储位置;
[0050]查找单元,用于根据所述原始存储位置对应的特征向量,查找所述待搜索文件。
[0051]进一步地,所述第二确定单元,具体用于:
[0052]根据所述第一标识向量,确定第二标识向量;所述第二标识向量为第一标识向量与其他向量形成的并集;
[0053]确定所述第二标识向量的存储位置。
[0054]进一步地,所述第二确定单元,具体用于:
[0055]确定所述第二标识向量对应的加密存储位置信息;
[0056]根据所述文件集合对应的标识信息以及所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,其特征在于,所述方法包括:根据文件在文件集合中的位置,确定所述文件的第一标识向量;根据散列函数和所述文件的特征向量,生成用于存储所述第一标识向量的第一存储位置;根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量;将所述第二标识向量存入对第一存储位置进行伪随机置换得到的第二存储位置;所述第二存储位置用于在搜索文件时,根据待搜索文件的第一标识向量指示用于查找所述待搜索文件的特征向量对应的第一存储位置。2.根据权利要求1所述的方法,其特征在于,所述根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量,包括:根据所述散列函数对应的散列表,确定所述第一存储位置的相邻存储位置;基于所述相邻存储位置中存储的向量与所述第一标识向量形成并集,生成第二标识向量。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述相邻存储位置中未存储数据,则在所述相邻存储位置中写入长度与所述第一标识向量相同的全0向量。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述文件集合对应的标识信息和第二存储位置的信息拼接;通过伪随机函数对拼接后的信息进行计算,并基于计算结果对所述第二存储位置进行加密。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述第一存储位置中已存储数据,则将所述第一标识向量与已存储的数据形成并集存入所述第一存储位置;若所述第...

【专利技术属性】
技术研发人员:吴良顺
申请(专利权)人:卓尔智联武汉研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1