一种个人信息检索方法、系统及可存储介质技术方案

技术编号:36428610 阅读:15 留言:0更新日期:2023-01-20 22:39
本发明专利技术公开了一种个人信息检索方法、系统及可存储介质,涉及数据信息技术领域,包括:确认所需检索的目标文件,并基于所述目标文件的特征属性,得到目标文件的文件指纹;基于预先构建的存储有个人电脑内所有文件指纹集合的文件指纹库,检索与所述目标文件的文件指纹最相似的文件指纹;将查询到的检索信息以列表形式显示出来,获取与该文件指纹对应的文件路径;基于机器学习对所检索出文件中的个人数据进行识别,确认是否存在个人敏感信息。本发明专利技术中的技术方案能够检测计算机传输数据中是否存在个人敏感信息,保障个人信息的安全性,避免个人信息的泄露。免个人信息的泄露。免个人信息的泄露。

【技术实现步骤摘要】
一种个人信息检索方法、系统及可存储介质


[0001]本专利技术涉及数据信息
,更具体的说是涉及一种个人信息检索方法、系统及可存储介质。

技术介绍

[0002]随着科学技术的飞速发展,电子产品在生活与工作中被广泛应用,特别是在工作中,大部分事务都由计算机处理完成。现在人类社会已经进入了信息无处不在的信息时代,信息的增长加速、信息用户搜集信息的负担加重,个人电脑存储的信息也越来越庞大,用户可以使用计算机搜索所需数据信息,实现信息的传递。
[0003]目前,互联网的技术日益成熟,用户已然将自己的社交、娱乐、商务等各种生活和工作需求都交给了移动互联网和移动智能终端,同时移动终端中也涵盖了更多的敏感信息,因此安全性问题还需要更加重视,需要更加注意计算机、邮件、微信等发送的数据中是否存在个人敏感信息,若个人信息遭到泄露,诈骗分子就能基于个人信息实施精准诈骗,使用户遭受财产损失甚至人身损失,但是本领域技术人员对此的研究还不够深入,个人敏感信息的安全性还无法保障。
[0004]因此,如何检测计算机传输数据中是否存在个人敏感信息,保障个人信息的安全性是本领域技术人员亟需解决的技术问题。

技术实现思路

[0005]有鉴于此,本专利技术提供了一种个人信息检索方法、系统及可存储介质,可以检测计算机传输数据中是否存在个人敏感信息,保证个人信息的安全性,避免用户个人信息的泄露。
[0006]为了实现上述目的,本专利技术提供如下技术方案:
[0007]一种个人信息检索方法,包括以下步骤:/>[0008]确认所需检索的目标文件,并基于所述目标文件的特征属性,得到目标文件的文件指纹;
[0009]基于预先构建的存储有个人电脑内所有文件指纹集合的文件指纹库,检索与所述目标文件的文件指纹最相似的文件指纹;
[0010]将查询到的检索信息以列表形式显示出来,获取与该文件指纹对应的文件路径;
[0011]基于机器学习对所检索出文件中的个人数据进行识别,确认是否存在个人敏感信息。
[0012]上述技术方案达到的技术效果为:可以检测所传输数据中是否存在个人敏感信息,保证个人信息的安全性;同时,文件指纹可实现对文件的唯一标识,基于文件指纹对目标文件进行检索,可以更加快速方便地找到所需文件信息,减少检索时间,提高检索精度。
[0013]可选的,所述得到目标文件的文件指纹,具体包括以下步骤:
[0014]获取目标文件的类型特征,作为第一指纹;
[0015]获取目标文件的文件大小,当所述目标文件的文件大小大于预设大小时,对所述目标文件进行分块处理,获取第二指纹;
[0016]将所述第一指纹、第二指纹拼接得到所述目标文件的文件指纹。
[0017]可选的,所述获取目标文件的类型特征作为第一指纹,具体为:
[0018]提取目标文件的文件头若干位数据作为文件的类型特征,通过散列计算扩大类型特征值的数值范围,作为第一指纹。
[0019]可选的,所述获取第二指纹,具体包括以下步骤:
[0020]提取所述目标文件的文件内容信息并进行预处理,将预处理后的文件内容信息进行划分,得到若干个子文件;
[0021]基于每个子文件在所述文件内容信息中的先后顺序,计算每个子文件对应的哈希值,作为第二指纹。
[0022]上述技术方案达到的技术效果为:公开了目标文件的文件指纹的获取方法,此种文件指纹生成方法可提高文件指纹的计算速度、缩短计算用时,保障文件指纹的唯一性,提升用户体验。
[0023]可选的,预先构建存储有个人电脑内所有文件指纹集合的文件指纹库,具体包括以下步骤:
[0024]部署至少两个存储有相同文件指纹集合的文件指纹库;
[0025]接收用户发送的文件存储请求,获取所述文件存储请求中的待存储文件;
[0026]将所述待存储文件写入每个文件指纹库中,且在完成对前一个文件指纹库的更新过程之后,开始对后一个文件指纹库的更新过程。
[0027]上述技术方案达到的技术效果为:公开了文件指纹库的部署方式,多个文件指纹库轮流更新,则始终可以有至少一个文件指纹库是允许读取的,因而可以基于文件指纹库不间断地进行检索,在接收到检索请求后利用未处在更新过程的文件指纹库,检索与目标文件的文件指纹最相似的文件指纹。
[0028]可选的,所述方法还包括:
[0029]在检索到所述文件指纹库中存在与所述目标文件的文件指纹最相似的文件指纹的情况下,将目标文件的文件路径信息添加到与种子文件对应的索引记录中,以对索引记录进行更新。所述种子文件包括文件指纹和文件内容信息,还可以包括地址信息。
[0030]可选的,所述方法还包括:
[0031]基于用户的用户标识,获取该用户对应的操作行为的权限阈值;
[0032]将目标文件的文件指纹与文件指纹库中的各文件指纹进行对比,获得目标文件指纹与各文件指纹的相似度;
[0033]将相似度最高的文件指纹对应的文件视为最相似文件,并将目标文件与最相似文件的相似度视为文件相似度;
[0034]判断所述文件相似度是否小于权限阈值,若小于,则允许用户对目标文件进行所述操作行为;若不小于,则不允许用户对目标文件进行所述操作行为。
[0035]上述技术方案达到的技术效果为:用户对检索的目标文件可能进行的操作行为包括完全控制、读取、打开、拷贝、剪切、粘贴、分享、传输、运行、截屏、打印,每个操作行为都设置相应的权限阈值,通过比较文件相似度和权限阈值的方式,判断用户是否可以对目标文
件进行相应操作行为,该方式可以确定用户的操作权限,也可以保障文件信息的安全性。
[0036]可选的,所述确认是否存在个人敏感信息,具体为:
[0037]基于机器学习的方式,构建个人敏感信息的识别模型;
[0038]采用所述识别模型对所检索出的文件进行识别,判断所检索出文件中是否包含个人敏感信息。
[0039]上述技术方案达到的技术效果为:公开了一种个人敏感信息的识别方式,采用机器学习的方式对所传输数据中是否包含个人敏感信息进行检测,可避免用户的个人信息泄露,提高检测的准确率。
[0040]本专利技术还公开了一种个人信息检索系统,包括:确认模块、检索模块、获取模块、识别模块,且各结构依次相连;
[0041]所述确认模块,用于确认所需检索的目标文件,并基于所述目标文件的特征属性,得到目标文件的文件指纹;
[0042]所述检索模块,基于预先构建的存储有个人电脑内所有文件指纹集合的文件指纹库,检索与所述目标文件的文件指纹最相似的文件指纹;
[0043]所述获取模块,用于将查询到的检索信息以列表形式显示出来,获取与该文件指纹对应的文件路径;
[0044]所述识别模块,基于机器学习对所检索出文件中的个人数据进行识别,确认是否存在个人敏感信息。
[0045]本专利技术还公开了一种计算机可存储介质,其上存储有计算机程序,所述计算机程序被处本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种个人信息检索方法,其特征在于,包括以下步骤:确认所需检索的目标文件,并基于所述目标文件的特征属性,得到目标文件的文件指纹;基于预先构建的存储有个人电脑内所有文件指纹集合的文件指纹库,检索与所述目标文件的文件指纹最相似的文件指纹;将查询到的检索信息以列表形式显示出来,获取与该文件指纹对应的文件路径;基于机器学习对所检索出文件中的个人数据进行识别,确认是否存在个人敏感信息。2.根据权利要求1所述的一种个人信息检索方法,其特征在于,所述得到目标文件的文件指纹,具体包括以下步骤:获取目标文件的类型特征,作为第一指纹;获取目标文件的文件大小,当所述目标文件的文件大小大于预设大小时,对所述目标文件进行分块处理,获取第二指纹;将所述第一指纹、第二指纹拼接得到所述目标文件的文件指纹。3.根据权利要求2所述的一种个人信息检索方法,其特征在于,所述获取目标文件的类型特征作为第一指纹,具体为:提取目标文件的文件头若干位数据作为文件的类型特征,通过散列计算扩大类型特征值的数值范围,作为第一指纹。4.根据权利要求2所述的一种个人信息检索方法,其特征在于,所述获取第二指纹,具体包括以下步骤:提取所述目标文件的文件内容信息并进行预处理,将预处理后的文件内容信息进行划分,得到若干个子文件;基于每个子文件在所述文件内容信息中的先后顺序,计算每个子文件对应的哈希值,作为第二指纹。5.根据权利要求1所述的一种个人信息检索方法,其特征在于,预先构建存储有个人电脑内所有文件指纹集合的文件指纹库,具体包括以下步骤:部署至少两个存储有相同文件指纹集合的文件指纹库;接收用户发送的文件存储请求,获取所述文件存储请求中的待存储文件;将所述待存储文件写入每个文件指纹库中,且在完成对前一个文件指纹库的更新过程之后,开始对后一个文件指纹库的更新过程。6.根据权利要求1所述的一种个人信息检...

【专利技术属性】
技术研发人员:张维国李娜何鹏翔杨晓彬
申请(专利权)人:宁夏凯信特信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1