【技术实现步骤摘要】
一种文本安全存储方法、文本安全检索方法及系统
[0001]本专利技术涉及信息安全领域,更具体地,涉及一种文本安全存储方法、文本安全检索方法及系统。
技术介绍
[0002]随着互联网的迅速发展,网络上的文本数据持续爆炸性地增长,文本检索服务能够根据用户的检索请求,帮助用于从海量的文本数据中快速地获取想要的数据,海量文本数据的检索在很多领域已经取得了巨大的成功。
[0003]但是在对文本数据的检索过程中,会存在数据的安全问题,比如,在客户端向服务端发送文本检索请求时,黑客会截取文本检索请求中与文本数据相关的一些信息,再比如,当服务器向客户端返回文本检索结果时,也会存在文本数据泄露的问题,这些都是对文本数据的安全性造成威胁。
技术实现思路
[0004]本专利技术针对现有技术中存在的技术问题,提供一种文本安全存储方法、文本安全检索方法及系统。
[0005]根据本专利技术的第一方面,提供了一种文本安全存储方法,包括:对所有的文本进行聚类,划分为多个不同类别;在云端服务器基于文本的类别,建立文本的层次聚类 ...
【技术保护点】
【技术特征摘要】
1.一种文本安全存储方法,其特征在于,包括:对所有的文本进行聚类,划分为多个不同类别;在云端服务器基于文本的类别,建立文本的层次聚类索引树,所述层次聚类索引树的每一个节点上存储有相同类别的文本;基于每一类别的多个文本,建立相应的KD树,所述KD树的每一个节点中存储有一个文本;其中,对于所述层次聚类索引树中的任一个第一节点,基于所述任一个第一节点上文本的类别信息,生成对应的验证信息;对于每一颗KD树上的任一个第二节点,基于所述任一个第二节点上存储的文本的摘要信息,生成所述任一个第二节点的隐私信息;其中,将每一个第一节点和其验证信息的第一对应关系,以及每一个第二节点和其隐私信息的第二对应关系保存于信任服务器上。2.根据权利要求1所述的文本安全存储方法,其特征在于,所述对所有的文本进行聚类,划分为多个不同类别,包括:提取每一个文本的特征向量,对所有文本的特征向量采用k
‑
means聚类算法进行聚类,将所有文本划分为多个类别。3.一种文本安全检索方法,其特征在于,包括:云端服务器接收客户端的当前待检索文本请求,所述当前待检索文本请求中包括文本类别信息和文本摘要信息;根据所述当前待检索文本请求中的文本类别信息,定位到所述层次聚类索引树中的相应第一节点;根据文本摘要信息,定位到KD树上的相应第二节点,将第二节点上的文本返回给客户端。4.根据权利要求3所述的文本安全检索方法,其特征在于,所述云端服务器接收客户端的当前待检索文本请求,所述当前待检索文本请求中包括文本类别信息和文本摘要信息,之后还包括:云端服务器根据所述当前待检索文本信息中的文本类别信息,生成对应的验证信息,以及根据文本摘要信息,生成对应的隐私信息,并将生成的验证信息和隐私信息发送给信任服务器;信任服务器查找验证信息和隐私信息是否存在,若在信任服务器上存在所述验证信息和隐私信息,则向云端服务器返回允许检索的消息,否则,向云端服务器返回拒绝检索的消息;当云端服务器接收到信任服务器发送的允许检索的消息,允许客户端进行文本检索。5.根据权利要求4所述的文本安全检索方法,其特征在于,所述云端服务器接收客户端的当前待检索文本请求,包括:客户端根据当前待检索文本请求,结合...
【专利技术属性】
技术研发人员:周显敬,刘虎,汪寒雨,黄银地,
申请(专利权)人:武汉卓尔信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。