【技术实现步骤摘要】
一种安全全文检索的方法及装置
本专利技术涉及检索
,特别是涉及一种安全全文检索的方法及装置。
技术介绍
人类进入信息技术时代以来,文件信息便捷获取和安全保障一直是文件利用的两面,多种信息技术改进都是在这两个目标之间求得平衡。文件检索服务在党政机关企事业单位内部得到广泛应用,为用户提供了便捷高效的信息获取手段。但传统的全文检索仍存在非常大的安全隐患,索引文件中包含了大量原文信息,甚至某些全文检索产品的索引文件中直接包含原文全文,在这种情况下,即使对网络环境、服务器、数据库、应用等层面做了层层安全处理,搜索引擎仍可能越过企业原有安全架构,泄露企业机密,而且即使为数据定义了文档级和数据库级的双重安全保障,搜索引擎的还能透过授权的索引文档来搜索它们,存在较大的安全风险。同时,对内部人员而言,全文检索服务器上的内容更是重大的泄露源,普通技术缺乏对内部人员非法获取的安全防范机制。由于索引文件中包含了大量原文信息,导致检索安全性较低,所以,如何提高检索安全性是亟待解决的问题。
技术实现思路
本专利 ...
【技术保护点】
1.一种安全全文检索的方法,其特征在于,包括:/n采用文档档案、词典和内容索引组成索引文件;/n从内容索引中读取频度流,采用频度流构建流束;/n依据词典获取频度信息队列,利用流束填充频度信息队列;/n判断词典中的所有词是否都存在对应的频度信息队列且首端的文档号相等,若是,确定文档号为命名文档号;/n依据命名文档号查找对应的文档内容。/n
【技术特征摘要】
1.一种安全全文检索的方法,其特征在于,包括:
采用文档档案、词典和内容索引组成索引文件;
从内容索引中读取频度流,采用频度流构建流束;
依据词典获取频度信息队列,利用流束填充频度信息队列;
判断词典中的所有词是否都存在对应的频度信息队列且首端的文档号相等,若是,确定文档号为命名文档号;
依据命名文档号查找对应的文档内容。
2.如权利要求1所述的方法,其特征在于,所述利用流束填充频度信息队列之后,还包括:
判断频度信息队列是否为空,若是,跳出频度信息队列对应的域中的查找循环。
3.如权利要求1所述的方法,其特征在于,所述判断词典中的所有词是否都存在对应的频度信息队列且首端的文档号相等之前,还包括:
利用文档档案排除频度信息队列中的不合格文档。
4.如权利要求3所述的方法,其特征在于,所述利用文档档案排除频度信息队列中的不合格文档之后,还包括:
利用词典判断是否还有下一个词,若是,新建下一个词对应的频度信息队列,加入文档对比循环。
5...
【专利技术属性】
技术研发人员:任锦华,刘丹,王少康,
申请(专利权)人:任锦华,刘丹,王少康,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。