【技术实现步骤摘要】
本专利技术涉及计算机软件测试
,具体涉及一种计算全文检索查全率的方法及装置。
技术介绍
信息时代产生了大量数字信息,其中文本信息是最基本和常用的一种形式。为了能在海量的文本信息中找到自己的所需,人们迫切需要一个高效的检索工具,因此全文检索技术成为国内外学者研究的热点。全文检索(Full-text Retrieval)技术起源于20世纪50年代末,以各类数据为处理对象,提供依照数据资料的内容而不是外在特征来实现的信息检索手段,其主旨在于将与用户查询最相关的结果最先呈现给用户,提高用户体验,典型应用如各类搜索引擎。随着大数据时代的到来及互联网的兴起,全文检索技术与云计算、分布式等技术相结合,提供基于海量数据的即时查询,得到广泛的应用。当前与全文检索相关的研究大都集中在如何提高排序靠前数据的相关性方面,现有自然语言的切词方面会舍弃一些虚词等以提高索引效率,其结果将会导致部分数据失真。目前,搜索引擎主要针对提高普通的使用自然语言的用户体验,但是应用于一些比较反常规的领域,如国安、情报等领域,就会导致部分信息不能出现在结果集中 ...
【技术保护点】
一种计算全文检索查全率的方法,其特征在于,所述方法包括:获取被测系统中的至少一个测试元素,以及存储于数据库系统的所述至少一个测试元素;根据所述至少一个测试元素,创建至少一个查询关键词及其扩展关键词;根据每个所述查询关键词及其扩展关键词,对应从所述被测系统中的至少一个测试元素中获取一个第一查询结果,对应从所述存储于数据库系统的所述至少一个测试元素中获取一个第二查询结果;根据所述第一查询结果和所述第二查询结果,计算所述被测系统的查全率。
【技术特征摘要】
1.一种计算全文检索查全率的方法,其特征在于,所述方法包括:
获取被测系统中的至少一个测试元素,以及存储于数据库系统的所述至少一个测试元素;
根据所述至少一个测试元素,创建至少一个查询关键词及其扩展关键词;
根据每个所述查询关键词及其扩展关键词,对应从所述被测系统中的至少一个测试元素中获取一个第一查询结果,对应从所述存储于数据库系统的所述至少一个测试元素中获取一个第二查询结果;
根据所述第一查询结果和所述第二查询结果,计算所述被测系统的查全率。
2.根据权利要求1所述的方法,其特征在于,所述获取被测系统中的至少一个测试元素,以及存储于数据库系统的所述至少一个测试元素包括:
获取被测系统中的至少一个测试元素;
转换所述测试元素的存储类型,生成适合数据库系统存储的测试元素;
将所述适合数据库存储的至少一个测试元素存储于数据库系统中。
3.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个测试元素,创建至少一个查询关键词及其扩展关键词包括:
根据至少一个测试元素,收集至少一个查询的常用关键词;
排除所述查询的常用关键词中的相关性词语,确定查询关键词,所述相关性词语包括同义词和近义词;
获取每个所述查询关键词的同义词,确定所述查询关键词的扩展关键词。
4.根据权利要求1所述的方法,其特征在于,所述根据每个所述查询关键词及其扩展关键词,对应从所述被测系统中的至少一个测试元素中获取一个第一查询结果,对应从所述存储于数据库系统的所述至少一个测试元素中获取一个第二查询结果包括:
根据每个查询关键词及其扩展关键词,对被测系统中的至少一个测试元素进行查询,对应获取与所述查询关键词及其扩展关键词匹配的测试元素,所述匹配的测试元素的个数记为第一查询结果;
根据每个查询关键词及其扩展关键词,对存储于数据库系统的所述至少一个测试元素进行查询,对应获取与所述查询关键词及其扩展关键词匹配的测试元素,所述匹配的测试元素的个数记为第二查询结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一查询结果和所述第二查询结果,计算所述被测系统的查全率包括:
计算每个查询关键词及其扩展关键词对应的查全率 ,其中表示第个查询关键词及其扩展关键词对应的...
【专利技术属性】
技术研发人员:吝斌,马妤晨,王欣,
申请(专利权)人:电信科学技术第十研究所,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。