基于知识的信息检索系统评估技术方案

技术编号：27030574 阅读：24 留言：0更新日期：2021-01-12 11:13

本发明专利技术涉及基于知识的信息检索系统评估。实施例提供了一种评估一个或多个IR系统的计算机实现的方法，包括：由处理器将已预先建立索引的基于知识的文档提供给已预先训练的语句识别模型；由语句识别模型从已预先建立索引的基于知识的文档中识别预定数量的值得查询语句，其中值得查询语句基于每个值得查询语句的预测概率值进行排名；由语句识别模型将值得查询语句提供给已预先训练的查询生成模型；由查询生成模型针对每个值得查询语句生成查询；以及由处理器使用所生成的查询评估所述一个或多个IR系统，其中经由所述一个或多个IR系统执行一个或多个搜索，并且在包括已预先建立索引的基于知识的文档的一组基于知识的文档中执行所述一个或多个搜索。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识的信息检索系统评估
本公开总体上涉及能够经由自动生成的自然语言查询来评估一个或多个信息检索(IR)系统的系统、方法和计算机程序产品。
技术介绍
一般而言，信息检索(informationretrieval，IR)系统帮助用户从诸如网页、文档、书籍等已建立索引的内容的储存库中快速定位相关信息。存在一种类型的IR系统，即，基于知识的IR系统，它能够通过搜索已建立索引的知识库(诸如Wikipedia和DBpedia)来回答问题或识别相关的事实知识。IR系统技术的进步需要使用更大测试集开发更加自动化的评估方法，使得能够执行现有算法之间的更有意义的比较。IR系统的现有评估方法能够分为两类：基于用户的评估以及系统评估。在基于用户的评估中，要求测试主体(例如用户)使用多个不同的IR系统执行搜索，并判定哪个IR系统具有更好的性能。基于用户的评估更多地集中在IR系统的总体结果上，诸如每个IR系统能够多好地使用户能够回答问题或满足信息需求。然而，基于用户的评估既费时又昂贵。也会由于例如主体训练、主观性、添加到评估过程中的协方差而承受不准确地完成的高风险。与基于用户的评估相比，系统评估更加自动化且成本更低。系统评估需要文档的语料库、一组查询以及包括查询-文档对的列表的一组相关性判断，详细说明人类专家事先手动评定的查询-文档对的相关性。系统评估方法的一个问题是，测试查询通常不是手动创建的。换句话说，测试查询不是用自然语言编写的。例如，模拟关键字查询的标题以及模拟长查询的描述和叙述是在特定文档的上下文中使用非常形式化的语言创建...

【技术保护点】
1.一种数据处理系统中的计算机实现的方法，所述数据处理系统包括处理器以及包括指令的存储器，所述指令由所述处理器执行，以使所述处理器实现评估一个或多个IR系统的方法，所述方法包括：/n由所述处理器将已预先建立索引的基于知识的文档提供给已预先训练的语句识别模型；/n由所述语句识别模型从所述已预先建立索引的基于知识的文档中识别预定数量的值得查询语句，其中，所述值得查询语句基于每个值得查询语句的预测概率值进行排名；/n由所述语句识别模型将所述值得查询语句提供给已预先训练的查询生成模型；/n由所述查询生成模型针对每个值得查询语句生成查询；以及/n由所述处理器使用所生成的查询来评估所述一个或多个IR系统，其中，经由所述一个或多个IR系统执行一个或多个搜索，并且在包括所述已预先建立索引的基于知识的文档的一组基于知识的文档中执行所述一个或多个搜索。/n

【技术特征摘要】
20190710 US 16/507,7701.一种数据处理系统中的计算机实现的方法，所述数据处理系统包括处理器以及包括指令的存储器，所述指令由所述处理器执行，以使所述处理器实现评估一个或多个IR系统的方法，所述方法包括：
由所述处理器将已预先建立索引的基于知识的文档提供给已预先训练的语句识别模型；
由所述语句识别模型从所述已预先建立索引的基于知识的文档中识别预定数量的值得查询语句，其中，所述值得查询语句基于每个值得查询语句的预测概率值进行排名；
由所述语句识别模型将所述值得查询语句提供给已预先训练的查询生成模型；
由所述查询生成模型针对每个值得查询语句生成查询；以及
由所述处理器使用所生成的查询来评估所述一个或多个IR系统，其中，经由所述一个或多个IR系统执行一个或多个搜索，并且在包括所述已预先建立索引的基于知识的文档的一组基于知识的文档中执行所述一个或多个搜索。

2.如权利要求1所述的方法，还包括：
由所述处理器使用正确标注来训练所述语句识别模型，其中，所述正确标注包括多个正确标注元组，每个正确标注元组包括第二基于知识的文档、从所述第二基于知识的文档中识别出的多个第二值得查询语句以及多个第二查询，其中，每个第二查询对应于第二值得查询语句；以及
由所述处理器使用所述正确标注来训练所述查询生成模型。

3.如权利要求2所述的方法，还包括：
由所述处理器通过第一轮众包任务收集所述正确标注，其中，所述多个第二值得查询语句由一个或多个众包工作者识别，并且所述多个第二查询由所述一个或多个众包工作者用自然语言编写。

4.如权利要求3所述的方法，还包括：
由所述处理器通过第二...

【专利技术属性】
技术研发人员：刘喆，尹培风，J·马哈姆德，R·K·T·阿卡拉君，郭玙璠，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人