【技术实现步骤摘要】
技术介绍
问题回答系统通过应用先进的自然语言处理、信息检索、知识表示、自动推理以及机器学习技术,回答以自然语言格式提出的问题。问题回答系统不同于典型的文档搜索技术,因为文档搜索技术返回按照与单词查询的相关性的顺序排序的文档的列表,而问题回答系统接收以自然语言表达的问题,在自然语言上下文中分析问题,并且返回对问题的精确回答。为了准备问题回答系统以接收问题并且提供精确的回答,软件开发人员针对诸如金融领域、旅游领域、医学领域等之类的特定领域,训练问题回答系统。在训练处理期间,问题回答系统从包括准确信息的可信的、传统的源(教科书、杂志)摄取文档语料库。在文档摄取期间,问题回答系统使用注释器向文档添加注释,其中,问题回答系统最终使用这些注释来标识并且返回对问题的精确回答。
技术实现思路
根据本公开内容的一个实施例,提供了一种方法,其中,当尝试注释文档时,知识管理器检测注释错误,如此,将文档分段为多个文档段。然后,当尝试注释多个文档段时,知识管理器检测另一个注释错误,从而导致一组未注释的文档段。知识管理器又生成标识该组未注释的文档段的通知。前面的内容是
技术实现思路
,如此,根据需要,包含简述、概括,以及省略了详细内容;因此,本领域技术人员将理解,
技术实现思路
只是说明性的,以及不是旨在以任何方式做出限制。在下面阐述的非限制性的详细描述中,只由权利要求书定义的本公开内容的其他方面、创造性特征和优点将变 ...
【技术保护点】
一种由包括存储器和处理器的信息处理系统实现的方法,所述方法包括:由所述处理器响应于当尝试注释第一文档段时检测到第一注释错误,将第一文档段分段为多个第二文档段;当尝试注释所述多个第二文档段中的至少一个时,检测一个或多个第二注释错误,从而导致一个或多个未注释的第二文档段;以及生成标识所述一个或多个未注释的第二文档段中的至少一个的通知。
【技术特征摘要】
2015.01.03 US 14/588,9281.一种由包括存储器和处理器的信息处理系统实现的方法,所述
方法包括:
由所述处理器响应于当尝试注释第一文档段时检测到第一注释错
误,将第一文档段分段为多个第二文档段;
当尝试注释所述多个第二文档段中的至少一个时,检测一个或多
个第二注释错误,从而导致一个或多个未注释的第二文档段;以及
生成标识所述一个或多个未注释的第二文档段中的至少一个的通
知。
2.如权利要求1所述的方法,其中,所述注释由注释器执行,所
述方法还包括:
标识与所述注释器对应的最小的段大小,其中,所述最小的段大
小对应于所述注释器被配置成注释的最小的文档部分;
选择所述未注释的第二文档段中的一个;以及
响应于确定所选定的未注释的第二文档段大于所述最小的段大
小,将所选定的未注释的第二文档段分段为多个第三文档段。
3.如权利要求2所述的方法,还包括:
响应于尝试注释所述多个第三文档段中的选定的一个,检测第三
注释错误;
将所选定的第三文档段分段为多个第四文档段,第四文档段各自
对应于所述最小的段大小;
确定所述多个第四文档段中的选定的一个生成第四注释错误;以
及
在所述通知中包括标识所选定的第四文档段的标识符。
4.如权利要求2所述的方法,还包括:
注释所述多个第三文档段中的每一个;以及
响应于确定所述注释器成功地注释所述多个第三文档段中的每一
个,修改所述最小的段大小,以对应于所选定的未注释的第二文档
段。
5.如权利要求1所述的方法,其中,在检测到第一注释错误之
前,所述方法还包括:
由注释器注释文档语料库中所包括的一个或多个基准文档;
基于所述一个或多个基准文档的注释,记录所述注释器的基准注
释时间;以及
记录与所述注释器对应的注释器特征集,其中,所述注释特征集
包括至少一个文档大小和与所述一个或多个基准文档中的至少一个对
应的至少一个量的注释。
6.如权利要求5所述的方法,还包括:
标识第一文档段的文档特征集;
响应于确定所述文档特征集匹配所述注释器特征集,基于所述基
准注释时间,计算注释所述文档的估计的注释时间;以及
响应于确定尝试注释第一文档段的所述注释器的处理中的注释时
间长于估计的注释时间,生成第一注释错误。
7.如权利要求6所述的方法,还包括:
通过比较所述文档特征集与所述注释器特征集,计算注释时间调
整值;以及
响应于确定所述处理中的注释时间长于估计的注释时间和所述注
释时间调整值的组合,生成第一注释错误。
8.一种信息处理系统,包括:
一个或多个处理器;
耦合到所述处理器中的至少一个的存储器;以及
存储在所述存储器中的并且由所述处理器中的至少一个...
【专利技术属性】
技术研发人员:C·O·艾仑,A·R·福瑞德,K·里姆,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。