【技术实现步骤摘要】
【国外来华专利技术】基于静态和时间知识图消除词语歧义的系统和方法
技术介绍
自然语言文本的数量正在快速增加。为了使系统从自然语言文本中提取、编目和利用信息,系统必须正确地识别与文本中呈现的词语相关联的含义。这是一项艰巨的任务,因为许多词语共享相同的共同组成部分,因此,自然语言文本中的许多词语都是有歧义(ambiguous)的。在自然语言文本中对有歧义词语错误地指定含义会降低自然语言处理的效率,并对用户体验产生不利影响。例如,在自然语言文本中对有歧义词语错误地指定含义会降低严重依赖于自然语言处理的自然语言查询的准确性。
技术实现思路
本文提供了用于基于上下文词语、静态知识图和时间知识图来确定文本段中的有歧义词语的含义的系统和方法。在识别文本段中的未知词语时,这些系统和方法针对上下文词语分析文本段。该系统和方法访问与上下文词语相关联的第一知识图(即,静态知识图)以确定作为未知词语的含义的潜在词语。该系统和方法在确定第一知识图中存在多于一个可能是未知词语的含义的潜在词语时,确定未知词语是有歧义词语。在这种情况下,该系统和方法考虑实体之间关系的时间维度,以消除未知词语的含义的歧义。该系统和方法通过确定文本段的时间戳并访问与第一上下文词语相关联并且与时间戳相关的第二知识图(即,时间知识图)来确定作为第一未知词语的含义的潜在词语来实现这一点。在一些方面,交互式媒体指南应用识别文本段中的第一未知词语。例如,交互式媒体指南应用可以生成用于向用户显示的文本段“BernSandhascalledoutClineforsolicitingdonationsfrombanksandcorporations(伯 ...
【技术保护点】
1.一种用于基于时间知识图识别文本段中的有歧义词语的含义的方法,所述方法包括:确定与文本段相关联的时间戳;以及通过访问与文本段中的上下文词语相关联并且与时间戳相关的时间知识图以确定作为有歧义词语的含义的潜在词语来确定有歧义词语的含义。
【技术特征摘要】
【国外来华专利技术】2016.07.29 US 15/223,6981.一种用于基于时间知识图识别文本段中的有歧义词语的含义的方法,所述方法包括:确定与文本段相关联的时间戳;以及通过访问与文本段中的上下文词语相关联并且与时间戳相关的时间知识图以确定作为有歧义词语的含义的潜在词语来确定有歧义词语的含义。2.一种用于识别文本段中的有歧义词语的含义的方法,所述方法包括:识别文本段中的第一未知词语;针对第一上下文词语分析文本段;通过访问与第一上下文词语相关联的第一知识图以识别作为第一未知词语的含义的潜在词语来确定第一未知词语的含义;响应于确定第一知识图包括多于一个可能是第一未知词语的含义的潜在词语:确定与文本段相关联的时间戳;以及通过访问与第一上下文词语相关联并且与时间戳相关的第二知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义。3.如权利要求2所述的方法,其中,第二知识图与特定时间间隔相关联,并且其中,特定时间间隔的位置基于文本段的时间戳来确定。4.如权利要求3所述的方法,其中,与第二知识图相关联的特定时间间隔的持续时间短于与第一知识图相关联的时间间隔的持续时间。5.如权利要求3所述的方法,其中,与第二知识图相关联的特定时间间隔的位置使得与第二知识图相关联的特定时间间隔与时间戳重叠。6.如权利要求3所述的方法,其中,与第二知识图相关联的特定时间间隔的位置是以下之一:与第二知识图相关联的特定时间间隔在文本段的时间戳之前;以及与第二知识图相关联的特定时间间隔在文本段的时间戳之后。7.如权利要求3所述的方法,其中,特定时间间隔的持续时间部分地基于通过分析文本段而识别出的时间指示符。8.如权利要求3所述的方法,其中,特定时间间隔的持续时间部分地基于文本段的来源。9.如权利要求2所述的方法,还包括:确定第一知识图不包括任何可能是第一未知词语的含义的潜在词语;识别文本段中的第二上下文词语;基于第二上下文词语确定第一未知词语的含义。10.如权利要求3所述的方法,还包括:确定第二知识图包括多于一个可能是第一未知词语的含义的潜在词语;调整特定时间间隔的持续时间和特定时间间隔的位置中的至少一个;通过访问与第一上下文词语和特定时间间隔相关联的第三知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义。11.如权利要求3所述的方法,还包括:确定第二知识图不包括任何可能是第一未知词语的含义的潜在词语;调整特定时间间隔的持续时间和特定时间间隔的位置中的至少一个;通过访问与第一上下文词语和特定时间间隔相关联的第四知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义。12.一种用于识别文本段中的有歧义词语的含义的系统,所述系统包括:控制电路系统,被配置为:识别文本段中的第一未知词语;针对第一上下文词语分析文本段;通过访问与第一上下文词语相关联的第一知识图以识别作为第一未知词语的含义的潜在词语来确定第一未知词语的含义;响应于确定第一知识图包括多于一个可能是第一未知词语的含义的潜在词语:确定与文本段相关联的时间戳;以及通过访问与第一上下文词语相关联并且与时间戳相关的第二知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义。13.如权利要求12所述的系统,其中,第二知识图与特定时间间隔相关联,并且其中,特定时间间隔的位置基于文本段的时间戳来确定。14.如权利要求13所述的系统,其中,与第二知识图相关联的特定时间间隔的持续时间短于与第一知识图相关联的时间间隔的持续时间。15.如权利要求13所述的系统,其中,与第二知识图相关联的特定时间间隔的位置使得与第二知识图相关联的特定时间间隔与时间戳重叠。16.如权利要求13所述的系统,其中,与第二知识图相关联的特定时间间隔的位置是以下之一:与第二知识图相关联的特定时间间隔在文本段的时间戳之前;以及与第二知识图相关联的特定时间间隔在文本段的时间戳之后。17.如权利要求13所述的系统,其中,特定时间间隔的持续时间部分地基于通过分析文本段而识别出的时间指示符。18.如权利要求13所述的系统,其中,特定时间间隔的持续时间部分地基于文本段的来源。19.如权利要求12所述的系统,还包括:控制电路系统,被配置为:确定第一知识图不包括任何可能是第一未知词语的含义的潜在词语;识别文本段中的第二上下文词语;基于第二上下文词语确定第一未知词语的含义。20.如权利要求13所述的系统,还包括:控制电路系统,被配置为:确定第二知识图包括多于一个可能是第一未知词语的含义的潜在词语;调整特定时间间隔的持续时间和特定时间间隔的位置中的至少一个;通过访问与第一上下文词语和特定时间间隔相关联的第三知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义。21.如权利要求13所述的系统,还包括:控制电路系统,被配置为:确定第二知识图不包括任何可能是第一未知词语的含义的潜在词语;调整特定时间间隔的持续时间和特定时间间隔的位置中的至少一个;通过访问与第一上下文词语和特定时间间隔相关联的第四知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义。22.一种用于识别文本段中的有歧义词语的含义的系统,所述系统包括:用于识别文本段中的第一未知词语的部件;用于针对第一上下文词语分析文本段的部件;用于通过访问与第一上下文词语相关联的第一知识图以识别作为第一未知词语的含义的潜在词语来确定第一未知词语的含义的部件;响应于确定第一知识图包括多于一个可能是第一未知词语的含义的潜在词语:用于确定与文本段相关联的时间戳的部件;以及用于通过访问与第一上下文词语相关联并且与时间戳相关的第二知识图以确定作为第一未知词语的含义的潜在词语来确定第一未知词语的含义的部件。23.如权利要求22所述的系统,其中,第二知识图与特定时间间隔相关联,并且其中,特定时间间隔的位置基于文本段的时间戳来确定。24.如权利要求23所述的系统,其中,与第二知识图相关联的特定时间间隔的持续时间短于与第一知识图相关联的时间间隔的持续时间。25.如权利要求23所述的系统,其中,与第二知识图相关联的特定时间间隔的位置使得与第二知识图相关联的特定时间间隔与时间戳重叠。26.如权利要求23所述的系统,其中,与第二知识图相关联的特定时间间隔的位置是以下之一:与第二知识图相关联的特定时间间隔在文本段的时间戳之前;以及与第二知识...
【专利技术属性】
技术研发人员:M·马尔霍特拉,S·万卡塔拉曼,A·N·莫海迪恩匹,
申请(专利权)人:乐威指南公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。