一种基于上下文关联的智能语义匹配方法组成比例

技术编号:21513976 阅读:35 留言:0更新日期:2019-07-03 09:04
本发明专利技术涉及一种基于上下文关联的智能语义匹配方法,所述方法包括:语义处理系统接收语句数据,得到当前语句文字数据;提取当前语句文字数据中的固定语信息和泛化对象信息;当当前语句文字数据中的固定语信息为空时,获取上一语句文字数据中的固定语信息,并根据上一语句文字数据中的固定语信息和当前语句文字数据中的泛化对象信息生成新的语句文字数据;当当前语句文字数据中的泛化对象信息为空时,生成引导语句数据;接收用户根据引导语句数据输入的补充语句数据,并提取补充语句数据中的泛化对象信息;根据补充语句数据中的泛化对象信息和当前语句文字数据中的固定语信息生成新的语句文字数据;解析新的语句文字数据,得到语义匹配结果数据。

An Intelligent Semantic Matching Method Based on Context Association

【技术实现步骤摘要】
一种基于上下文关联的智能语义匹配方法
本专利技术涉及数据处理
,尤其涉及一种基于上下文关联的智能语义匹配方法。
技术介绍
自然语言处理(NaturalLanguageProcessing,NLP)是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满挑战的。通常,用户输入的自然语言是用户根据自己大脑中的逻辑形成的,由于语言习惯,语言在形成时可能会隐去一些关键词语。例如,用户输入“我想查北京的天气”,则语义处理系统可以根据该语句输出相应的结果,而当用户再次输入“那天津呢”,因为语句中缺少相应的主语和谓语,因此语义处理系统无法只根据“那天津呢”确定用户的目的,导致语义处理系统无法根据该语句输出相应的结果。因此,如何确定一个残缺语句的语义,从而得到与用户语句语义相对应的答案,成为了本领域的难点之一。
技术实现思路
本专利技术的目的是针对现有技术的缺陷,提供一种基于上下文关联的智能语义匹配方法,在当前语句数据缺少解析所需要素的情况下,从上一语句文字数据或下一语句文字数据中提取与当前所缺要素相对应的信息,通过关联上下文的方式确定当前语句数据的语义匹配结果,实现了确定残缺语句的语义,从而得到与用户语句语义相对应的答案。为实现上述目的,本专利技术提供了一种基于上下文关联的智能语义匹配方法,所述方法包括:语义处理系统接收语句数据,对所述语句数据进行语音识别,得到当前语句文字数据;对所述当前语句文字数据进行句式泛化处理,提取所述当前语句文字数据中的固定语信息和泛化对象信息;确定所述当前语句文字数据中的固定语信息或所述当前语句文字数据中的泛化对象信息是否为空;当所述当前语句文字数据中的固定语信息为空时,获取上一语句文字数据中的固定语信息,并根据所述上一语句文字数据中的固定语信息和所述当前语句文字数据中的泛化对象信息生成新的语句文字数据;当所述当前语句文字数据中的泛化对象信息为空时,生成引导语句数据,并输出;接收用户根据所述引导语句数据输入的补充语句数据,并提取所述补充语句数据中的泛化对象信息;根据所述补充语句数据中的泛化对象信息和当前语句文字数据中的所述固定语信息生成新的语句文字数据;解析所述新的语句文字数据,得到语义匹配结果数据,并输出所述语义匹配结果数据。优选的,所述语句数据包括语句语音数据和语句文字数据;所述语义处理系统接收语句数据,对所述语句数据进行语音识别,得到当前语句文字数据具体为:所述语义处理系统的语音转换器接收所述语句数据,对所述语句数据中的语句语音数据进行识别,得到所述语句语音数据的语句文字数据,并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾;所述语义处理系统的轮询器监听所述输入队列的数据插入,从所述输入队列中获取所述输入队列末尾的语句文字数据,得到所述当前语句文字数据。进一步优选的,所述获取上一语句文字数据中的固定语信息具体为:从所述输入队列中获取上一语句文字数据;对所述上一语句文字数据进行句式泛化处理,提取所述上一语句文字数据中的固定语信息。优选的,所述获取上一语句文字数据中的固定语信息具体为:从所述语义处理系统中的缓存器中获取上一语句文字数据中的固定语信息。优选的,在所述获取上一语句文字数据中的固定语信息之后,所述方法还包括:将所述上一语句文字数据中的固定语信息代入当前语句文字数据进行校验;如果校验通过,则根据所述上一语句文字数据中的固定语信息和当前语句文字数据中的泛化对象信息,生成所述新的语句文字数据。进一步优选的,如果校验不通过,所述方法还包括:生成引导语句数据,并输出,用以用户根据所述引导语句数据输入补充语句数据。优选的,当所述泛化对象信息为空时,在所述生成引导语句数据,并输出之前,所述方法还包括:获取上一语句文字数据中的泛化对象信息,并根据所述上一语句文字数据中的泛化对象信息和所述当前语句文字数据中的固定语信息得到新的语句文字数据。进一步优选的,在所述获取上一语句文字数据中的泛化对象信息之后,所述方法还包括:将所述上一语句文字数据中的泛化对象信息代入当前语句文字数据进行校验;如果校验通过,则根据所述上一语句文字数据中的泛化对象信息和当前语句文字数据中的固定语信息生成所述新的语句文字数据;如果校验不通过,则生成所述引导语句数据,并输出。优选的,在所述提取所述补充语句数据中的泛化对象信息之后,所述方法还包括:将所述补充语句数据中的泛化对象信息代入当前语句文字数据进行校验;如果校验通过,则根据所述补充语句数据中的泛化对象信息和当前语句文字数据中的固定语信息生成所述新的语句文字数据;如果校验不通过,则生成所述引导语句数据,并输出。本专利技术实施例提供的基于上下文关联的智能语义匹配方法,在当前语句数据缺少解析所需要素的情况下,从上一语句文字数据或下一语句文字数据中提取与当前所缺要素相对应的信息,通过关联上下文的方式确定当前语句数据的语义匹配结果,实现了确定残缺语句的语义,从而得到与用户语句语义相对应的答案。附图说明图1为本专利技术实施例提供的基于上下文关联的智能语义匹配方法的流程图。具体实施方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。本专利技术实施例提供的一种基于上下文关联的智能语义匹配方法,用于语义处理系统通过关联上下文的方法,对接收到的残缺语句进行语义补完,从而根据补完结果输出相应的语句匹配结果。其方法流程图如图1所示,包括如下步骤:步骤101,接收语句数据,得到当前语句文字数据;具体的,语义处理系统可以理解为一个具有语句输入、处理和输出功能的系统。语义处理系统包括语音转换器、输入队列、轮询器、缓存器和处理器。当语义处理系统启动时,系统输出页面中配置的监听器被启动,该监听器会加载用于语音服务的配置文件、域(domain)类以及domain对应的用户配置文件、语义处理系统特定情况的输出语句,同时启动语音转换器、输入队列、轮询器、缓存器和处理器。语句数据包括语句语音数据和语句文字数据。也就是说,用户可以通过语音或文字的方式向系统输入语句数据。语音转换器接收语句数据,对语句数据中的语句语音数据进行识别,得到语句语音数据的语句文字数据,并将语句语音数据的语句文字数据或直接将用户输入的语句文字数据插入语义处理系统的输入队列的末尾。轮询器会一直监听输入队列是否有新的消息,也就是监听是否有语句文字数据进入队列,并从输入队列中获取输入队列末尾的语句文字数据,从而得到当前语句文字数据。步骤102,对当前语句文字数据进行句式泛化处理,提取语句文字数据中的固定语信息和泛化对象信息;具体的,在轮询器获取到当前语句文字数据后,轮询器将当前语句文字数据发送至处理器。处理器根据语法规则树对语句数据进行句式泛化处理,提取语句数据中的固定语信息和泛化对象信息。句式泛化处理可以理解为根据语法规则树通过一个语句扩展到多种语句的表达形式,并提取语句中关键要素的过程。在这个过程中,提取出语句中关键要素包括固定语信息和泛化对象信息。例如,在一个“我想去电影院”的句子中,“我想去”是固定语信息,是句式的一部分,“电影院”是泛化对象信息;再如,在一个“我想买电影票”的句子中,“我想买”是固定语信息,“电影票”是泛化对象信息。在一个具体的例子中,用户通过语音输入了“我想去电影院”的语句语音数据,语音转本文档来自技高网...

【技术保护点】
1.一种基于上下文关联的智能语义匹配方法,其特征在于,所述方法包括:语义处理系统接收语句数据,对所述语句数据进行语音识别,得到当前语句文字数据;对所述当前语句文字数据进行句式泛化处理,提取所述当前语句文字数据中的固定语信息和泛化对象信息;确定所述当前语句文字数据中的固定语信息或所述当前语句文字数据中的泛化对象信息是否为空;当所述当前语句文字数据中的固定语信息为空时,获取上一语句文字数据中的固定语信息,并根据所述上一语句文字数据中的固定语信息和所述当前语句文字数据中的泛化对象信息生成新的语句文字数据;当所述当前语句文字数据中的泛化对象信息为空时,生成引导语句数据,并输出;接收用户根据所述引导语句数据输入的补充语句数据,并提取所述补充语句数据中的泛化对象信息;根据所述补充语句数据中的泛化对象信息和当前语句文字数据中的所述固定语信息生成新的语句文字数据;解析所述新的语句文字数据,得到语义匹配结果数据,并输出所述语义匹配结果数据。

【技术特征摘要】
1.一种基于上下文关联的智能语义匹配方法,其特征在于,所述方法包括:语义处理系统接收语句数据,对所述语句数据进行语音识别,得到当前语句文字数据;对所述当前语句文字数据进行句式泛化处理,提取所述当前语句文字数据中的固定语信息和泛化对象信息;确定所述当前语句文字数据中的固定语信息或所述当前语句文字数据中的泛化对象信息是否为空;当所述当前语句文字数据中的固定语信息为空时,获取上一语句文字数据中的固定语信息,并根据所述上一语句文字数据中的固定语信息和所述当前语句文字数据中的泛化对象信息生成新的语句文字数据;当所述当前语句文字数据中的泛化对象信息为空时,生成引导语句数据,并输出;接收用户根据所述引导语句数据输入的补充语句数据,并提取所述补充语句数据中的泛化对象信息;根据所述补充语句数据中的泛化对象信息和当前语句文字数据中的所述固定语信息生成新的语句文字数据;解析所述新的语句文字数据,得到语义匹配结果数据,并输出所述语义匹配结果数据。2.根据权利要求1所述的基于上下文关联的智能语义匹配方法,其特征在于,所述语句数据包括语句语音数据和语句文字数据;所述语义处理系统接收语句数据,对所述语句数据进行语音识别,得到当前语句文字数据具体为:所述语义处理系统的语音转换器接收所述语句数据,对所述语句数据中的语句语音数据进行识别,得到所述语句语音数据的语句文字数据,并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾;所述语义处理系统的轮询器监听所述输入队列的数据插入,从所述输入队列中获取所述输入队列末尾的语句文字数据,得到所述当前语句文字数据。3.根据权利要求2所述的基于上下文关联的智能语义匹配方法,其特征在于,所述获取上一语句文字数据中的固定语信息具体为:从所述输入队列中获取上一语句文字数据;对所述上一语句文字数据进行句式泛化处理,提取所述上一语句文字数据中的固定语信息。4.根据权利要求1所述的基于上下文关联的智...

【专利技术属性】
技术研发人员:郝玲风邵飞虎张海风
申请(专利权)人:北京博瑞彤芸文化传播股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1