一种语义消歧的方法、装置、服务器和存储介质制造方法及图纸

技术编号:16919216 阅读:33 留言:0更新日期:2017-12-31 14:49
本发明专利技术实施例公开了一种语义消歧的方法、装置、服务器和存储介质。其中,语义消歧的方法包括:对用户当前对话信息进行语义解析,依据解析结果确定用户当前对话信息所属的当前服务领域是否为歧义领域,若当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对当前服务领域进行消歧处理。本发明专利技术实施例通过对用户当前对话信息进行语义解析,并利用该解析结果以及逻辑处理,实现了在多领域多轮对话系统中对用户当前对话信息所属的当前服务领域进行消歧处理,该技术方案提高了语义消歧的效率和准确度,解决了现有语义消歧方法中依赖大规模标注语料,以及在句法分析中句子过短导致无法分析的问题。

【技术实现步骤摘要】
一种语义消歧的方法、装置、服务器和存储介质
本专利技术实施例涉及人机交互
,尤其涉及一种语义消歧的方法、装置、服务器和存储介质。
技术介绍
在口语对话系统中,用户通常会使用一些省略关键字的句子,这就给对话系统理解用户意图带来了困难。此时,对话系统需要结合上下文来确定当前句子的真实含义。现有进行语义消歧的方法主要有两种,一种是利用统计的方法,具体是通过标注训练语料,以训练模型进行语义消歧;另一种是基于句法分析的语义消歧方法,具体是通过对输入句子进行句法分析,根据句法分析对语义进行消歧。但是,上述两种方法都存在各自的缺陷,其中,统计方法需要大规模标注语料,对于还没有投入应用的对话系统来说,标注语料极难获取;基于句法分析的语义消歧方法适用于表达较为完整的书面语,口语句子句法随意,且大部分句子偏短,对句法分析加大了难度。
技术实现思路
本专利技术实施例提供一种语义消歧的方法、装置、服务器和存储介质,可以解决现有的语义消歧方法中依赖大规模的标注语料以及由于句法分析中句子过短导致无法分析的问题。第一方面,本专利技术实施例提供了一种语义消歧的方法,该方法包括:对用户当前对话信息进行语义解析,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域;若所述当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对所述当前服务领域进行消歧处理。第二方面,本专利技术实施例还提供了一种语义消歧的装置,该装置包括:解析判断模块,用于对用户当前对话信息进行语义解析,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域;当前服务领域消歧模块,用于若所述当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对所述当前服务领域进行消歧处理。第三方面,本专利技术实施例还提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的语义消歧的方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的语义消歧的方法。本专利技术实施例通过对用户当前对话信息进行语义解析,并利用该解析结果以及逻辑处理,实现了在多领域多轮对话系统中对用户当前对话信息所属的当前服务领域进行消歧处理,该技术方案提高了语义消歧的效率和准确度,解决了现有语义消歧方法中依赖大规模标注语料,以及在句法分析中句子过短导致无法分析的问题。附图说明图1是本专利技术实施例一中的语义消歧方法的流程图;图2是本专利技术实施例二中的语义消歧方法的流程图;图3是本专利技术实施例三中的语义消歧方法的流程图;图4是本专利技术实施例四中的语义消歧装置的结构示意图;图5是本专利技术实施例五中的服务器的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的语义消歧方法的流程图,本实施例可适用于人机对话系统中需要对语义进行消歧的情况,该方法可以由语义消歧装置来执行,该装置可以采用软件和/或硬件的方式实现。如图1所示,该方法具体包括:S110、对用户当前对话信息进行语义解析,依据解析结果确定用户当前对话信息所属的当前服务领域是否为歧义领域。在用户在与人机对话系统进行交互时,特别是与多领域多轮对话系统(即包含多个服务领域并且可以进行多轮对话的系统)进行交互时,经常会使用一些口语化的句子,这些句子通常会省略一些对于用户理解而言可有可无,但是对于对话系统理解而言却比较关键的词语,这就造成对话系统在理解用户意图时存在困难,并且容易产生歧义的问题,因此,对话系统需要对用户当前的对话信息进行消歧处理。本实施例中,对话系统需要对用户输入的当前对话信息进行语义解析,以获取用户当前所说语句所要表达的大致意图,并依据该当前对话信息的解析结果,确定该当前对话信息所属的当前服务领域是否存在歧义。本实施例中,用户输入的当前对话信息可以是常规句子,也可以是歧义句子,因此,语义解析包括常规句子语义解析和歧义句子语义解析,其中,常规句子语义解析,其解析结果是确定、无歧义的,既包括用户意图,也包括句子所属的当前服务领域,而歧义句子语义解析,其解析结果是不确定、存在歧义的,可以包括用户的大致意图,以及句子所属的多个可能的当前服务领域。示例性的,在一个包含订机票、订火车票、订酒店和查询天气四个出行领域的多轮对话系统中,如果用户输入的当前对话信息是“订去北京的机票”,显然,该对话信息是常规句子,则该多领域多轮对话系统根据该当前对话信息进行语义解析,既可以获取到用户希望出行去往北京的意图,也可以获取到去北京所属的当前服务领域是订机票,此时,对话系统确定用户当前对话信息所属的当前服务领域不是歧义领域。如果用户输入的当前对话信息是“去北京”,该对话信息是歧义句子,则该多领域多轮对话系统根据该当前对话信息进行语义解析,可以获取到用户的大致意图是希望出行去往北京,但是在该对话系统中,与出行相对应的服务领域有两个,用户的真实意图可能是订去北京的火车票,也有可能是订去北京的机票,对话系统仅仅根据该当前对话信息,无法确定用户所需要的服务领域具体是哪一个,此时,对话系统确定用户当前对话信息所属的当前服务领域是歧义领域。S120、若当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对当前服务领域进行消歧处理。本实施例中,如果确定用户当前输入的对话信息所对应的当前的服务领域是歧义领域,可以采用基于上下文的语义消歧策略,即利用已经确定了的用户的历史对话信息所属的历史服务领域对当前的服务领域进行消除歧义处理。示例性的,仍以包含订机票、订火车票、订酒店和查询天气四个出行领域的多轮对话系统为例,用户输入的当前对话信息是“去北京”,对话系统确定该当前对话信息所属的当前服务领域是歧义领域,此时,对话系统调用当前对话信息之前的多轮历史对话信息,利用已经确定了的历史对话信息所属的历史服务领域,来确定当前对话信息所属的当前服务领域。如果历史服务领域中包含订机票,则可以确定用户输入的当前对话信息“去北京”所属的当前服务领域是订机票,进而确定用户与对话系统进行交互的真实意图是“订去北京的机票”,至此,完成对用户当前对话信息所属当前服务领域的消除歧义处理。本实施例提供的语义消歧的方法,通过对用户当前对话信息进行语义解析,并利用该解析结果以及逻辑处理,实现了在多领域多轮对话系统中对用户当前对话信息所属的当前服务领域进行消歧处理,该技术方案提高了语义消歧的效率和准确度,解决了现有语义消歧方法中依赖大规模标注语料,以及在句法分析中句子过短导致无法分析的问题。进一步的,在S110中,依据解析结果确定用户当前对话信息所属的当前服务领域是否为歧义领域,包括:若所述用户当前对话信息中不包含领域关键字,且所述用户当前对话信息包含地点、时间和价格中的至少一种信息,则确定所述用户当前对话信息所属的当前服务领域为歧义领域,其中所述领域关键字是依据所述多领域多轮对话系统支持的服务领域本文档来自技高网...
一种语义消歧的方法、装置、服务器和存储介质

【技术保护点】
一种语义消歧的方法,其特征在于,包括:对用户当前对话信息进行语义解析,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域;若所述当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对所述当前服务领域进行消歧处理。

【技术特征摘要】
1.一种语义消歧的方法,其特征在于,包括:对用户当前对话信息进行语义解析,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域;若所述当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对所述当前服务领域进行消歧处理。2.根据权利要求1所述的方法,其特征在于,若所述当前服务领域是歧义领域,则依据预先确定的用户历史对话信息所属的历史服务领域对所述当前服务领域进行消歧处理,包括:若所述当前服务领域是歧义领域,则确定所述当前服务领域的至少两个备选服务领域;确定所述至少两个备选服务领域中是否存在用户历史对话信息所属的历史服务领域,若存在,则将存在的历史服务领域确定为所述当前服务领域。3.根据权利要求2所述的方法,其特征在于,确定所述至少两个备选服务领域中是否存在用户历史对话信息所属的历史服务领域,若存在,则将存在的历史服务领域确定为所述当前服务领域,包括:从后往前遍历并确定是否存在用户历史对话信息所属的历史服务领域与任一备选服务领域相同,若存在,则将该备选服务领域确定为所述当前服务领域。4.根据权利要求2所述的方法,其特征在于,确定所述至少两个备选服务领域中是否存在用户历史对话信息所属的历史服务领域之后,还包括:若所述至少两个备选服务领域中不存在用户历史对话信息所属的历史服务领域,则依据所述至少两个备选服务领域生成领域问询信息。5.根据权利要求1所述的方法,其特征在于,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域之后,还包括:若所述当前服务领域不为歧义领域,则确定用户历史对话信息中是否存在历史歧义语句;若所述用户历史对话信息中存在历史歧义语句,则将所述当前服务领域作为历史歧义语句所属的历史服务领域。6.根据权利要求1所述的方法,其特征在于,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域,包括:若所述用户当前对话信息中不包含领域关键字,且所述用户当前对话信息包含地点、时间和价格中的至少一种信息,则确定所述用户当前对话信息所属的当前服务领域为歧义领域,其中所述领域关键字是依据所述多领域多轮对话系统支持的服务领域预先确定的。7.一种语义消歧的装置,其特征在于,包括:解析判断模块,用于对用户当前对话信息进行语义解析,依据解析结果确定所述用户当前对话信息所属的当前服务领域是否为歧义领域...

【专利技术属性】
技术研发人员:邓丽萍时培轩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1