语义解析方法、装置、设备及存储介质制造方法及图纸

技术编号:18658176 阅读:23 留言:0更新日期:2018-08-11 14:30
本发明专利技术公开了一种语义解析方法、装置、设备及存储介质。所述方法包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。本发明专利技术实施例优化现有的对话系统的语义解析方法,增加解析出的语义的多样性,提高对话互动的灵活性,提高用户的体验。

Semantic parsing method, device, device and storage medium

The invention discloses a semantic parsing method, device, device and storage medium. The method includes: acquiring the data to be parsed under the current conversation rounds and the historical semantics under the historical conversation rounds associated with the current conversation rounds; input the historical semantics and the data to be parsed as a whole into at least two types of semantic analyzers, and obtain each semantic component. The semantics parsed by the parser; the semantics parsed by the acquired semantic parsers are integrated, and the integration results are regarded as the semantics corresponding to the data to be parsed. The embodiment of the invention optimizes the semantic parsing method of the existing dialogue system, increases the diversity of the parsed semantics, improves the flexibility of the dialogue interaction, and improves the user's experience.

【技术实现步骤摘要】
语义解析方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种语义解析方法、装置、设备及存储介质。
技术介绍
随着科技的高速发展,语音识别在技术上的进步实现了用户与智能设备语音交互,并使得用户与智能设备的口语沟通变得自然和方便。目前智能设备上的对话系统中已经引入了动作语义理解技术,从而自然语言对话系统已成为人们普遍使用的一种沟通工具。其中,实现自然语言对话系统的基本技术可以分为两大类,基于规则的方法和基于统计的方法。其中,基于规则的方法是指根据定义的语法规则、词性和构词与构句规则等,使用计算机语言进行描述;基于统计的方法是指采用深度学习和大数据,构建单轮对话系统,并自动生成对话。专利技术人在实现本专利技术的过程中,发现现有技术存在如下缺陷:对话系统中可支持的语义种类少,同时大部分语义是基于规则的方法来实现的。更具体的,现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气、查路线。在这种语义较少的情况下,基于规则的方法可以实现高效自然语言处理并实现生成对话。而实际上,人们在生活中需求场景并非是这样简单且单一的,而是多样化且复杂的。而且,当用户的对话任务是并非是简单的单轮对话而是多轮对话时,对话系统由于只能构建单轮对话,导致出现答非所问或者重复回答的情况,使得对话系统的构建对话的内容太过局限和死板,用户体验不高。
技术实现思路
本专利技术实施例提供一种语义解析方法、装置、设备及存储介质,优化了现有的对话系统的语义解析方法,增加解析出的语义的多样性,提高对话互动的灵活性,提高用户的体验。第一方面,本专利技术实施例提供了一种语义解析方法,包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。第二方面,本专利技术实施例还提供了一种语义解析装置,包括:当前解析数据获取模块,用于获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的至少一个历史对话轮次下的历史语义;语义解析模块,用于将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;语义整合模块,用于将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。第三方面,本专利技术实施例还提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术实施例中任一所述的语义解析方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的语义解析方法。本专利技术实施例通过获取并将当前对话轮次的待解析数据以及历史对话轮次的历史语义输入到不同的语义分析器,确定语义,解决了现有技术中基于规则的对话系统解析出的语义类别单一,以及不能顺利完成多轮对话任务的问题,能够支持多轮对话任务,提高语义的多样性,提高对话系统的灵活性,提高用户体验。附图说明图1是本专利技术实施例一提供的一种语义解析方法的流程图;图2是本专利技术实施例二提供的一种语义解析装置的结构图;图3是本专利技术实施例三提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1为本专利技术实施例一提供的一种语义解析方法的流程图,本实施例可适用于语音交互,尤其是多轮语音交互的情况,该方法可以由本专利技术实施例提供的语义解析装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在具备对话系统的终端设备中,例如,PC机、平板电脑、手机和车载设备等。具体包括如下步骤:S110,获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义。典型的,所述获取在当前对话轮次下的待解析数据具体可以是:获取用户端在当前对话轮次下的待解析数据。其中,当前对话轮次,具体可以是指在一问一答(用户端提出问题,机器端返回与该问题对应的答案)的语音交互场景下,获取到用户实时输入的提问的对话轮次,所述待解析数据具体是指获取的实时提问中包括的能够用来帮助进行语义解析的内容。所述语义解析,具体是指将用户端提供的自然语音翻译为机器端可以理解的数据,进而可以实现机器端与用户端之间的有效对话。在本实施例中,待解析数据一般是文本数据,用于作为解析语义的对象。可选的,如果用户端通过文本输入的方式与机器端进行对话,可以直接根据用户输入的文本内容,生成该待解析数据(例如,将文本内容经过一定的预处理);如果用户端通过语音输入的方式与机器端进行对话,可以首先将用户输入的语音内容转化为文字内容后,生成该解析数据。当前对话轮次关联的历史对话轮次,具体是指,在当前对话轮次之前已经完成的一问一答的对话轮次。在本实施例中,专利技术人考虑到与当前对话轮次相邻的一个或者多个历史对话轮次中,可能包含有与当前对话轮次中待解析数据对应的语义相同或者相近的语义(也可以称为语义动作)。因此,通过在获取当前对话轮次下的待解析数据的同时,获取在所述当前对话轮次关联的至少一个历史对话轮次下的历史语义,其中,历史语义可以包括机器端和/或用户端的历史语义,可以用来准确或者快速确定与待解析数据对应的语义。其中,在历史对话轮次下,机器端的历史语义可以是与对话系统生成历史答案对应的语义;用户端的历史语义可以是根据用户输入的历史问题解析出的语义。语义具体是可以被机器端理解并处理的信息,更详细的,如果用户端输入的内容为早上好,则通过语义理解后,得到可以被机器端理解的语义为打招呼。相应的,机器端则可以根据打招呼的语义,向用户反馈相应的机器交互内容(也即,前文所述的一问一答中的答案)。获取历史对话轮次的语义以及与该语义对应的解析数据,并将其作为当前对话轮次的语义解析的依据,即基于前文对话轮次的语义确定当前对话轮次中用户端的语义,进而可以生成的相应的交互内容,以实现在对话交互中联系前文的对话内容,提高对话交互的灵活性,以及交互内容对用户需求的命中率,以提高用户体验。在一个具体的例子中,当前对话轮次下用户端的交互内容是:推荐附近吃晚饭的餐厅。与当前对话轮次相关联的前两个相邻历史对话轮次下的交互内容可以是:用户端:中午吃的有点咸。机器端:可以喝点爽口的饮料,并推荐了最近的茶饮店(如在用户所处的当前位置西北2本文档来自技高网...

【技术保护点】
1.一种语义解析方法,其特征在于,包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。

【技术特征摘要】
1.一种语义解析方法,其特征在于,包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。2.根据权利要求1所述的方法,其特征在于,所述获取在当前对话轮次下的待解析数据,包括:获取在当前对话轮次下输入的交互语音,使用语音转文本技术,得到与所述交互语音对应的交互文本;采用至少一项文本预处理技术,对所述交互文本进行处理,得到所述待解析数据;其中,所述文本预处理技术包括下述至少一项:分词技术、实体识别技术以及槽信息标注技术。3.根据权利要求1或2所述的方法,其特征在于,所述语义的类型包括:与信息槽的类型、信息槽的槽值或者实体的属性均不关联的第一类语义;同时与信息槽的类型以及信息槽的槽值关联的第二类语义;仅与信息槽的类型关联的第三类语义;以及仅与实体的属性关联的第四类语义;其中,第一类语义对应第一类语义分析器、第二类语义对应第二类语义分析器、第三类语义对应第三类语义分析器以及第四类语义对应第四类语义分析器。4.根据权利要求3所述的方法,其特征在于,所述第一类语义分析器、所述第三类语义分析器以及所述第四类语义分析器使用卷积神经网络分析器训练得到,所述第二类语义分析器使用长短期记忆网络分析器训练得到。5.根据权利要求1-4任一项所述的方法,其特征在于,在获取在当前对话轮次下的待解析数据之前,还包括:获取多条与设定类型的语义匹配的解析样本数据,并...

【专利技术属性】
技术研发人员:王晓雪吴世伟
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1