The invention discloses a semantic parsing method, device, device and storage medium. The method includes: acquiring the data to be parsed under the current conversation rounds and the historical semantics under the historical conversation rounds associated with the current conversation rounds; input the historical semantics and the data to be parsed as a whole into at least two types of semantic analyzers, and obtain each semantic component. The semantics parsed by the parser; the semantics parsed by the acquired semantic parsers are integrated, and the integration results are regarded as the semantics corresponding to the data to be parsed. The embodiment of the invention optimizes the semantic parsing method of the existing dialogue system, increases the diversity of the parsed semantics, improves the flexibility of the dialogue interaction, and improves the user's experience.
【技术实现步骤摘要】
语义解析方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种语义解析方法、装置、设备及存储介质。
技术介绍
随着科技的高速发展,语音识别在技术上的进步实现了用户与智能设备语音交互,并使得用户与智能设备的口语沟通变得自然和方便。目前智能设备上的对话系统中已经引入了动作语义理解技术,从而自然语言对话系统已成为人们普遍使用的一种沟通工具。其中,实现自然语言对话系统的基本技术可以分为两大类,基于规则的方法和基于统计的方法。其中,基于规则的方法是指根据定义的语法规则、词性和构词与构句规则等,使用计算机语言进行描述;基于统计的方法是指采用深度学习和大数据,构建单轮对话系统,并自动生成对话。专利技术人在实现本专利技术的过程中,发现现有技术存在如下缺陷:对话系统中可支持的语义种类少,同时大部分语义是基于规则的方法来实现的。更具体的,现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气、查路线。在这种语义较少的情况下,基于规则的方法可以实现高效自然语言处理并实现生成对话。而实际上,人们在生活中需求场景并非是这样简单且单一的,而是多样化且复杂的。而且,当用户的对话任务是并非是简单的单轮对话而是多轮对话时,对话系统由于只能构建单轮对话,导致出现答非所问或者重复回答的情况,使得对话系统的构建对话的内容太过局限和死板,用户体验不高。
技术实现思路
本专利技术实施例提供一种语义解析方法、装置、设备及存储介质,优化了现有的对话系统的语义解析方法,增加解析出的语义的多样性,提高对话互动的灵活性,提高用户的体验。第一方面,本专利技术实施例提供了一种语 ...
【技术保护点】
1.一种语义解析方法,其特征在于,包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
【技术特征摘要】
1.一种语义解析方法,其特征在于,包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。2.根据权利要求1所述的方法,其特征在于,所述获取在当前对话轮次下的待解析数据,包括:获取在当前对话轮次下输入的交互语音,使用语音转文本技术,得到与所述交互语音对应的交互文本;采用至少一项文本预处理技术,对所述交互文本进行处理,得到所述待解析数据;其中,所述文本预处理技术包括下述至少一项:分词技术、实体识别技术以及槽信息标注技术。3.根据权利要求1或2所述的方法,其特征在于,所述语义的类型包括:与信息槽的类型、信息槽的槽值或者实体的属性均不关联的第一类语义;同时与信息槽的类型以及信息槽的槽值关联的第二类语义;仅与信息槽的类型关联的第三类语义;以及仅与实体的属性关联的第四类语义;其中,第一类语义对应第一类语义分析器、第二类语义对应第二类语义分析器、第三类语义对应第三类语义分析器以及第四类语义对应第四类语义分析器。4.根据权利要求3所述的方法,其特征在于,所述第一类语义分析器、所述第三类语义分析器以及所述第四类语义分析器使用卷积神经网络分析器训练得到,所述第二类语义分析器使用长短期记忆网络分析器训练得到。5.根据权利要求1-4任一项所述的方法,其特征在于,在获取在当前对话轮次下的待解析数据之前,还包括:获取多条与设定类型的语义匹配的解析样本数据,并...
【专利技术属性】
技术研发人员:王晓雪,吴世伟,
申请(专利权)人:出门问问信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。