口语对话管理方法及系统技术方案

技术编号：24097308 阅读：48 留言：0更新日期：2020-05-09 11:02

本发明专利技术公开了一种口语对话管理系统，包括：语音识别器、语言理解单元、对话管理器、语言生成单元、语音合成器、语境指导信息生成器、策略学习单元。此外，本发明专利技术还公开了一种口语对话管理方法。采用本发明专利技术的技术方案，对话管理器维护对话过程中的对话状态信息，系统根据当前的对话状态信息生成语境指导信息，并动态地指导语音识别器更好地识别当前语境中用户可能会使用的自然语言，大幅提高了语音识别的准确率；语音识别器不需要提前准备特定领域的训练语料并训练领域相关的语言模型，而是根据不同的语境动态调节语言模型，降低了提前训练语言模型的工作量，提高了人机对话系统的生产效率。

Oral dialogue management method and system

全部详细技术资料下载

【技术实现步骤摘要】
口语对话管理方法及系统
本专利技术涉及人机对话
，特别涉及一种口语对话管理方法及系统。
技术介绍
口语对话系统（SpokenDialogSystem，简称SDS）以语音的形式与用户进行交互，并为用户提供特定的服务；口语对话系统通常由语音识别、语言理解、对话管理、语言生成、语音合成等模块构成。在口语对话系统中，对话管理（DialogManagement，简称DM）和自动语音识别（AutomaticSpeechRecognition，简称ASR）是两个相互独立的模块。其中，对话管理模块是口语对话系统中的核心模块，其前置模块将用户的输入转化为某种形式化语义表达，对话管理模块在此基础上决定下一步系统输出的形式化语义表达；输出的形式化语义表达在后续模块中被转化为某种输出形式，如图片、语音、文字、链接等。自动语音识别模块将用户语音转化为文字，一般需要声学模型和语言模型（LanguageModel，简称LM）等资源，其中语言模型负责从自然语言方面为自动语音识别解码器提供线索。专利技术人经研究发现，现有技术中口语对话系统的自动语音识别...

【技术保护点】
1.一种口语对话管理方法，其特征在于，包括：/n语音识别器接收用户输入的语音，利用语言模型及声学模型将用户输入的语音转化生成文字形式的语音识别结果，将语音识别结果输出至与其相连接的语言理解单元；/n所述语言理解单元将其接收的语音识别结果转化生成形式化语义表达的语言理解结果，并将语言理解结果输出至与其相连接的对话管理器；/n策略学习单元学习得到对话策略信息及语境指导模型，将所述对话策略信息输出至与其相连接的所述对话管理器，将所述语境指导模型输出至与其相连接的语境指导信息生成器；/n所述对话管理器根据接收到的所述语言理解结果及所述对话策略信息更新其中保存的对话状态信息，将更新后的当前对话状态信息保...

【技术特征摘要】
1.一种口语对话管理方法，其特征在于，包括：
语音识别器接收用户输入的语音，利用语言模型及声学模型将用户输入的语音转化生成文字形式的语音识别结果，将语音识别结果输出至与其相连接的语言理解单元；
所述语言理解单元将其接收的语音识别结果转化生成形式化语义表达的语言理解结果，并将语言理解结果输出至与其相连接的对话管理器；
策略学习单元学习得到对话策略信息及语境指导模型，将所述对话策略信息输出至与其相连接的所述对话管理器，将所述语境指导模型输出至与其相连接的语境指导信息生成器；
所述对话管理器根据接收到的所述语言理解结果及所述对话策略信息更新其中保存的对话状态信息，将更新后的当前对话状态信息保存在所述对话管理器本地的同时输出至与其相连接的所述语境指导信息生成器；同时，所述对话管理器根据当前对话状态信息生成形式化语义表达的系统回应结果并输出至与其相连接的语言生成单元；
所述语境指导信息生成器根据接收到的所述语境指导模型以及当前对话状态信息生成当前语境指导信息，并将当前语境指导信息输出至与其相连接的所述语音识别器；
所述语音识别器接收当前语境指导信息，当前语境指导信息指导所述语音识别器动态地构造语言模型，并指导下一轮语音识别解码过程；
所述语言生成单元将所述对话管理器输入的形式化语义表达的系统回应结果转化生成为文字序列形式的语言生成结果，并输出至与其相连接的语音合成器；
所述语音合成器将接收到的文字序列形式的语言生成结果转化为语音并反馈输出至用户。

2.根据权利要求1所述的口语对话管理方法，其特征在于，其中，所述语境指导信息包括业务语境指导信息、话题语境指导信息。

3.根据权利要求2所述的口语对话管理方法，其特征在于，
其中，策略学习单元学习得到对话策略信息及语境指导模型，具体包括：
在所述策略学习单元中学习得到所述对话管理器需要的对话策略信息；
在所述策略学习单元中构建区分不同业务语境的业务语境识别模型；所述策略学习单元构建相应的业务语境指导模型；
在所述策略学习单元中构建区分不同话题语境的话题语境识别模型；所述策略学习单元构建相应的话题语境指导模型；
所述策略学习单元利用其构建的所述业务语境识别模型、所述话题语境识别模型、所述业务语境指导模型、所述话题语境指导模型中的一种或多种构成所述语境指导模型。

4.根据权利要求3所述的口语对话管理方法，其特征在于，
对话语料库连接至所述策略学习单元，所述策略学习单元具有开发者输入接口；
所述策略学习单元获取所述对话语料库中的语料，通过机器学习算法学习生成相应的对话策略信息及语境指导模型；
或者，所述策略学习单元接收由所述开发者输入接口输入的配置信息而得到相应的对话策略信息及语境指导模型；
或者，所述策略学习单元获取所述对话语料库中的语料，同时接收由所述开发者输入接口输入的配置信息，将二者进行信息融合后得到相应的对话策略信息及语境指导模型。

【专利技术属性】
技术研发人员：高懿，朱风云，范梓野，
申请(专利权)人：大连即时智能科技有限公司，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人