离线对话实现方法和装置制造方法及图纸

技术编号：20684200 阅读：30 留言：0更新日期：2019-03-27 19:59

本发明专利技术公开离线对话实现方法和装置，其中，一种离线对话实现方法，包括：获取初始化阶段开发者配置的语音功能参数，其中，所述语音功能参数至少包括语法文件路径和启用的语音技术，所述语音技术包括语音识别技术、语义理解技术、对话管理技术和语音合成技术；若开发者启用所述语音识别技术，获取用户的音频数据；基于所述语法文件和所述语音识别技术对所述音频数据进行识别并输出语音识别结果；若开发者未启用所述语音识别技术且启用了所述语义理解技术或对话管理技术，获取用户输入的第一文本信息。本实施例的方案能够实现全链路的离线对话及其定制，方便开发者的个性化定制及用户在无网络状态下的使用。

全部详细技术资料下载

【技术实现步骤摘要】
离线对话实现方法和装置
本专利技术属于语音对话
，尤其涉及离线对话实现方法和装置。
技术介绍
随着科学技术的发展，语音技术已逐步成为人工智能各领域的核心技术，是实现人机交互的纽带。通过将语音识别(AutomaticSpeechRecongnition，ASR)、自然语言理解(NaturalLanguageUnderstanding,NLU)、语音合成(TextToSpeech,TTS)技术，嵌入以语音交互为核心的人工智能开放平台，实现了人与机器之间的通信，或者将其嵌入以语音交互为核心的对话开放平台(DialogueUserInterface,DUI)，设计了一种在线语音对话定制方法，以达到开发者可以定制综合服务的目的。然而，在实现人机交互过程中，由于集成多种功能的繁琐性，以及网络通信的局限性，本文提出了一种全链路离线对话在语音交互中应用方法。语音识别主要是将人所发出的语音内容转换为可供计算机读入的文本信息。该技术是一种综合性的技术，涉及到多个学科领域，如声学、模式识别以及人工智能等。目前，语音识别主要采用基于统计模型的识别技术应用到大量词汇识别系统中，主要包...

【技术保护点】
1.一种离线对话实现方法，包括：获取初始化阶段开发者配置的语音功能参数，其中，所述语音功能参数至少包括语法文件路径和启用的语音技术，所述语音技术包括语音识别技术、语义理解技术、对话管理技术和语音合成技术；若开发者启用所述语音识别技术，获取用户的音频数据；基于所述语法文件和所述语音识别技术对所述音频数据进行识别并输出语音识别结果；若开发者未启用所述语音识别技术且启用了所述语义理解技术或对话管理技术，获取用户输入的第一文本信息。

【技术特征摘要】
1.一种离线对话实现方法，包括：获取初始化阶段开发者配置的语音功能参数，其中，所述语音功能参数至少包括语法文件路径和启用的语音技术，所述语音技术包括语音识别技术、语义理解技术、对话管理技术和语音合成技术；若开发者启用所述语音识别技术，获取用户的音频数据；基于所述语法文件和所述语音识别技术对所述音频数据进行识别并输出语音识别结果；若开发者未启用所述语音识别技术且启用了所述语义理解技术或对话管理技术，获取用户输入的第一文本信息。2.根据权利要求1所述的方法，其中，所述方法还包括：若开发者启用所述语义理解技术，对所述语音识别结果或所述第一文本信息进行语义理解并输出语义理解结果；若开发者未启用所述语义理解技术且启用了所述对话管理技术，获取用户输入的第二文本信息。3.根据权利要求2所述的方法，其中，所述方法还包括：若开发者启用所述对话管理技术，对所述语义理解结果或所述第二文本信息进行对话管理处理并输出处理结果；若开发者未启用所述对话管理技术且启用了所述语音合成技术，获取用户输入的合成文本。4.根据权利要求1所述的方法，其中，所述方法还包括：若开发者启用所述对话管理技术，对所述第一文本信息进行对话管理处理并输出处理结果；若开发者未启用所述对话管理技术且启用了所述语音合成技术，获取用户输入的合成文本。5.根据权利要求3或4所述的方法，其中，所述方法还包括：若开发者启用所述语音合成技术，对所述处理结果或所述合成文本进行语音合成并播报语音合成音频。6.根据权利要求5所述的方法...

【专利技术属性】
技术研发人员：宋泽，甘津瑞，黄川，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人