一种AI语音对话系统技术方案

技术编号：20330293 阅读：40 留言：0更新日期：2019-02-13 06:28

本发明专利技术公开了一种AI语音对话系统，包括终端系统和云端系统：本发明专利技术解决了原核心架构在终端，迭代速度慢；各个核心子系统之间耦合较深，不易独立扩展。该架构是着眼于未来AI语音对话系统的技术发展趋势而设计的，让人工智能语音电视持续发展具备了坚实基础。

全部详细技术资料下载

【技术实现步骤摘要】
一种AI语音对话系统
本专利技术涉及人工智能语音
，尤其涉及一种AI语音对话系统。
技术介绍
近年来，随着人工智能的迅速发展，人工智能语音技术更是受到智能电视行业的追捧，不少电视厂商纷纷发布了具有语音交互功能的电视新品，而且智能电视语音交互也成为了吸引消费者的重要因素之一。而如何打造一款既稳定高效，又有具有高可扩展性和松耦合的AI语音对话系统，就成为首先要解决的架构问题，因为只有首先保证AI语音对话系统架构的先进性，我们才能基于此持续快速地开发更多语音功能。以前，我们语音系统的核心架构主要在终端，而云端仅仅提供一些必要的识别和服务接口，这就导致，一方面架构的调整需要升级终端，另一方面，各个子系统耦合较高，不利于各自的扩展。而本专利技术提供一种创新的架构方法，将相对固定的语音处理逻辑放在终端，而将相对容易变化的意图分发、服务接入等子系统放在云端，形成了各子系统端云一体，但又相对独立的端云架构，这也为长虹智能电视在人工智能语音领域持续领先于行业提供了坚实的技术基础。
技术实现思路
本专利技术的目的就在于为了解决上述问题而提供一种AI语音对话系统，本专利技术通过以下技术方案来实现上述目的：一种AI语音对话系统，包括终端系统和云端系统：所述终端系统包括名称为AIVoiceUI的终端语音系统，所述终端语音系统包括核心逻辑引擎、语音处理引擎和UI引擎三个模块；所述核心逻辑引擎包括录音、语音识别、语义处理、功能执行、UI展示和播报六个核心逻辑，“录音”模块负责获取各种输入设备的音频数据，并将其作为输出，发送给下一个模块“语音识别”；“语音识别”模块将输入的录音数据转换...

【技术保护点】
1.一种AI语音对话系统，其特征在于，包括终端系统和云端系统：所述终端系统包括名称为AI Voice UI的终端语音系统，所述终端语音系统包括核心逻辑引擎、语音处理引擎和UI引擎三个模块；所述核心逻辑引擎包括录音、语音识别、语义处理、功能执行、UI展示和播报六个核心逻辑，“录音”模块负责获取各种输入设备的音频数据，并将其作为输出，发送给下一个模块“语音识别”；“语音识别”模块将输入的录音数据转换为文本数据，输出给下一个模块“语义处理”；“语义处理”模块将输入的文本数据转换为结构化数据，输出给后面三个模块“功能执行”、“UI展示”和“语音播报”，“功能执行”模块负责调用本地功能接口，“UI展示”模块负责向用户以图形化的方式展示结果，“语音播报”模块负责以声音的方式给用户展示结果；所述语音处理引擎包括ASR、NLP和TTS，提供抽象接口和具体实现，语音处理引擎提供抽象接口，供具体的ASR、NLP和TTS实现，同时供前述的核心逻辑引擎调用；所述UI引擎主要提供对本地UI模板和云端UI模板的方式，而云端UI模板支持标准的H5方式和小程序方式，本地UI模板支持的样式固定且有限，供语音技能开发者选...

【技术特征摘要】
1.一种AI语音对话系统，其特征在于，包括终端系统和云端系统：所述终端系统包括名称为AIVoiceUI的终端语音系统，所述终端语音系统包括核心逻辑引擎、语音处理引擎和UI引擎三个模块；所述核心逻辑引擎包括录音、语音识别、语义处理、功能执行、UI展示和播报六个核心逻辑，“录音”模块负责获取各种输入设备的音频数据，并将其作为输出，发送给下一个模块“语音识别”；“语音识别”模块将输入的录音数据转换为文本数据，输出给下一个模块“语义处理”；“语义处理”模块将输入的文本数据转换为结构化数据，输出给后面三个模块“功能执行”、“UI展示”和“语音播报”，“功能执行”模块负责调用本地功能接口，“UI展示”模块负责向用户以图形化的方式展示结果，“语音播报”模块负责以声音的方式给用户展示结果；所述语音处理引擎包括ASR、NLP和TTS，提供抽象接口和具体实现，语音处理引擎提供抽象接口，供具体的ASR、NLP和TTS实现，同时供前述的核心逻辑引擎调用；所述UI引擎主要提供对本地UI模板和云端UI模板的方式，而云端UI...

【专利技术属性】
技术研发人员：李足红，李洋全，黄涛涛，陈贵凤，田婧，
申请(专利权)人：四川长虹电器股份有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人