一种语音交互系统及方法技术方案

技术编号：17163369 阅读：12 留言：0更新日期：2018-02-01 21:18

本发明专利技术公开了一种语音交互系统及方法,包括：前处理模块，其包括声音预处理模块和端点检测模块；声学模型库，其包括HMM模型匹配单元、TDNN模型匹配单元、HMM模型数据库和ANN模型数据库；语言模型库，其包括N‑Gram模型数据库和Rule‑based模型数据库；识别模块，其包括MFCC参数特征提取单元和识别控制单元；交互中心，其包括语义理解模块、交互处理模块、应答信息库和语义词典数据库。本发明专利技术利用反馈模块对识别信息和客户的反馈指令的监测，并通过识别控制单元向客户展示识别信息，同时控制改变声音匹配模型和语言模型库，很好的优化交互系统的交互识别正确率。

A speech interactive system and method

The invention discloses a voice interactive system and method, including: pretreatment module, including the module and voice endpoint detection module pre; acoustic model library, which includes the HMM model matching unit, TDNN model, HMM model unit, ANN database and model database; language model library, including the N Gram model database based model and Rule database; identification module, which includes unit and control unit identification MFCC parameter extraction characteristics; interaction center, which includes semantic understanding module, interactive processing module, response information database and semantic dictionary database. The invention uses the feedback module to monitor the identification information and the feedback instruction of the customer, and displays identification information to the customer by identifying the control unit, while controlling the changing of the sound matching model and the language model library, so as to optimize the interactive recognition accuracy rate of the interactive system.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音交互系统及方法
本专利技术涉及语音交互领域，具体涉及一种语音交互系统及方法。
技术介绍
随着人工智能走进日常生活中，人们对于语音交互的认识也越来越深，同时对人工智能中语音交互系统的要求也越来越高。现有专利CN107146622A一种冰箱、语音交互系统、语音交互方法、计算机设备、计算机可读存储介质，其中，语音交互系统包括：语音采集模块，用于对语音信号采集和预处理，并将预处理后的语音信号发送至语音识别模块；语音识别模块，用于将预处理后的语音信号转化为文本信息，并将文本信息分别发送至处理模块和语义理解模块；语义理解模块，用于将文本信息转化为语义结果，并将语义结果发送至处理模块；处理模块，用于根据文本信息和语义结果，查询并结合相关联的信息库以执行语音信号对应的语音交互任务。虽然现有专利CN107146622A实现了语言人机交互，提高了交互体验度。但是也存在如下弊端：当客户跟系统交互出现答非所问或者有明显的不能识别或者不理解客户的语音信息的时候，往往顾客无计可施，大大降低了人机交互的性能。
技术实现思路
本专利技术的目的在于提供一种语音交互系统及方法，以解决上述
技术介绍
中提出的问题。为实现上述目的，本专利技术提供如下技术方案：一种语音交互系统，包括：前处理模块，其包括声音预处理模块和端点检测模块，所述声音预处理模块分别与所述麦克风和端点检测模块电性连接；声学模型库，其包括HMM模型匹配单元、TDNN模型匹配单元、HMM模型数据库和ANN模型数据库，所述HMM模型匹配单元与所述HMM模型数据库电性连接，所述TDNN模型匹配单元与所述ANN模型数据库电性连接；语言模...
一种语音交互系统及方法

【技术保护点】
一种语音交互系统，其特征在于包括:前处理模块，其包括声音预处理模块和端点检测模块，所述声音预处理模块分别与所述麦克风和端点检测模块电性连接；声学模型库，其包括HMM模型匹配单元、TDNN模型匹配单元、HMM模型数据库和ANN模型数据库，所述HMM模型匹配单元与所述HMM模型数据库电性连接，所述TDNN模型匹配单元与所述ANN模型数据库电性连接；语言模型库，其包括N‑Gram模型数据库和Rule‑based模型数据库；识别模块，其包括MFCC参数特征提取单元和识别控制单元，所述MFCC参数特征提取单元分别与所述识别控制单元和端点检测模块电性连接；所述识别控制单元分别与所述N‑Gram模型数据库、Rule‑based模型数据库、HMM模型数据库、ANN模型数据库、语义理解模块和反馈模块电性连接；交互中心，其包括语义理解模块、交互处理模块、应答信息库和语义词典数据库，所述交互处理模块分别与所述语义理解模块、反馈模块、应答信息库和语音合成模块电性连接，所述语音合成模块分别与反馈模块和扬声器电性连接。

【技术特征摘要】
1.一种语音交互系统，其特征在于包括:前处理模块，其包括声音预处理模块和端点检测模块，所述声音预处理模块分别与所述麦克风和端点检测模块电性连接；声学模型库，其包括HMM模型匹配单元、TDNN模型匹配单元、HMM模型数据库和ANN模型数据库，所述HMM模型匹配单元与所述HMM模型数据库电性连接，所述TDNN模型匹配单元与所述ANN模型数据库电性连接；语言模型库，其包括N-Gram模型数据库和Rule-based模型数据库；识别模块，其包括MFCC参数特征提取单元和识别控制单元，所述MFCC参数特征提取单元分别与所述识别控制单元和端点检测模块电性连接；所述识别控制单元分别与所述N-Gram模型数据库、Rule-based模型数据库、HMM模型数据库、ANN模型数据库、语义理解模块和反馈模块电性连接；交互中心，其包括语义理解模块、交互处理模块、应答信息库和语义词典数据库，所述交互处理模块分别与所述语义理解模块、反馈模块、应答信息库和语音合成模块电性连接，所述语音合成模块分别与反馈模块和扬声器电性连接。2.根据权利要求1所述的一种语音交互系统，其特征在于，所述声音预处理模块包括防混叠滤波器处理、A/D转换器转和分帧加窗处理。3.根据权利要求1所述的一种语音交互系统，其特征在于，所述端点检测模块为基于频带方差的端点检测模块。4.根据权利要求1所述的一种语音交互系统，其特征在于，所述识别控制单元为ARM单片机，且其上面集成了声音模型选择电路，用于选择HMM模型匹配单元和TDNN模型匹配单元，同时集成了语言模型库选择电路，用于选择N-Gram模型数据库和ANN模型数据库。5.根据权利要求1所述的一种语音交互系统，其特征在于，所述应答信息库内存储情景对话的应答映射。6.根据权利要求1所述的一种语音交互系统，其特征在于，所述语义词典数据库...

【专利技术属性】
技术研发人员：王冬，
申请(专利权)人：安徽硕威智能科技有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人