一种基于深度学习的语音识别和人机交互系统及方法技术方案

技术编号:43435892 阅读:28 留言:0更新日期:2024-11-27 12:43
本发明专利技术涉及语音识别的技术领域,公开了一种基于深度学习的语音识别和人机交互系统及方法。本发明专利技术首先获取初始语音信号,对初始语音信号进行预处理,得到处理后的语音信号;其次根据处理后的语音信号得到时域信号,根据时域信号计算得到帧的能量集合、梅尔倒谱系数集合和二阶差分集合,组成梅尔倒谱系数特征集合;再训练CNN神经网络和RNN神经网络分别得到声学模型和语言模型,对语音进行识别;根据语音识别结果生成初始语音识别文本,对初始语音识别文本进行预处理和词向量转换,计算相似度,最后根据相似度输出回复文本,实现人机交互。本发明专利技术通过对语音信号进行处理达到语音识别和人机交互目的,方法客观且准确。

【技术实现步骤摘要】

本专利技术涉及语音识别的,具体为一种基于深度学习的语音识别和人机交互系统及方法


技术介绍

1、中国专利cn109410957b公开了基于计算机视觉辅助的正面人机交互语音识别方法及系统,具体包括获取同一时间的视频片段和音频片段,对所述视频片段进行人脸识别,得到当前说话人状态、身份、位置以及说话人嘴唇位置,并对说话人嘴唇位置进行判断;根据说话人位置进行音频方位判断,结合说话人的音频方位对音频进行预处理;再识别说话人嘴唇位置判断当前说话人是否停止讲话,并累加当前说话人的视频和音频片段,对当前说话人的视频和音频片段进行语音识别,输出语音识别结果;如果需要再进行语音识别,则将语音再次累加到当前说话人的视频和音频片段中,重复输出语音识别结果。该专利技术直接对语音进行识别,结果存在误差。

2、传统的语音识别方法,通过对说话进行录制得到录制语音片段,直接对录制语音片段进行识别,识别过程存在识别效率低、不能智能识别等问题,并且没有关联人机交互,用户不能实时参与到识别过程中,也不使用深度学习等高新技术,语音识别结果准确性和实时性差。

<br/>

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的语音识别和人机交互方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述S1包括如下步骤:

3.根据权利要求2所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述S12包括如下步骤:

4.根据权利要求3所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述根据降噪语音信号的过零率进行端点检测包括如下步骤:

5.根据权利要求4所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述S2包括如下步骤:

>6.根据权利要求5
...

【技术特征摘要】

1.一种基于深度学习的语音识别和人机交互方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述s1包括如下步骤:

3.根据权利要求2所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述s12包括如下步骤:

4.根据权利要求3所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述根据降噪语音信号的过零率进行端点检测包括如下步骤:

5.根据权利要求4所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述s2包括如下步骤:...

【专利技术属性】
技术研发人员:张海东李鹏德张钧吴小亮
申请(专利权)人:北京创世漫道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1