【技术实现步骤摘要】
本专利技术涉及语音识别的,具体为一种基于深度学习的语音识别和人机交互系统及方法。
技术介绍
1、中国专利cn109410957b公开了基于计算机视觉辅助的正面人机交互语音识别方法及系统,具体包括获取同一时间的视频片段和音频片段,对所述视频片段进行人脸识别,得到当前说话人状态、身份、位置以及说话人嘴唇位置,并对说话人嘴唇位置进行判断;根据说话人位置进行音频方位判断,结合说话人的音频方位对音频进行预处理;再识别说话人嘴唇位置判断当前说话人是否停止讲话,并累加当前说话人的视频和音频片段,对当前说话人的视频和音频片段进行语音识别,输出语音识别结果;如果需要再进行语音识别,则将语音再次累加到当前说话人的视频和音频片段中,重复输出语音识别结果。该专利技术直接对语音进行识别,结果存在误差。
2、传统的语音识别方法,通过对说话进行录制得到录制语音片段,直接对录制语音片段进行识别,识别过程存在识别效率低、不能智能识别等问题,并且没有关联人机交互,用户不能实时参与到识别过程中,也不使用深度学习等高新技术,语音识别结果准确性和实时性差。
< ...【技术保护点】
1.一种基于深度学习的语音识别和人机交互方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述S1包括如下步骤:
3.根据权利要求2所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述S12包括如下步骤:
4.根据权利要求3所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述根据降噪语音信号的过零率进行端点检测包括如下步骤:
5.根据权利要求4所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述S2包括如下步骤:
【技术特征摘要】
1.一种基于深度学习的语音识别和人机交互方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述s1包括如下步骤:
3.根据权利要求2所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述s12包括如下步骤:
4.根据权利要求3所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述根据降噪语音信号的过零率进行端点检测包括如下步骤:
5.根据权利要求4所述的一种基于深度学习的语音识别和人机交互方法,其特征在于,所述s2包括如下步骤:...
【专利技术属性】
技术研发人员:张海东,李鹏德,张钧,吴小亮,
申请(专利权)人:北京创世漫道科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。