一种基于声像耦合的语音采集智能耳机制造技术

技术编号:25618901 阅读:72 留言:0更新日期:2020-09-12 00:17
本实用新型专利技术提供一种基于声像耦合的语音采集智能耳机,包括:控制器、语音采集模块、图像采集模块和语音输出模块;所述控制器的第一输入端与所述语音采集模块的输出端相连,所述控制器的第二输入端与所述图像采集模块的输出端相连,所述控制器的输出端与所述语音输出模块的输入端相连;所述语音采集模块用于拾取发声者的语音信号;所述图像采集模块用于对发声者的嘴唇动作进行视频采集;所述控制器用于对所述语音信号进行降噪处理,并根据所述嘴唇动作对所述语音信号进行声像耦合,以得到识别后的音频信号;所述语音输出模块用于对外部终端进行所述音频信号传输。本实用新型专利技术能提高语音有效识别的准确率,增加智能耳机的智能性。

【技术实现步骤摘要】
一种基于声像耦合的语音采集智能耳机
本技术涉及语音识别
,尤其涉及一种基于声像耦合的语音采集智能耳机。
技术介绍
在实际场景中,环境中总是充斥了大量的噪声。为减小环境噪声对所希望的语音信号的影响,通常需要进行降噪处理。常用的降噪方法有单麦降噪和阵列降噪两种。单麦降噪通常采用基于统计学的降噪算法,在时域上设计最优滤波器,通常在降低噪声的同时也会带来有用信号的损失,因而其使用有一定的局限性。而麦克风阵列降噪算法,则是采用空间滤波器的方式,可以在不损失有用信号的同时,对噪声进行抑制。现实生活中有许多场景,需要对人们的说话内容进行采集和准确识别。而现有智能耳机功能较为单一,多只有放音的功能,少数带有拾音功能的智能耳机,只能简单的拾取佩戴者的音频,对拾取到的音频无法进行降噪处理,在噪声环境下表现较差。因此,如何对发音者发出的语音进行准确识别具有重要的研究意义。
技术实现思路
本技术提供一种基于声像耦合的语音采集智能耳机,解决现有智能耳机在复杂噪声环境下,不能准确对语音进行识别,存在降噪效果不好、识别准确率低的问题。能提高语音本文档来自技高网...

【技术保护点】
1.一种基于声像耦合的语音采集智能耳机,其特征在于,包括:控制器、语音采集模块、图像采集模块和语音输出模块;/n所述控制器的第一输入端与所述语音采集模块的输出端相连,所述控制器的第二输入端与所述图像采集模块的输出端相连,所述控制器的输出端与所述语音输出模块的输入端相连;/n所述语音采集模块用于拾取发声者的语音信号;/n所述图像采集模块用于对发声者的嘴唇动作进行视频采集;/n所述控制器用于对所述语音信号进行降噪处理,并根据所述嘴唇动作对所述语音信号进行声像耦合,以得到识别后的音频信号;/n所述语音输出模块用于按所述音频信号输出语音,及对外部终端进行所述音频信号传输。/n

【技术特征摘要】
1.一种基于声像耦合的语音采集智能耳机,其特征在于,包括:控制器、语音采集模块、图像采集模块和语音输出模块;
所述控制器的第一输入端与所述语音采集模块的输出端相连,所述控制器的第二输入端与所述图像采集模块的输出端相连,所述控制器的输出端与所述语音输出模块的输入端相连;
所述语音采集模块用于拾取发声者的语音信号;
所述图像采集模块用于对发声者的嘴唇动作进行视频采集;
所述控制器用于对所述语音信号进行降噪处理,并根据所述嘴唇动作对所述语音信号进行声像耦合,以得到识别后的音频信号;
所述语音输出模块用于按所述音频信号输出语音,及对外部终端进行所述音频信号传输。


2.根据权利要求1所述的基于声像耦合的语音采集智能耳机,其特征在于,所述语音采集模块包括:麦克风阵列和自动增益控制单元;
所述自动增益控制单元与所述麦克风阵列信号连接,所述自动增益控制单元的输出端作为所述语音采集模块的输出端;
所述自动增益控制单元用于对所述麦克风阵列产生多通道语音信号进行放大增益的自动调节,以去除各个通道的语音信号的截幅和/或失真。


3.根据权利要求2所述的基于声像耦合的语音采集智能耳机,其特征在于,图像采集模块包括:摄像头和图像预处理单元;
所述图像预处理单元与所述摄像头信号连接,所述图像预处理单元的输出端作为所述图像采集模块的输出端;
所述图像预处理单元用于根据预设的图像处理算法对采集的图像进行嘴唇动作的特征提取。


4.根据权利要求3所述的基于声像耦合的语音采集智能耳机,其特征在于,所述控制器为SOC片上系统。


5.根据权...

【专利技术属性】
技术研发人员:李清赵亚非
申请(专利权)人:科大讯飞股份有限公司
类型:新型
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1