一种基于单目摄像头的带噪音语音识别系统及方法技术方案

技术编号：18050468 阅读：190 留言：0更新日期：2018-05-26 08:20

本发明专利技术公开一种基于单目摄像头的带噪音语音识别系统及方法，所述系统包括图像采集模块、视觉处理模块、音频采集模块、音频处理模块、语音识别模块；所述图像采集模块使用单目摄像头采集嘴唇形状并输出至视觉处理模块；所述视觉处理模块对嘴唇图像进行处理并将结果输出至语音识别模块；音频采集模块使用麦克风采集用户音频并输出至音频处理模块；所述音频处理模块对用户音频进行处理并输出至语音识别模块；所述语音模块使用数据融合策略对视频数据和音频数据进行融合，实现语音识别。本发明专利技术通过使用视频信息与音频信息两种特征，使用特征融合策略，有效避免如机器人马达，零件摩擦等造成的噪音干扰，提高了语音识别系统的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于单目摄像头的带噪音语音识别系统及方法
本专利技术涉及语音识别技术，具体设计一种基于单目摄像头的带噪音语音识别系统及方法。
技术介绍
随着人机交互技术发展，机器人被期望能拥有像人类一样的感知能力并能与人类合作共事。为实现这一目标，一些研究者使用语音技术来让机器人理解人类的语言。但是，运动状态中的机器人不可避免的会产生噪音，比如电动风扇和马达产生的噪音，因麦克风更靠近机器人，因此这些噪音相比用户的语言信息更易获取，造成了机器人语音识别效果不佳。申请公布号为CN201610615354.6的专利技术专利公开了基于自然语言的机器人控制系统及控制方法，方法包括接收用户输入的自然语言声波信号；将自然语言声波信号转换为语言文字信息；对语言文字信息进行分析分解，信息分解结果为根据不同词性将所述语言文字信息分类而组合成的词语集合；根据预置的词汇库对所述词语集合进行语义匹配，获取所述词语集合的行为匹配结果；将行为匹配结果转换成语音输出；通过人机对话模式对行为匹配结果进行确认；对确认的行为匹配结果进行行为分解，并依照行为分解结果控制机器人的执行。申请公布号为CN201410771233.1的专利技术专利公开了一种机器人语音识别方法，包含步骤1：打开音频传感器，采集音频信号；步骤2：对采集到的音频信号，进行模数转换；步骤3：将转换后代数字信号送人模式识别缓冲区；步骤4：对模式识别缓冲区中的信号按照振幅做离散化处理；步骤5：将按照振幅做离散化处理的数据，在模式识别数据库中进行匹配算法；步骤6：对所有命令依据匹配算法的结果进行概率运算；步骤7：按照概率从大到小的方式排序；步骤...
一种基于单目摄像头的带噪音语音识别系统及方法

【技术保护点】
一种基于单目摄像头的带噪音语音识别系统，其特征在于，所述系统包括图像采集模块、视觉处理模块、音频采集模块、音频处理模块、语音识别模块；所述图像采集模块使用单目摄像头采集嘴唇形状并输出至视觉处理模块；所述视觉处理模块对嘴唇图像进行处理并将结果输出至语音识别模块；音频采集模块使用麦克风采集用户音频并输出至音频处理模块；所述音频处理模块对用户音频进行处理并输出至语音识别模块；所述语音模块使用数据融合策略对视频数据和音频数据进行融合，实现语音识别。

【技术特征摘要】
1.一种基于单目摄像头的带噪音语音识别系统，其特征在于，所述系统包括图像采集模块、视觉处理模块、音频采集模块、音频处理模块、语音识别模块；所述图像采集模块使用单目摄像头采集嘴唇形状并输出至视觉处理模块；所述视觉处理模块对嘴唇图像进行处理并将结果输出至语音识别模块；音频采集模块使用麦克风采集用户音频并输出至音频处理模块；所述音频处理模块对用户音频进行处理并输出至语音识别模块；所述语音模块使用数据融合策略对视频数据和音频数据进行融合，实现语音识别。2.一种应用权利要求1所述的一种基于单目摄像头的带噪音语音识...

【专利技术属性】
技术研发人员：梁鹏，郝刚，吴玉婷，
申请(专利权)人：广东技术师范学院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人