一种基于环境声音的场景识别方法及装置及移动终端制造方法及图纸

技术编号:9463624 阅读:122 留言:0更新日期:2013-12-19 01:20
本发明专利技术提供了一种基于环境声音的场景识别方法及装置及移动终端,所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;声音采集模块用于采集声音信号并传输到所述预处理模块;预处理模块用于将所述声音信号处理为频域信号并传输至所述特征提取模块;特征提取模块用于从所述频域信号中提取声音特征信息;数据库用于存储不同场景的声音样本模型权重值;识别控制模块用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。本发明专利技术依靠背景声音信息作为场景的特征来实现定位,使移动终端在保持低能耗的状态下快速准确的识别当前所在的场景。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种基于环境声音的场景识别方法及装置及移动终端,所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;声音采集模块用于采集声音信号并传输到所述预处理模块;预处理模块用于将所述声音信号处理为频域信号并传输至所述特征提取模块;特征提取模块用于从所述频域信号中提取声音特征信息;数据库用于存储不同场景的声音样本模型权重值;识别控制模块用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。本专利技术依靠背景声音信息作为场景的特征来实现定位,使移动终端在保持低能耗的状态下快速准确的识别当前所在的场景。【专利说明】一种基于环境声音的场景识别方法及装置及移动终端
本专利技术涉及智能终端
,尤其涉及基于环境声音的场景识别方法及装置及移动终端。
技术介绍
声音识别技术广泛应用于通讯系统,例如,在移动通信系统中应用声音识别检测技术,可以提高系统的流量处理能力。此外,声音识别技术被越来越多的应用到语音识别的领域,并且技术已经相当成熟,如IBM语音识别输入系统ViaVoice,微软语音识别系统SpeechSDK 等等。随着智能手机在日常生活中越来越常见,语音识别也很好的被运用到智能手机中,iphone就发布了一个语音识别的应用Google Mobile App0该语音搜索的另外一个改进是可以选择口音了,Google都可以顺利识别不同地域性的发音。由于智能手机的流行,定位技术也是智能手机应用的一大热点,目前,场景识别问题可以利用已经被广泛研究过的基于天线的定位技术(例如WIFI,GSM和GPS)来解决。对于室外定位而言,GPS已经提供了非常理想的识别精度。但是,对于室内定位,当前尚未出现一个理想且全面的定位解决方案。受制于建筑物内部的拓扑和强烈的电磁干扰等因素,天线信号的强度往往会不规则的变化,从而使得感知设备无法进行合理的位置推测。研究发现WIFI信号在一天的不同时间段内波动很大,并且其强度的变化并不均匀,况且我们不能保证WIFI信号在所有环境中都存在。另一方面,基站的信号在不同时间上则显得更加稳定。但是由于其部署的不够密集,其在定位上也遇到了许多困难。另外,这类定位方法往往对基础设施的完善有极高的要求。但是对于发展中区域而言,这样的成本无疑太高了。基于GPS,GSM, WIFI信号的定位,在室内环境中不能工作,或者存在较大的定位误差,不能区分地理位置上比较近的室内场所。
技术实现思路
本专利技术要解决的技术问题是提供一种基于环境声音的场景识别方法及装置及移动终端,解决移动终端无法识别当前所在的场景的问题。为了解决上述技术问题,本专利技术提供了一种基于环境声音的场景识别装置,所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;所述声音采集模块,用于采集声音信号并传输到所述预处理模块;所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;所述特征提取模块,用于从所述频域信号中提取声音特征信息;所述数据库,用于存储不同场景的声音样本模型权重值;所述识别控制模块,用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。进一步地,上述装置还可以具有以下特点:所述场景是指不同声音环境下的空间场景。进一步地,上述装置还可以具有以下特点:所述声音采集模块、所述预处理模块、所述特征提取模块、所述场景识别模块、所 述数据库均位于移动终端。进一步地,上述装置还可以具有以下特点:所述声音采集模块、所述预处理模块、所述特征提取模块、所述场景识别模块均位 于移动终端中,所述数据库位于服务端设备。进一步地,上述装置还可以具有以下特点:所述声音采集模块、所述预处理模块、所述特征提取模块均位于移动终端中,所述 场景识别模块和所述数据库位于服务端设备;所述移动终端还包括场景识别控制模块,用于接收声音特征信息并发送至所述服 务端设备,还用于接收所述场景识别模块输出的识别结果。为了解决上述技术问题,本专利技术还提供了一种移动终端,包括声音采集模块、预处 理模块、特征提取模块、场景识别模块、数据库;所述声音采集模块,用于采集声音信号并传输到所述预处理模块;所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模 块;所述特征提取模块,用于从所述频域信号中提取声音特征信息;所述数据库,用于存储不同场景的声音样本模型权重值;所述场景识别模块,用于接收所述声音特征信息,在预设模型下输入所述声音特 征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信 息对应的场景。为了解决上述技术问题,本专利技术还提供了一种移动终端,包括声音采集模块、预处 理模块、特征提取模块、场景识别模块;所述声音采集模块,用于采集声音信号并传输到所述预处理模块;所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模 块;所述特征提取模块,用于从所述频域信号中提取声音特征信息;所述场景识别模块,用于接收所述声音特征信息,还用于从服务端设备接收场景 的声音样本模型权重值,在预设模型下输入所述声音特征信息将模型输出结果与所述场景 声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。为了解决上述技术问题,本专利技术还提供了一种移动终端,包括声音采集模块、预处 理模块、特征提取模块、识别控制模块;所述声音采集模块,用于采集声音信号并传输到所述预处理模块;所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模 块;所述特征提取模块,用于从所述频域信号中提取声音特征信息;所述识别控制模块,用于接收所述声音特征信息,将所述声音特征信息发送至服务端设备,并接收服务端设备返回的场景识别结果。为了解决上述技术问题,本专利技术还提供了一种基于环境声音的场景识别方法,包括:米集声音信号;将所述声音信号处理为频域信号;从所述频域信号中提取声音特征信息;在预设模型下输入所述声音特征信息将模型输出结果与场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。进一步地,上述方法还可以具有以下特点:所述场景是指不同声音环境下的空间场景。本专利技术依靠背景声音信息作为场景的特征来实现定位,使移动终端在保持低能耗的状态下快速准确的识别当前所在的场景。本专利技术的场景定位可以与天线位置定位互补并且共同提闻精度的,提闻移动终端性能。【专利附图】【附图说明】图1是现有技术中声音识别的处理流程示意图;图2是实施例中基于环境声音的场景识别装置的结构示意图;图3是实施例一中场景识别装置的结构示意图;图4是实施例二中场景识别装置的结构示意图;图5是实施例三中场景识别装置的结构示意图;图6是具体实施例中特征向量提取过程示意图;图7是具体实施例中场景分类识别模型结构示意图。【具体实施方式】图1是现有技术中声音识别的处理流程示意图,对声音进行分割以及特征提取后通过分类器对声音进行识别。基于环境声音的场景识别方法包括:米集声音信号;将所述声音信号处理为频域信号;从所述频域信号中提取声音特征信息;在预设模型下输入所述声音特征信息将模型输出结果与场景声音样本模型权本文档来自技高网
...

【技术保护点】
一种基于环境声音的场景识别装置,其特征在于,所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;所述声音采集模块,用于采集声音信号并传输到所述预处理模块;所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;所述特征提取模块,用于从所述频域信号中提取声音特征信息;所述数据库,用于存储不同场景的声音样本模型权重值;所述识别控制模块,用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。

【技术特征摘要】

【专利技术属性】
技术研发人员:薛涛杜军朝刘惠刘悦韡陈文靖
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1