一种通过语音唤醒寻找手机的方法及系统技术方案

技术编号：8685791 阅读：562 留言：0更新日期：2013-05-09 05:19

本发明专利技术公开了一种通过语音唤醒技术来寻找手机的方法及系统。所述系统应用于智能手机上，包括：一语音端点检测(VAD)模块，负责实时检测手机麦克风数据，检测是否有用户在说话及其说话的开始时间点；一语音唤醒模块，负责对语音端点检测模块检测到的语音进行实时解码，检测用户是否说了唤醒词；一自定义唤醒词模块，负责根据用户需求，自定义唤醒词并生成相应的资源。本发明专利技术通过智能语音唤醒技术检测到用户在寻找手机，并在检测到唤醒词后启动手机铃声和/或震动，从而能够方便、快捷地找到手机。本发明专利技术还提供了用户自定义唤醒词的功能，根据用户自身喜好定制个性化的唤醒词，让寻找手机更有乐趣。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及远距离语音识别领域，由其涉及一种语音唤醒识别手机的方法及系统。
技术介绍
在日常使用手机的过程中，经常会发生到处找手机找不到的情况。一般情况下，会通过另外一部电话拨打该手机的电话号码的方式来找手机。这种方式寻找手机需要满足一定的前提条件，存在一定的局限性。比如:没有第二部手机发起主动呼叫时，或者用户不记得自己的手机号的情况下，则无法通过上述方式找到手机。已公开的专利文献，如公开号为CN102136855A和CN101132196A的专利，都涉及到了采用近距离无线通信技术来寻找手机的方法。但这类方法需要额外增加一个与手机独立的硬件设备，而且需要在手机硬件内部增加相应的通讯硬件设备。这种体系结构有一定的局限性:一是必须在手机的硬件设计时考虑增加该功能，实现起来技术复杂、开发测试周期较长；二是增加了手机设计和生产的成本；三是额外的增加了第二个外部设备，用户需要随身携带，使用起来非常不方便。因此，很少在实际的手机中见到有基于这类专利的应用。
技术实现思路
本专利技术的目的在于提供一种通过语音唤醒技术实现的更高效自然、方便快捷的寻找手机的方法及系统。本专利技术提...

【技术保护点】
一种通过语音唤醒寻找手机的系统，其特征在于，包括：语音唤醒模块，用于实时检测语音数据中的唤醒词并控制手机播放铃声和/或震动提示用户手机具体方位；自定义唤醒词模块，用于输入唤醒词文本，并向云端自定义唤醒词模块发送请求，完成唤醒词资源包的下载。云端自定义唤醒词模块，用于接收自定义唤醒词模块发送的请求并进行处理，提供唤醒词资源包的下载。

【技术特征摘要】
1.一种通过语音唤醒寻找手机的系统，其特征在于，包括: 语音唤醒模块，用于实时检测语音数据中的唤醒词并控制手机播放铃声和/或震动提示用户手机具体方位；自定义唤醒词模块，用于输入唤醒词文本，并向云端自定义唤醒词模块发送请求，完成唤醒词资源包的下载。云端自定义唤醒词模块，用于接收自定义唤醒词模块发送的请求并进行处理，提供唤醒词资源包的下载。2.按权利要求1所述的通过语音唤醒寻找手机的系统，其特征在于: 所述语音唤醒模块包括，实时录音模块，用于调用手机API接口获取麦克风数据； VAD模块，用于检测从实时录音模块中获取的数据中是否存在语音信号并进行提取；特征提取模块，用于将语音信号进行长时谱减分析和短时谱特征提取；唤醒词检测模块，用于将特征提取模块提取得到的声学特征发送给解码器进行维特比解码，检测是否有唤醒词出现；反馈控制模块，用于根据预先设定调用手机响应接口，控制铃声和/或手机震动。3.按权利要求1所述的通过语音唤醒寻找手机的系统，其特征在于: 所述自定义唤醒词模块，支持一个唤醒词和/或多个唤醒词。4.按权利要求1所述的通过语音唤醒寻找手机的系统，其特征在于: 所述云端自定义唤醒词模块包括，唤醒词文本接收模块，用于接收自定义唤醒词模块发送的唤醒词文本请求；语音库，用于存储常用音素和音元字节；噪声库，用于存储各种实际环境下的噪声数据；模型训练模块，用于采用基于统计的隐马尔科夫模型进行音素建模和VAD建模，采用上下文相关的建模方法对状态数进行聚类，得到上下文相关的三元音素模型及VAD模型；模型裁剪模块，用于通过分析输入文本的上下文关系，将模型训练模块建立的音素模型进行裁剪；解码网络扩展模块，用于采用基于加权有限状态转换器的方法，结合模型训练模块建立的音素模型，将唤醒词文本转换为语音识别解码网络；资源包下载模块，用于提供唤醒词资源包的下载。5.按权利要求4所述的通过语音唤醒识别手机的系统，其特征在于: 所述解码网络扩展模块既可以部署在云端，也可以部署在本地。6.按权利要求1-5之一所述的通过语音唤醒寻找手机的系统，其特征在于: 通过远距离语音信号处理和远距离语音声学模型训练提高语音识别正确率，其中，所述通过远距离语音信号处理包括:通过长时谱分析算法、谱减法去除混响信号带来的谱激变，然后，在提取出声学特征后，采用减均值、方差规整并进行自回归滑动平均模型算法去除由于环境噪声带来的谱激变；所述远距离语音声学模型训练包括:在训练数据中针对性的增加远距离录音数据，进行HMM状态数、音素模型聚类算法调整。7.按权利要求1-5之一所述的通过语音唤醒寻找手机的系统，其特征在于:所述智能手机包括两种...

【专利技术属性】
技术研发人员：雷雄国，王艳龙，王欢良，俞凯，邹平，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人