语音处理设备和语音处理方法技术

技术编号:7975271 阅读:129 留言:0更新日期:2012-11-16 00:01
本发明专利技术提供一种语音处理设备和语音处理方法,所述语音处理设备包括:语音采集模块,用于采集语音信号;语音识别模块,用于对所述语音信号进行识别,获得识别结果;第一传输模块,用于通过与终端设备之间建立的连接,将所述识别结果传输给所述终端设备,所述终端设备能够根据所述识别结果执行相应的操作。本发明专利技术能够在本地快速准确地识别出语音信号。

【技术实现步骤摘要】

本专利技术涉及语音信号处理
,尤其涉及一种。
技术介绍
语音识别交互是目前手机战略布局中的一个重要环节,手机可以采集用户的语音信号,并对采集到的语音信号进行本地识别,根据识别结果执 行相应的操作,例如播放音乐的操作、读取短消息的操作等。由于手机处理能力有限,通常仅能够识别出简单的语音信号,为了能够对更为复杂的语音信号进行识别,如图I所示,手机可以通过3G或WIFI等网络将采集到的语音信号传输至一远程服务器,由该远程服务器对语音信号进行识别,并根据识别结果生成手机能够识别的指令信息反馈给手机,手机根据接收到的指令信息执行相应的操作。依靠远程服务器进行语音识别的方法存在以下问题一、手机与远程服务器之间的连接是否成功需要依靠网络的状况,在手机周围没有网络或者网络信号差的情况下,难以完成语音识别;二、响应速度慢,现有的远程服务器和手机之间完成一个交互服务的时间通常约为4秒,其中大部分时间是由于远程服务器和手机之间的网络传输所导致。
技术实现思路
有鉴于此,本专利技术提供一种,能够在本地完成强大的语音识别,克服了运程语音识别需要依靠网络状况以及响应速度慢的问题。为解决上述问题,本专利技术提供一种语音处理设备,包括语音采集模块,用于采集语音信号;语音识别模块,用于对所述语音信号进行识别,获得识别结果;第一传输模块,用于通过与终端设备之间建立的连接,将所述识别结果传输给所述终端设备,所述终端设备能够根据所述识别结果执行相应的操作。优选的,所述的语音处理设备还包括存储模块,用于存储语音特征库,所述语音特征库中包含多个参考语音模型,每个所述参考语音模型对应一语义信息;所述语音识别模块包括特征提取模块,用于提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型;匹配模块,用于将所述待匹配语音模型与所述参考语音模型进行匹配,得到匹配结果;获取模块,用于根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,并根据所述语义信息,获得一词汇信息,将所述词汇信息作为所述识别结果。优选的,所述的语音处理设备还包括存储模块,用于存储语音特征库,所述语音特征库中包含多个参考语音模型,每个所述参考语音模型对应一语义信息;所述语音识别模块包括特征提取模块,用于提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型;匹配模块,用于将所述待匹配语音模型与所述参考语音模型进行匹配,得到匹配结果;获取模块,用于根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,根据所述语义信息,获得一词汇信息,并确定所述词汇信息对应的指令信息,将所述指令信息作为所述识别结果。优选的,所述语音特征库包括第一语音特征库和第二语音特征库,所述第一语音特征库和所述第二语音特征库不同;所述语音处理设备还包括更新模块,用于当满足第一预定条件时,将所述待匹配模型以及所述待匹配模型对应的语义信息更新到所述第二语首特征库。优选的,所述语音识别模块还包括语音验证模块,用于判断所述待匹配语音模型与所述第二语音特征库中的参考语音模型是否匹配,如果是,控制所述获取模块工作,否则,控制所述获取模块不工作。优选的,所述的语音处理设备还包括存储模块,用于存储语音特征库,所述语音特征库中包含多个参考语音模型,每个所述参考语音模型对应一语义信息;所述语音识别模块包括特征提取模块,用于提取所述语音信号中的语音特征参数值,根据所述语音特征 参数值生成待匹配语音模型;匹配模块,用于将所述待匹配语音模型与所述参考语音模型进行匹配,得到匹配结果;获取模块,用于根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,并根据所述语义信息,获得一词汇信息;拆分模块,用于当所述词汇信息涉及多个终端设备时,从所述词汇信息中获取多个终端标识,以及每个所述终端标识对应的子识别结果,所述多个终端标识不同;其中,所述第一传输模块进一步用于分别将所述多个子识别结果作为所述识别结果传输给所述多个终端标识对应的终端设备。优选的,所述拆分模块进一步用于从所述词汇信息中获取第一终端标识和第二终端标识,以及所述第一终端标识对应的第一指令信息和所述第二终端标识对应的第二指令信息,所述第一终端标识和第二终端标识不同,所述第一指令信息和第二指令信息不同;所述第一传输模块进一步用于将所述第一指令信息作为所述识别结果传输给所述第一终端标识对应的终端设备,将所述第二指令信息作为所述识别结果传输给所述第二终端标识对应的终端设备。优选的,所述的语音处理设备还包括图像信号生成模块,用于根据所述语音处理设备上执行的操作生成图像信号;其中,第一传输模块进一步用于将所述图像信号传输给所述终端设备,并控制所述终端设备的显示模块显示所述图像信号。优选的,所述的语音处理设备还包括第二传输模块,用于当满足第二预定条件时,通过与远程服务器之间建立的连接,将所述语音信号传输给所述远程服务器,所述远程服务器能够对所述语音信号进行识别,获得识别结果,将所述识别结果传输给所述语音处理设备;接收模块,用于接收所述远程服务器传输的所述识别结果。本专利技术还提供一种语音处理设备,包括接口模块,用于与终端设备连接;语音采集模块,用于采集语音信号;处理模块,用于对所述语音信号进行识别,获得识别结果,并通过所述接口模块,将所述识别结果传输给所述终端设备,所述终端设备能够根据所述识别结果执行相应的操作。本专利技术还提供一种语音处理方法,包括以下步骤采集语音信号;对所述语音信号进行识别,获得识别结果;通过与终端设备之间建立的连接,将所述识别结果传输给所述终端设备,所述终端设备能够根据所述识别结果执行相应的操作。优选的,所述对所述语音信号进行识别,获得识别结果具体为提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型;将所述待匹配语音模型与语音特征库中的参考语音模型进行匹配,得到匹配结果;所述语音特征库中包含多个所述参考语音模型,每个所述参考语音模型对应一语义信息;根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,并根据所述语义信息,获得一词汇信息,将所述词汇信息作为所述识别结果。优选的,所述对所述语音信号进行识别,获得识别结果具体为提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型;将所述待匹配语音模型与语音特征库中的参考语音模型进行匹配,得到匹配结果;所述语音特征库中包含多个所述参考语音模型,每个所述参考语音模型对应一语义信息;根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,根据所述语义信息,获得一词汇信息,并确定所述词汇信息对应的指令信息,将所述指令信息作为所述识别结果。优选的,所述对所述语音信号进行识别,获得识别结果具体为提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型;将所述待匹配语音 模型与语音特征库中的参考语音模型进行匹配,得到匹配结果;所述语音特征库中包含多个所述参考语音模型,每个所述参考语音模型对应一语义信息;根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,并根据所述语义信息,获得一词汇信息;当所述词汇信息涉及多个终端设备时,从所述词汇信息中获取多个终端标识,以及每个所述终端标识对应的子识别结果,所述多个终端标识不同;所述将所述识别结本文档来自技高网...

【技术保护点】
一种语音处理设备,其特征在于,包括:语音采集模块,用于采集语音信号;语音识别模块,用于对所述语音信号进行识别,获得识别结果;第一传输模块,用于通过与终端设备之间建立的连接,将所述识别结果传输给所述终端设备,所述终端设备能够根据所述识别结果执行相应的操作。

【技术特征摘要】
1.一种语音处理设备,其特征在于,包括 语音采集模块,用于采集语音信号; 语音识别模块,用于对所述语音信号进行识别,获得识别结果; 第一传输模块,用于通过与终端设备之间建立的连接,将所述识别结果传输给所述终端设备,所述终端设备能够根据所述识别结果执行相应的操作。2.如权利要求I所述的语音处理设备,其特征在于,还包括 存储模块,用于存储语音特征库,所述语音特征库中包含多个参考语音模型,每个所述参考语音模型对应一语义信息; 所述语音识别模块包括 特征提取模块,用于提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型; 匹配模块,用于将所述待匹配语音模型与所述参考语音模型进行匹配,得到匹配结果; 获取模块,用于根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,并根据所述语义信息,获得一词汇信息,将所述词汇信息作为所述识别结果。3.如权利要求I所述的语音处理设备,其特征在于,还包括 存储模块,用于存储语音特征库,所述语音特征库中包含多个参考语音模型,每个所述参考语音模型对应一语义信息; 所述语音识别模块包括 特征提取模块,用于提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型; 匹配模块,用于将所述待匹配语音模型与所述参考语音模型进行匹配,得到匹配结果; 获取模块,用于根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,根据所述语义信息,获得一词汇信息,并确定所述词汇信息对应的指令信息,将所述指令信息作为所述识别结果。4.如权利要求2或3所述的语音处理设备,其特征在于,所述语音特征库包括第一语音特征库和第二语音特征库,所述第一语音特征库和所述第二语音特征库不同;所述语音处理设备还包括 更新模块,用于当满足第一预定条件时,将所述待匹配模型以及所述待匹配模型对应的语义信息更新到所述第二语音特征库。5.如权利要求4所述的语音处理设备,其特征在于,所述语音识别模块还包括 语音验证模块,用于判断所述待匹配语音模型与所述第二语音特征库中的参考语音模型是否匹配,如果是,控制所述获取模块工作,否则,控制所述获取模块不工作。6.如权利要求I所述的语音处理设备,其特征在于,还包括 存储模块,用于存储语音特征库,所述语音特征库中包含多个参考语音模型,每个所述参考语音模型对应一语义信息; 所述语音识别模块包括 特征提取模块,用于提取所述语音信号中的语音特征参数值,根据所述语音特征参数值生成待匹配语音模型; 匹配模块,用于将所述待匹配语音模型与所述参考语音模型进行匹配,得到匹配结果; 获取模块,用于根据所述匹配结果,确定所述待匹配语音模型对应的语义信息,并根据所述语义信息,获得一词汇信息; 拆分模块,用于当所述词汇信息涉及多个终端设备时,从所述词汇信息中获取多个终端标识,以及每个所述终端标识对应的子识别结果,所述多个终端标识不同; 其中,所述第一传输模块进一步用于分别将所述多个子识别结果作为所述识别结果传输给所述多个终端标识对应的终端设备。7.如权利要求6所述的语音处理设备,其特征在于 所述拆分模块进一步用于从所述词汇信息中获取第一终端标识和第二终端标识,以及所述第一终端标识对应的第一指令信息和所述第二终端标识对应的第二指令信息,所述第一终端标识和第二终端标识不同,所述第一指令信息和第二指令信息不同; 所述第一传输...

【专利技术属性】
技术研发人员:贺志强姚映佳尉伟东王茜莺杨胤嗣徐庆刘俊峰孙春辉
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1