语音识别方法、装置及系统制造方法及图纸

技术编号:26794736 阅读:22 留言:0更新日期:2020-12-22 17:11
本申请实施例提供一种语音识别方法、装置及系统。本申请实施例通过根据待识别的目标语音信号对应的目标区域标识,确定与目标区域标识对应的目标语音识别引擎,利用目标语音识别引擎,对目标语音信号进行识别,得到识别结果,能够根据区域标识准确确定对应的语音识别引擎,并基于确定的语音识别引擎获得准确的语音识别结果,提高了语音识别的准确性。

【技术实现步骤摘要】
语音识别方法、装置及系统
本申请实施例涉及音频处理
,尤其涉及一种语音识别方法、装置及系统。
技术介绍
语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。相关技术中,对所有用户使用相同的语音识别引擎识别语音内容。但是,由于不同区域的用户在口音上相差较大,因此,这种方式中语音识别的准确性较低。
技术实现思路
为克服相关技术中存在的问题,本申请实施例提供了一种语音识别方法、装置及系统,以提高语音识别的准确性。根据本申请实施例的第一方面,提供一种语音识别方法,所述方法包括:根据待识别的目标语音信号对应的目标区域标识,确定与所述目标区域标识对应的目标语音识别引擎;利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果。根据本申请实施例的第二方面,提供一种语音识别装置,所述装置包括:区域确定模块,用于根据待识别的目标语音信号对应的区域标本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n根据待识别的目标语音信号对应的目标区域标识,确定与所述目标区域标识对应的目标语音识别引擎;/n利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
根据待识别的目标语音信号对应的目标区域标识,确定与所述目标区域标识对应的目标语音识别引擎;
利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果。


2.根据权利要求1所述的方法,其特征在于,所述目标区域标识的获取方式包括:
根据所述目标语音信号的语音特征信息,确定所述目标区域标识;或,
从所述目标用户的输入信息中获取所述目标区域标识;或,
从接收所述目标语音信号的目标终端本地的存储信息中,获取所述目标区域标识;或,
根据接收所述目标语音信号的目标终端的定位信息,获取所述目标区域标识;或,
根据接收所述目标语音信号的目标终端的号码归属地,获取所述目标区域标识。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标语音信号的语音特征信息,确定所述目标区域标识,包括:
将所述目标语音信号的语音特征信息输入至已训练的区域信息识别模型,以由所述区域信息识别模型依据输入的语音特征信息识别出目标区域标识,所述目标区域标识用于指示说出所述目标语音信号的目标用户所属的区域;
所述确定与所述目标区域标识对应的目标语音识别引擎,包括:
从已训练的各区域的语音识别引擎中选择与所述目标区域标识对应的目标语音识别引擎;
所述利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果,包括:
将所述目标语音音频输入至所述目标语音识别引擎,以由所述目标语音识别引擎对输入的目标语音信号进行语音识别,得到识别结果。


4.根据权利要求2所述的方法,其特征在于,所述语音特征信息通过以下步骤确定:
按照设定帧长m,设定帧移n对所述目标语音信号进行分帧,得到至少一个第一音频帧;
按照预设的窗函数对每一第一音频帧进行加窗操作,得到第二音频帧;
对每一第二音频帧进行预加重操作,得到第三音频帧,所述预加重操作用于增加第二音频帧的高频特征的权重;
从各第三音频帧中提取所述目标语音信号的语音特征信息。


5.根据权利要求4所述的方法,其特征在于,所述从各第三音频帧中提取所述目标语音信号的语音特征信息,包括:
对每一第三音频帧进行快速傅里叶变换,得到第一频谱;
对每一第一频谱进行三角滤波,得到第二频谱;
根据预设的梅尔倒谱系数MFCC与频谱的对应关系,确定各第二频谱对应的MFCC;
将确定的各MFCC确定为所述语音特征信息。...

【专利技术属性】
技术研发人员:董勤波周洪伟陈展
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1