语音识别方法及装置、存储介质、电子设备制造方法及图纸

技术编号:16502716 阅读:122 留言:0更新日期:2017-11-04 12:28
本公开提供一种语音识别方法及装置、存储介质、电子设备。该方法包括:获取当前用户的语音数据,从所述语音数据中提取声学特征;基于所述声学特征、所述当前用户具有的语音属性、以及每个语音属性具有的细分维度,获得所述语音数据在各语音属性中每个维度的分布情况,所述语音属性的数目N≥1,所述维度的数目M≥2;基于所述分布情况,从所述当前用户具有的个性化维度组合中,选取出K个个性化维度组合,所述个性化维度组合包括至少一个不同语音属性具有的维度,且每个个性化维度组合对应表示所述当前用户所处的一个对话场景,K≥1;利用所述K个个性化维度组合对应的语音识别模型,对所述语音数据进行语音识别。如此方案,有助于提高语音识别的准确率。

Speech recognition method and device, storage medium and electronic equipment

The invention provides a device and a voice recognition method, storage medium and electronic equipment. The method includes: voice data of the current user, acoustic features are extracted from the voice data; dimensions of the acoustic characteristics, the current users with voice and speech, each attribute with the attribute based on the voice data in the distribution of each speech belongs to each dimension in the. Speech attribute number N = 1, the number of dimensions M = 2; the distribution based on the personalized dimension combination has from the current user, select K personalized combination of dimensions of the individual dimension combination includes at least one attribute has different speech dimensions and each dimension of personalized combination the corresponding representation of a scene of the current user of the K = 1; speech recognition model using the K personalized dimension corresponding to the combination of the voice data, Speech recognition. This program helps to improve the accuracy of speech recognition.

【技术实现步骤摘要】
语音识别方法及装置、存储介质、电子设备
本公开涉及语音识别领域,具体地,涉及一种语音识别方法及装置、存储介质、电子设备。
技术介绍
随着人工智能技术的不断突破,以及各种智能终端的日益普及,人机交互在人们日常工作、生活中出现的频率越来越高。语音作为最方便、最快捷的交互方式之一,其识别俨然已成为人机交互的重要环节。在实际应用过程中,不同用户之间的发音习惯各不相同,若采用传统的基于统一语音识别模型实现语音识别的方案,无法确保针对所有用户都能具有很好的识别准确率。因此,为每个用户单独构建个性化语音识别模型,以提高不同用户的语音识别准确率,已成为语音识别领域的重要研究方向。
技术实现思路
本公开的主要目的是提供一种语音识别方法及装置、存储介质、电子设备,可以结合用户所处的对话场景进行语音识别,有助于提高语音识别准确率,达到更好的语音识别效果。为了实现上述目的,本公开第一方面提供一种语音识别方法,所述方法包括:获取当前用户的语音数据,从所述语音数据中提取声学特征;基于所述声学特征、所述当前用户具有的语音属性、以及每个语音属性具有的细分维度,获得所述语音数据在各语音属性中每个维度的分布情况,所述语音属本文档来自技高网...
语音识别方法及装置、存储介质、电子设备

【技术保护点】
一种语音识别方法,其特征在于,所述方法包括:获取当前用户的语音数据,从所述语音数据中提取声学特征;基于所述声学特征、所述当前用户具有的语音属性、以及每个语音属性具有的细分维度,获得所述语音数据在各语音属性中每个维度的分布情况,所述语音属性的数目N≥1,所述维度的数目M≥2;基于所述分布情况,从所述当前用户具有的个性化维度组合中,选取出K个个性化维度组合,所述个性化维度组合包括至少一个不同语音属性具有的维度,且每个个性化维度组合对应表示所述当前用户所处的一个对话场景,K≥1;利用所述K个个性化维度组合对应的语音识别模型,对所述语音数据进行语音识别。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取当前用户的语音数据,从所述语音数据中提取声学特征;基于所述声学特征、所述当前用户具有的语音属性、以及每个语音属性具有的细分维度,获得所述语音数据在各语音属性中每个维度的分布情况,所述语音属性的数目N≥1,所述维度的数目M≥2;基于所述分布情况,从所述当前用户具有的个性化维度组合中,选取出K个个性化维度组合,所述个性化维度组合包括至少一个不同语音属性具有的维度,且每个个性化维度组合对应表示所述当前用户所处的一个对话场景,K≥1;利用所述K个个性化维度组合对应的语音识别模型,对所述语音数据进行语音识别。2.根据权利要求1所述的方法,其特征在于,所述语音属性为对话环境、对话情绪、对话对象、对话主题中的至少一项。3.根据权利要求1所述的方法,其特征在于,获得所述当前用户具有的语音属性的方式为:获取所述当前用户的历史语音数据,根据语音数据量与语音属性数量之间的对应关系,确定所述历史语音数据的数量对应的语音属性的数目N;基于所述历史语音数据,对语音属性总类中所有的语音属性,按照确定性高低进行排序,所述语音属性的确定性为,所述历史语音数据属于该语音属性中每个维度的概率的熵;将所述排序中确定性最低的N个语音属性,选取为所述当前用户具有的语音属性。4.根据权利要求1所述的方法,其特征在于,预先利用所述当前用户的历史语音数据、N个语音属性、以及每个语音属性具有的细分维度,获得所述声学特征与所述分布情况之间的映射关系,则所述获得所述语音数据在各语音属性中每个维度的分布情况,包括:基于所述声学特征和所述映射关系,得到所述分布情况。5.根据权利要求4所述的方法,其特征在于,所述映射关系体现为分别针对各语音属性构建的属性判别模型,构建所述属性判别模型的方式为:从所述历史语音数据中提取声学特征,并确定所述属性判别模型的拓扑结构;利用从所述历史语音数据中提取的声学特征和所述拓扑结构,训练得到所述属性判别模型。6.根据权利要求1所述的方法,其特征在于,获得所述当前用户具有的个性化维度组合的方式为:基于各语音属性对应的分布情况的判别准确率,设置N个语音属性之间的层级关系,得到个性化确定模型,其中,各层级语音属性具有的维度,作为所述个性化确定模型中的节点;每个节点对应一个从根节点到当前节点的个性化维度组合,得到所述当前用户具有的个性化维度组合。7.根据权利要求1所述的方法,其特征在于,在进行语音识别之前,所述方法还包括:获取所述当前用户的历史语音数据,并从中确定出每个个性化维度组合对应的历史语音数据;基于所述个性化维度组合对应的历史语音数据,构建该个性化维度组合对应的语音识别模型。8.根据权利要求7所述的方法,其特征在于,当个性化维度组合对应的历史语音数据不足时,所述基于所述个性化维度组合对应的历史语音数据,构建该个性化维度组合对应的语音识别模型,包括:通过所述历史语音数据,提取所述当前用户的习惯特性;根据所述习惯特性,从其他用户中确定出与所述当前用户最相近的用户;将所述最相近的用户的个性化维度组合对应的历史语音数据,作为所述当前用户的个性化维度组合对应的历史语音数据,构建该个性化维度组合对应的语音识别模型。9.一种语音识别装置,其特征在于,所述装置包括:声学特征提取模块,用于获取当前用户的语音数据,从所述语音数据中提取声学特征;分布情况获得模块,用于基于所述声...

【专利技术属性】
技术研发人员:潘嘉刘聪胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1