语音识别方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号：22975811 阅读：34 留言：0更新日期：2019-12-31 23:50

本公开公开了一种语音识别方法，其特征在于，包括：接收输入语音信号；确定所述输入语音信号的语谱图；从所述语谱图中提取M个备选区域，M为正整数；确定所述M个备选区域的特征向量；根据所述M个备选区域的特征向量识别所述输入语音信号。本公开实施例提供的语音识别方法、装置、电子设备和计算机可读存储介质，能够从输入语音信号的语谱图中确定备选区域，并根据备选区域对所述输入语音信号进行识别，不仅性能优异，还能够识别出所述输入语音信号的有效区域。

Speech recognition method, device, electronic equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备和计算机可读存储介质
本公开涉及信息处理领域，尤其涉及一种语音识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着语音识别技术的进步，与语音识别相关的应用愈发丰富，例如智能音箱设备可以根据用户的语音与用户进行交互，还可以接入互联网作为各种应用的接口。智能音箱需要基于语音识别技术被唤醒(keywordspotting，KWS)和/或识别用户的各种语音命令。现有的语音识别技术经历了多次迭代，例如包括模板匹配的方法，将输入语音和模板语音的特征进行对比，基于对比结果确定是否唤醒或识别，还例如采用隐式马尔科夫模型-高斯混合模型(HMM-GMM)模型将输入语音识别为关键词类或非关键词类后来确定是否唤醒或识别。但是现有的语音识别方式对于输入的复杂语音，其性能比较常规，并且无法识别输入语音的有效区域。
技术实现思路
本公开实施例提供语音识别方法，装置，电子设备，和计算机可读存储介质，能够从输入语音信号的语谱图中确定备选区域，并根据备选区域对所述输入语音信号进行识别，不仅性能优异，还能够识别出所述输入语音信号的有效区域。第一方面，本公开实施例提供一种语音识别方法，其特征在于，包括：接收输入语音信号；确定所述输入语音信号的语谱图；从所述语谱图中提取M个备选区域，M为正整数；确定所述M个备选区域的特征向量；根据所述M个备选区域的特征向量识别所述输入语音信号。进一步的，确定所述M个备选区域的特征向量，包括：通过神经网络确定所述M个备选区域的特征向量，所...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n接收输入语音信号；/n确定所述输入语音信号的语谱图；/n从所述语谱图中提取M个备选区域，M为正整数；/n确定所述M个备选区域的特征向量；/n根据所述M个备选区域的特征向量识别所述输入语音信号。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
接收输入语音信号；
确定所述输入语音信号的语谱图；
从所述语谱图中提取M个备选区域，M为正整数；
确定所述M个备选区域的特征向量；
根据所述M个备选区域的特征向量识别所述输入语音信号。

2.根据权利要求1所述的语音识别方法，其特征在于，确定所述M个备选区域的特征向量，包括：
通过神经网络确定所述M个备选区域的特征向量，所述神经网络与目标语音信号对应。

3.根据权利要求2所述的语音识别方法，其特征在于，根据所述M个备选区域的特征向量识别所述输入语音信号，包括：
通过所述神经网络根据所述M个备选区域的特征向量识别所述输入语音信号。

4.根据权利要求2所述的语音识别方法，其特征在于，根据所述M个备选区域的特征向量识别所述输入语音信号，包括：
将所述M个备选区域的特征向量输入支持向量机，以确定所述M个备选区域的目标匹配值，所述支持向量机与所述目标语音信号对应；
根据所述M个备选区域的目标匹配值识别所述输入语音信号。

5.根据权利要求4所述的语音识别方法，其特征在于，根据所述M个备选区域的目标匹配值识别所述语音信号，包括：
确定所述M个备选区域中包括第一备选区域，所述第一备选区域的目标匹配值满足预设条件；
根据所述第一备选区域识别所述语音信号。

6.根据权利要求1所述的语音识别方法，其特征在于，所述M个备选区域与M个起止时间段一一对应；
根据所述M个备选区域的特征向量识别所述输入语音信号，包括：
根据与所述M个备选区域对应的起止时间段和所述M个备选区域的特征向量确定所述输入语音信号中与所述预设语音信号匹配的起止时间段。
<...

【专利技术属性】
技术研发人员：王超，冯大航，陈孝良，常乐，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人