语音唤醒方法及装置制造方法及图纸

技术编号：20223156 阅读：26 留言：0更新日期：2019-01-28 21:16

本发明专利技术实施例提供一种语音唤醒方法及装置，属于语音识别技术领域。该方法包括：获取语音数据中唤醒词的声学特征；将声学特征输入至唤醒判定网络，输出唤醒判定结果，唤醒判定结果用于指示是否唤醒成功，唤醒判定网络是基于样本声学特征训练得到的，唤醒判定网络用于对唤醒词进行置信度判定。本发明专利技术实施例通过获取语音数据中唤醒词的声学特征。将声学特征输入至唤醒判定网络，输出唤醒判定结果，唤醒判定结果用于指示是否唤醒成功。由于在用户自定义的任何唤醒词下，均可通过唤醒判定网络进行唤醒判定，而不用依赖于固定的预设阈值，从而可提高唤醒成功率，唤醒过程适用的场景更加广泛。

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法及装置
本专利技术实施例涉及语音识别
，尤其涉及一种语音唤醒方法及装置。
技术介绍
随着智能家居的发展，语音唤醒功能越来越普及。语音唤醒主要是通过理解用户的语音数据，以唤醒智能终端。目前在实现语音唤醒时，通常是根据唤醒词识别过程中分别对应的唤醒词路径和filler路径的声学似然度；若声学似然比大于固定的预设阈值，则确认唤醒词的识别结果可信，并成功唤醒智能终端。由于预设阈值是固定的，若唤醒口令发生了变化，则预设阈值可能不能适用于当前唤醒语的判定过程，从而降低唤醒成功率。
技术实现思路
为了解决上述问题，本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的语音唤醒方法及装置。根据本专利技术实施例的第一方面，提供了一种语音唤醒方法，包括：获取语音数据中唤醒词的声学特征；将声学特征输入至唤醒判定网络，输出唤醒判定结果，唤醒判定结果用于指示是否唤醒成功，唤醒判定网络是基于样本声学特征训练得到的，唤醒判定网络用于对唤醒词进行置信度判定。本专利技术实施例提供的方法，通过获取语音数据中唤醒词的声学特征。将声学特征输入至唤醒判定网络，输出唤醒判定结果，唤醒判定结果用于指示是否唤醒成功。由于在用户自定义的任何唤醒词下，均可通过唤醒判定网络进行唤醒判定，而不用依赖于固定的预设阈值，从而可提高唤醒成功率，唤醒过程适用的场景更加广泛。根据本专利技术实施例的第二方面，提供了一种语音唤醒装置，包括：获取模块，用于获取语音数据中唤醒词的声学特征；输出模块，用于将声学特征输入至唤醒判定网络，输出唤醒判定结果，唤醒判定结果用于指示是否唤醒成功，唤醒判定网络是基于样本...

【技术保护点】
1.一种语音唤醒方法，其特征在于，包括：获取语音数据中唤醒词的声学特征；将所述声学特征输入至唤醒判定网络，输出唤醒判定结果，所述唤醒判定结果用于指示是否唤醒成功，所述唤醒判定网络是基于样本声学特征训练得到的，所述唤醒判定网络用于对所述唤醒词进行置信度判定。

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，包括：获取语音数据中唤醒词的声学特征；将所述声学特征输入至唤醒判定网络，输出唤醒判定结果，所述唤醒判定结果用于指示是否唤醒成功，所述唤醒判定网络是基于样本声学特征训练得到的，所述唤醒判定网络用于对所述唤醒词进行置信度判定。2.根据权利要求1所述的方法，其特征在于，所述声学特征包括以下五种信息中的至少任意一种，所述以下五种信息分别为所述唤醒词中子词的唤醒词得分、所述唤醒词中子词的非唤醒词得分、所述唤醒词中子词对应的帧数、所述唤醒词中子词对应声学特征的得分分布及所述唤醒词中子词的嵌入特征。3.根据权利要求2所述的方法，其特征在于，所述声学特征包括所述唤醒词中子词对应声学特征的得分分布；相应地，所述将所述声学特征输入至唤醒判定网络，输出唤醒判定结果之前，还包括：对于所述唤醒词中的任一子词，确定所述任一子词对应的声学特征从属于每一示例音素的概率值，并作为所述任一子词对应声学特征的得分分布。4.根据权利要求3所述的方法，其特征在于，所述确定所述任一子词对应的声学特征从属于每一示例音素的概率值，包括：计算所述任一子词中每一帧声学特征从属于每一示例音素的概率值，得到每一帧对应的概率值序列；根据所述任一子词包含的总帧数，对每一帧对应的概率值序列进行规整，得到所述任一子词对应的声学特征从属于每一示例音素的概率值。5.根据权利要求2至4中任一项所述的方法，其特征在于，所述子词为...

【专利技术属性】
技术研发人员：吴国兵，潘嘉，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人