离线语音识别方法、系统、介质及电子设备技术方案

技术编号：35088566 阅读：22 留言：0更新日期：2022-10-01 16:43

本发明专利技术提供一种离线语音识别方法、系统、介质及电子设备；所述方法包括以下步骤：获取当前工作环境对应的实时数据；根据所述实时数据设置所述电子设备上预设词条对应的阈值；获取语音数据，并基于所述阈值，识别所述语音数据；本发明专利技术通过获取电子设备于当前工作环境下对应的实时数据，可以实现跟随该电子设备所工作环境的不同，动态调整预设词条对应阈值的大小，从而增加语音识别准确度，使该电子设备在不同工作环境下均可以准确识别并执行用户的命令，大大提高了该离线语音识别方法的可用场合。合。合。

全部详细技术资料下载

【技术实现步骤摘要】
离线语音识别方法、系统、介质及电子设备

[0001]本专利技术属于语音控制
，特别是涉及一种离线语音识别方法、系统、介质及电子设备。

技术介绍

[0002]目前语音控制已经广泛应用在日常生活中常见的各种电子设备上，比如，手机，车机，智能音箱等；语音识别是语音控制技术的核心，语音识别的性能和精度高，语音控制才能正确快速的完成用户希望的动作，而离线识别，是在不需要联网的情况下使用的语音识别技术，相对于在线识别和控制，反应更快，在某些场景下，比在线识别更具有优势。
[0003]目前的离线语音识别，基本实现方法是在离线语音识别引擎内预先注册一些常用词条，比如打开音乐，打开电话等，并且对每个词条设置一个阈值以及对应的动作，用户每次说一句话，离线语音引擎会根据识别算法计算出一个置信值，如果该值低于预设的阈值，则认为用户说的就是该词条，从而命中词条并执行对应的动作；然而，目前的离线语音识别都是对预设的词条设置固定的阈值，无论在任何环境都是不变的阈值，在动态环境和噪声环境下，识别效果比较差，识别率低，导致无法及时执行用户的命令。

技术实现思路

[0004]鉴于以上所述现有技术的缺点，本专利技术的目的在于提供一种离线语音识别方法、系统、介质及电子设备，用于解决现有离线语音识别技术由于预设词条对应的阈值固定不变，导致在某些环境下，存在的语音识别率低的问题。
[0005]本专利技术的另一目的在于提供一种离线语音识别方法、系统、介质及电子设备，通过获取电子设备于当前工作环境下对应的实时数据，可以实现跟随...

【技术保护点】

【技术特征摘要】
1.一种离线语音识别方法，应用于电子设备，其特征在于，包括以下步骤：获取当前工作环境对应的实时数据；根据所述实时数据设置所述电子设备上预设词条对应的阈值；获取语音数据，并基于所述阈值，识别所述语音数据。2.根据权利要求1所述的方法，所述实时数据至少包括实时行车速度和实时噪声分贝值中的一种。3.根据权利要求2所述的方法，根据所述实时数据设置所述电子设备上预设词条对应的阈值包括以下步骤：对行车速度和噪声分贝值进行分级；分别判断所述实时行车速度和所述实时噪声分贝值所处级别；根据所述实时行车速度所处级别和/或所述实时噪声分贝值所处级别，计算所述预设词条对应的阈值，并存储所述阈值。4.根据权利要求1所述的方法，获取语音数据，并基于所述阈值，识别所述语音数据包括以下步骤：基于所述语音数据，计算置信值；判断所述置信值与所述阈值之间是否满足预设关系；若满足所述预设关系，则认为在所述语音数据中识别到预设词条。5.根据权利要求4所述的方法，还包括以下步骤：在所述语音数据中识别到预设词条后，执行所述预设词条对应的动作。6.根据权利要求4所述的方法，基于所述语音数据，计算置信值包括以下步骤：对所述语音数据进行分帧处理，获取语音帧；提取每一所述语音帧的MFCC特征向量；遍历所有的语音帧，对于每一所述语音帧，根据所述MFCC特征向量计算所述语音帧的似然概率p(x
t
/s
j
)，所述似然概率的负对数的计算公式为：其中，x
t
表示所述语音帧的特征向量；μ
j

【专利技术属性】
技术研发人员：周力为，
申请(专利权)人：上海博泰悦臻网络技术服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人