离线语音识别方法、系统、介质及电子设备技术方案

技术编号:35088566 阅读:22 留言:0更新日期:2022-10-01 16:43
本发明专利技术提供一种离线语音识别方法、系统、介质及电子设备;所述方法包括以下步骤:获取当前工作环境对应的实时数据;根据所述实时数据设置所述电子设备上预设词条对应的阈值;获取语音数据,并基于所述阈值,识别所述语音数据;本发明专利技术通过获取电子设备于当前工作环境下对应的实时数据,可以实现跟随该电子设备所工作环境的不同,动态调整预设词条对应阈值的大小,从而增加语音识别准确度,使该电子设备在不同工作环境下均可以准确识别并执行用户的命令,大大提高了该离线语音识别方法的可用场合。合。合。

【技术实现步骤摘要】
离线语音识别方法、系统、介质及电子设备


[0001]本专利技术属于语音控制
,特别是涉及一种离线语音识别方法、系统、介质及电子设备。

技术介绍

[0002]目前语音控制已经广泛应用在日常生活中常见的各种电子设备上,比如,手机,车机,智能音箱等;语音识别是语音控制技术的核心,语音识别的性能和精度高,语音控制才能正确快速的完成用户希望的动作,而离线识别,是在不需要联网的情况下使用的语音识别技术,相对于在线识别和控制,反应更快,在某些场景下,比在线识别更具有优势。
[0003]目前的离线语音识别,基本实现方法是在离线语音识别引擎内预先注册一些常用词条,比如打开音乐,打开电话等,并且对每个词条设置一个阈值以及对应的动作,用户每次说一句话,离线语音引擎会根据识别算法计算出一个置信值,如果该值低于预设的阈值,则认为用户说的就是该词条,从而命中词条并执行对应的动作;然而,目前的离线语音识别都是对预设的词条设置固定的阈值,无论在任何环境都是不变的阈值,在动态环境和噪声环境下,识别效果比较差,识别率低,导致无法及时执行用户的命令。

技术实现思路

[0004]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种离线语音识别方法、系统、介质及电子设备,用于解决现有离线语音识别技术由于预设词条对应的阈值固定不变,导致在某些环境下,存在的语音识别率低的问题。
[0005]本专利技术的另一目的在于提供一种离线语音识别方法、系统、介质及电子设备,通过获取电子设备于当前工作环境下对应的实时数据,可以实现跟随该电子设备所工作环境的不同,动态调整预设词条对应阈值的大小,从而增加语音识别准确度,使该电子设备在不同工作环境下均可以准确识别并执行用户的命令,大大提高了该离线语音识别方法的可用场合。
[0006]本专利技术的又一目的在于提供一种离线语音识别方法、系统、介质及电子设备,通过获取实时行车速度,根据实时行车速度动态调整预设词条对应的阈值,车速越快,阈值调整的相对更高一些,从而增大识别命中率。
[0007]本专利技术的再一目的在于提供一种离线语音识别方法、系统、介质及电子设备,通过获取环境噪声的分贝值,然后根据分贝值的高低动态调整预设词条对应的阈值,分贝值越大,阈值调整的也相对高,从而增大噪声环境下的识别命中率。
[0008]为实现上述目的及其他相关目的,一方面,本专利技术提供一种离线语音识别方法,应用于电子设备,包括以下步骤:获取当前工作环境对应的实时数据;根据所述实时数据设置所述电子设备上预设词条对应的阈值;获取语音数据,并基于所述阈值,识别所述语音数据。
[0009]为实现上述目的及其他相关目的,另一方面,本专利技术提供一种存储介质,其上存储
有计算机程序,该计算机程序被处理器执行时实现上述的离线语音识别方法。
[0010]为实现上述目的及其他相关目的,又一方面,本专利技术提供一种电子设备,包括:处理器、存储器及语音采集模块;所述语音采集模块与所述处理器连接,用于采集语音数据,并将所述语音数据发送至所述处理器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行上述的离线语音识别方法。
[0011]为实现上述目的及其他相关目的,再一方面,本专利技术提供一种离线语音识别系统,包括:上述的电子设备。
附图说明
[0012]图1显示为本专利技术的离线语音识别方法于一实施例中的应用场景架构图。
[0013]图2显示为本专利技术的离线语音识别方法于一实施例中的流程图。
[0014]图3显示为本专利技术的根据实时数据设置电子设备上预设词条对应的阈值于一实施例中的流程图。
[0015]图4显示为本专利技术的获取语音数据,并基于所述阈值,识别语音数据于一实施例中的流程图。
[0016]图5显示为本专利技术的电子设备于一实施例中的结构示意图。
[0017]图6显示为本专利技术的离线语音识别系统于一实施例中的结构示意图。
[0018]标号说明
[0019]11
ꢀꢀꢀꢀꢀꢀꢀꢀ
车载终端
[0020]12
ꢀꢀꢀꢀꢀꢀꢀꢀ
声音传感器
[0021]13
ꢀꢀꢀꢀꢀꢀꢀꢀ
车载音频设备
[0022]51
ꢀꢀꢀꢀꢀꢀꢀꢀ
处理器
[0023]52
ꢀꢀꢀꢀꢀꢀꢀꢀ
存储器
[0024]53
ꢀꢀꢀꢀꢀꢀꢀꢀ
语音采集模块
[0025]61
ꢀꢀꢀꢀꢀꢀꢀꢀ
电子设备
[0026]62
ꢀꢀꢀꢀꢀꢀꢀꢀ
采集设备
[0027]S1~S4
ꢀꢀꢀꢀ
步骤
[0028]S31~S33
ꢀꢀ
步骤
[0029]S41~S43
ꢀꢀ
步骤
具体实施方式
[0030]以下通过特定的具体实施例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0031]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图示中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也
可能更为复杂。
[0032]本专利技术的离线语音识别方法、系统、介质及电子设备,通过获取电子设备于当前工作环境下对应的实时数据,可以实现跟随该电子设备所工作环境的不同,动态调整预设词条对应阈值的大小,从而增加语音识别准确度,使该电子设备在不同工作环境下均可以准确识别并执行用户的命令,大大提高了该离线语音识别方法的可用场合;通过获取实时行车速度,根据实时行车速度动态调整预设词条对应的阈值,车速越快,阈值调整的相对更高一些,从而增大识别命中率;通过获取环境噪声的分贝值,然后根据分贝值的高低动态调整预设词条对应的阈值,分贝值越大,阈值调整的也相对高,从而增大噪声环境下的识别命中率。
[0033]如图1所示,于一实施例中,将本专利技术的离线语音识别方法应用于图1中的车载终端11。
[0034]需要说明的是,该车载终端11具备语音助手的功能,且该车载终端11上具有一车载信息娱乐系统,以实现在该车载终端11上运行。
[0035]具体地,该离线语音识别方法的工作原理如下:
[0036]事先,在图1中的车载终端11上注册一些词条,比如,打开音乐、打开车窗等,该车载终端11针对每一个词条,会设置一阈值及设置每一词条对应的动作(诸如,词条“打开音乐”对应的动作即为打开图1中的车载音频设备13;词条“打开车窗”对应的动作即为打开车窗),并存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种离线语音识别方法,应用于电子设备,其特征在于,包括以下步骤:获取当前工作环境对应的实时数据;根据所述实时数据设置所述电子设备上预设词条对应的阈值;获取语音数据,并基于所述阈值,识别所述语音数据。2.根据权利要求1所述的方法,所述实时数据至少包括实时行车速度和实时噪声分贝值中的一种。3.根据权利要求2所述的方法,根据所述实时数据设置所述电子设备上预设词条对应的阈值包括以下步骤:对行车速度和噪声分贝值进行分级;分别判断所述实时行车速度和所述实时噪声分贝值所处级别;根据所述实时行车速度所处级别和/或所述实时噪声分贝值所处级别,计算所述预设词条对应的阈值,并存储所述阈值。4.根据权利要求1所述的方法,获取语音数据,并基于所述阈值,识别所述语音数据包括以下步骤:基于所述语音数据,计算置信值;判断所述置信值与所述阈值之间是否满足预设关系;若满足所述预设关系,则认为在所述语音数据中识别到预设词条。5.根据权利要求4所述的方法,还包括以下步骤:在所述语音数据中识别到预设词条后,执行所述预设词条对应的动作。6.根据权利要求4所述的方法,基于所述语音数据,计算置信值包括以下步骤:对所述语音数据进行分帧处理,获取语音帧;提取每一所述语音帧的MFCC特征向量;遍历所有的语音帧,对于每一所述语音帧,根据所述MFCC特征向量计算所述语音帧的似然概率p(x
t
/s
j
),所述似然概率的负对数的计算公式为:其中,x
t
表示所述语音帧的特征向量;μ
j

【专利技术属性】
技术研发人员:周力为
申请(专利权)人:上海博泰悦臻网络技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1