用于设备控制的语音识别方法及相关产品技术

技术编号:39725974 阅读:7 留言:0更新日期:2023-12-17 23:30
本申请实施例公开了一种用于设备控制的语音识别方法及相关产品,所述方法包括:提取待识别语音的语音特征;根据声学模型对所述语音特征进行音素转换处理,得到至少一个第一音素的分类概率;根据音素语言模型和所述至少一个第一音素的分类概率对所述至少一个第一音素进行转换处理,得到第一音素序列;确定与所述第一音素序列匹配的控制命令;按照所述控制命令控制待控制设备

【技术实现步骤摘要】
用于设备控制的语音识别方法及相关产品


[0001]本专利技术涉及设备控制领域,尤其涉及一种用于设备控制的语音识别方法及相关产品


技术介绍

[0002]随着语音识别技术的发展,出现了越来越多的能够由语音控制的设备

其中,命令词和唤醒词等关键词的语音识别成为了对设备进行控制的关键

目前的语音识别过程较为复杂,对设备进行控制的语音识别处理开销较大

时延较长


技术实现思路

[0003]本申请实施例提供一种用于设备控制的语音识别方法及相关产品,可在设备控制场景下简化对待控制设备进行控制的语音识别处理过程

[0004]为了解决上述技术问题,第一方面,本申请实施例提供一种用于设备控制的语音识别方法,所述方法包括:
[0005]提取待识别语音的语音特征;
[0006]根据声学模型对所述语音特征进行音素转换处理,得到至少一个第一音素的分类概率;
[0007]根据音素语言模型和所述至少一个第一音素的分类概率对所述至少一个第一音素进行转换处理,得到第一音素序列;
[0008]确定与所述第一音素序列匹配的控制命令;
[0009]按照所述控制命令控制待控制设备

[0010]第二方面,本申请实施例提供了一种语音识别装置,所述装置包括:
[0011]提取单元,用于提取待识别语音的语音特征;
[0012]转换单元,用于根据声学模型对所述语音特征进行音素转换处理,得到至少一个第一音素的分类概率;
[0013]所述转换单元,还用于根据音素语言模型和所述至少一个第一音素的分类概率对所述至少一个第一音素进行转换处理,得到第一音素序列;
[0014]确定单元,用于确定与所述第一音素序列匹配的控制命令;
[0015]控制单元,用于按照所述控制命令控制待控制设备

[0016]第三方面,本申请实施例提供了一种语音识别设备,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于调用所述程序指令,执行如第一方面所述的方法

[0017]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被计算机执行时,如第一方面所述的方法被执行

[0018]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器,所述处理器执行
如第一方面所述的方法

[0019]第六方面,本申请实施例提供了一种芯片模组,所述芯片模组包括收发组件和芯片,所述收发模组和所述芯片相连,所述芯片包括处理器,所述处理器执行如第一方面所述的方法

[0020]实施本申请实施例,具有如下有益效果:
[0021]本申请可在设备控制场景下,基于音素语言模型进行语音识别,有效地简化对待控制设备进行控制的语音识别处理过程,提升对待控制设备进行控制的效率

附图说明
[0022]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0023]图1为本申请实施例提供的一种可能的应用场景示意图;
[0024]图2为本申请实施例提供的一种可能的用于设备控制的语音识别方法的流程示意图;
[0025]图3为本申请实施例提供的一种可能的语音解码图;
[0026]图4为本申请实施例提供的一种可能的基于音素的语音识别方法的流程示意图;
[0027]图5为本申请实施例提供的一种可能的语音识别装置
500
的功能单元组成框图;
[0028]图6为本申请实施例提供的一种可能的语音识别设备
600
的结构示意图

具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0030]在本文中提及“实施例”意味着,结合实施例描述的特定特征

结构或特性可以包含在本专利技术的至少一个实施例中

在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例

本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合

[0031]本申请的说明书

权利要求书及附图中的术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序

此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含

例如包含了一系列步骤或单元的过程

方法

系统

产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程

方法

产品或设备固有的其它步骤或单元

[0032]在本文中提及“实施例”意味着,结合实施例描述的特定特征

结构或特性可以包含在本申请的至少一个实施例中

在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例

本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合

[0033]在本申请中,“至少一个
(

)”是指一个或者多个,“多个”是指两个或两个以上,“至少两个
(

)”是指两个或三个及三个以上,“和
/
或”,用于描述关联对象的对应关系,表示可以存在三种关系,例如,“A

/

B”可以表示:只存在
A
,只存在
B
以及同时存在
A

B
三种情况,其中
A

B
可以是单数或者复数

字符“/”一般表示前后关联对象是一种“或”的关系
。“以下至少一项
(

)”或其类似表达,是指这些项中的任意组合,包括单项
(

)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于设备控制的语音识别方法,其特征在于,所述方法包括:提取待识别语音的语音特征;根据声学模型对所述语音特征进行音素转换处理,得到至少一个第一音素的分类概率;根据音素语言模型和所述至少一个第一音素的分类概率对所述至少一个第一音素进行转换处理,得到第一音素序列;确定与所述第一音素序列匹配的控制命令;按照所述控制命令控制待控制设备
。2.
如权利要求1所述的方法,其特征在于,所述根据音素语言模型和所述至少一个第一音素的分类概率对所述至少一个第一音素进行转换处理,得到第一音素序列,包括:根据所述音素语言模型对所述至少一个第一音素进行序列转换处理,得到至少一个第二音素序列以及所述至少一个第二音素序列对应的权重,所述至少一个第二音素序列与所述至少一个第二音素序列对应的权重一一对应,所述第二音素序列由至少一个第二音素按照待识别语音的语音时序组成,所述至少一个第一音素包括所述至少一个第二音素;将所述至少一个第二音素序列对应的权重中满足权重条件的权重对应的第二音素序列,确定为所述第一音素序列;其中,所述第二音素序列的权重至少由所述至少一个第二音素的分类概率和所述第二音素序列在所述音素语言模型中的跳转概率叠加得到
。3.
如权利要求1所述的方法,其特征在于,所述根据音素语言模型和所述至少一个第一音素的分类概率对所述至少一个第一音素进行转换处理,得到第一音素序列,包括:根据隐马尔可夫模型

上下文转录机和所述音素语言模型对所述至少一个第一音素进行状态转换,得到至少一个第二音素序列以及所述至少一个第二音素序列对应的权重,所述至少一个第二音素序列与所述至少一个第二音素序列对应的权重一一对应,所述第二音素序列由至少一个第二音素按照待识别语音的语音时序组成,所述至少一个第一音素包括所述至少一个第二音素,所述第一音素的分类概率为用于建立所述隐马尔可夫模型的观察概率;将所述至少一个第二音素序列对应的权重中满足权重条件的权重对应的第二音素序列,确定为所述第一音素序列;其中,所述第二音素序列的权重至少由所述至少一个第二音素的分类概率

所述至少一个第二音素的上下文权重和所述第二音素序列在所述音素语言模型中的跳转概率叠加得到,所述至少一个第二音素的上下文权重由所述上下文转录机提供
。4.
如权利要求3所述的方法,其特征在于,所述根据隐马尔可夫模型

上下文转录机和所述音素语言模型对所述至少一个第一音素进行状态转换,得到至少一个第二音素序列以及所述至少一个第二音素序列对应的权重,包括:根据所述至少...

【专利技术属性】
技术研发人员:姚人天
申请(专利权)人:紫光展锐重庆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1