控制指令确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26532819 阅读:18 留言:0更新日期:2020-12-01 14:17
本申请实施例提供了一种控制指令确定方法、装置、电子设备和存储介质,所述方法包括:接收输入的语音数据;按预设顺序从语音数据中提取音频特征;根据音频特征和预设的有向图,确定所述语音数据对应的目标控制指令;有向图由多个候选词节点按照预设先后顺序构建。本申请在应用于终端设备的情况下,能够实现在降低终端设备的资源消耗的情况下,降低识别控制指令的耗时。并且由于有向图的逻辑性,本申请无需直接将音频数据整体与长句进行匹配,而能够拆分成词语按序进行匹配,能够避免因为语音识别本身的错误率随着语句的长度增长增多而增大,提高识别控制指令的准确率。

【技术实现步骤摘要】
控制指令确定方法、装置、电子设备和存储介质
本申请涉及计算机
,特别是涉及一种控制指令确定方法和装置、一种电子设备和一种存储介质。
技术介绍
在互联网市场中,通过语音交互实现人机交互的设备已经非常普及,如目前的一些通过语音进行控制的家电:音控台灯、音控冰箱等。目前,通过语音交互实现人机交互的设备,通常可以接收用户发出的语音数据,并在确定了语音数据对应的控制指令后,执行该控制指令。具体的,语音人机交互设备的控制指令确定方式通常有两种。方案一,语音人机交互设备在收到语音数据后,通过与互联网的网络连接,将语音数据上传至云端服务器,由云端服务器根据NLU等复杂的语义识别算法实现对语音数据进行语义分析,从而确定得到语音数据对应的控制指令。方案二,语音人机交互设备在收到语音数据后,将整个语音数据与预设的固定语义模板进行正则匹配,获取控制指令。但是,专利技术人在研究过程中发现,目前方案中,方案一,由于语义识别算法复杂,其依赖功能强大的云端服务器,存在较长多的数据传输过程,依赖于网络环境,导致控制指令的确定过程耗时较长,且由于复杂的语义识本文档来自技高网...

【技术保护点】
1.一种控制指令确定方法,其特征在于,所述的方法包括:/n接收输入的语音数据;/n按预设顺序从所述语音数据中提取音频特征;/n根据所述音频特征和预设的有向图,确定所述语音数据对应的目标控制指令;所述有向图由多个候选词节点按照预设先后顺序构建。/n

【技术特征摘要】
1.一种控制指令确定方法,其特征在于,所述的方法包括:
接收输入的语音数据;
按预设顺序从所述语音数据中提取音频特征;
根据所述音频特征和预设的有向图,确定所述语音数据对应的目标控制指令;所述有向图由多个候选词节点按照预设先后顺序构建。


2.根据权利要求1所述的方法,其特征在于,所述根据所述音频特征和预设的有向图,确定所述语音数据对应的目标控制指令的步骤,包括:
根据所述音频特征,从所述有向图中确定目标候选词节点路径;
根据预设的候选词节点路径与控制指令之间的对应关系,确定所述目标候选词节点路径对应的目标控制指令。


3.根据权利要求1所述的方法,其特征在于,所述有向图的候选词节点路径包括多个具有先后顺序的候选词节点,所述候选词节点包括控制指令段;所述根据所述音频特征和预设的有向图,确定所述语音数据对应的目标控制指令的步骤,包括:
根据所述音频特征,从所述有向图中确定目标候选词节点路径;
将所述目标候选词节点路径中的目标候选词节点所包括的目标控制指令段进行拼接,获得所述目标控制指令。


4.根据权利要求2或3所述的方法,其特征在于,所述根据所述音频特征,从所述有向图中确定目标候选词节点路径的步骤,包括:
按所述音频特征的提取顺序,将所述音频特征与所述有向图中的候选词节点路径中的目标层级的候选词节点进行匹配,确定目标候选词节点路径;所述目标层级为与所述提取顺序对应的层级。


5.根据权利要求4所述的方法,其特征在于,所述按所述音频特征的提取顺序,将所述音频特征与所述有向图中的候选词节点路径中的目标层级的候选词节点进行匹配,确定目标候选词节点路径的步骤,包括:
对于任一目标层级的候选词节点,分别确定所述音频特征与所述候选词节点的相似度值;
根据相似度值最高的候选词节点确定所述目标候选词节点路径。


6.根据权利要求4所述的方法,其特征在于,所述按所述音频特征的提取顺序,将所述音频特征与所述有向图中的候选词节点路径中的目标层级的候选词节点进行匹配,确定目标候选词节点路径的步骤,包括:
将所述音频特征与第一待选候选词节点路径中的目标层级的第一候选词节点匹配,确定第二待选候选词节点路径;其中,在所述第一候选词节点为末端节点的情况下,所述第二候选词节点路径为所述目标候选词节点路径;在所述第一候选词节点不为末端节点的情况下,所述第二待选候选词节点路径为下一次匹配的第一待候选词节点路径;所述目标层级为所述第一待选候选词节点路径中最后一个已匹配上的候选词节点的下一层级。


7.根据权利要求4所述的方法,其特征在于,还包括:
确定距离上一次将所述音频数据与所述候选词节点进行匹配的时间长度是否超过预设时间阈值;
如果所述时间长度超过预...

【专利技术属性】
技术研发人员:雷京颢
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1