一种语音识别方法、处理器、系统、计算机设备和可读存储介质技术方案

技术编号:25525474 阅读:19 留言:0更新日期:2020-09-04 17:14
本发明专利技术提供一种语音识别方法、处理器、系统、计算机设备及计算机可读存储介质,其中,该方法包括:接收并解析用户输入的第一语音信号,确定所述第一语音信号预期要执行的第一动作或所述第一动作操作的第一对象;获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景;根据所述第一语音信号和所述第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象,并发送控制指令,所述控制指令控制对所述第一对象执行所述第一动作。该方法能在用户语义不完整的情况下,实现用户语音的识别。

【技术实现步骤摘要】
一种语音识别方法、处理器、系统、计算机设备和可读存储介质
本专利技术涉及语音识别
,具体而言,主要涉及一种语音识别方法、处理器、系统、计算机设备和可读存储介质。
技术介绍
目前现有的语音识别分析处理场景只能针对语音意图确定的指令识别,比如打开客厅的灯,对于语音意图不是很明确的指令,其往往难以识别。比如,客户的指令为打开或调亮等语义简短分歧的场景则无法处理。目前,急需要提出一种语义分析系统,以解决现有技术中的这种缺陷。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供一种语音识别方法、系统、计算机设备和可读存储介质,以解决现有技术中语音意图不明确而难以识别的问题。为了实现上述目的,采用如下的技术方案:本专利技术第一方面提供一种语音识别方法,包括:接收并解析用户输入的第一语音信号,确定所述第一语音信号预期要执行的第一动作或所述第一动作操作的第一对象;获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景;根据所述第一语音信号和所述第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象,并发送控制指令,所述控制指令用于控制对所述第一对象执行所述第一动作。在一具体实施方式中,所述获取接收所述第一语音信号之前的设定时间内的用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景具体包括:获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,所述第二语音信号包括预期要执行的第二动作和所述第二动作操作的第二对象;根据所述第二动作和所述第二对象确定所述用户在输入所述第二语音信号时所处的第二场景;将所述第二场景确定为所述第一场景。在一具体实施方式中,所述获取接收所述第一语音信号之前的设定时间内的用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景具体包括:获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,所述第二语音信号仅包括预期要执行的第二动作或仅包括预期要执行的第二动作操作的第二对象;根据所述第二操作动作确定所述用户当前所处的第二场景,或根据所述第二对象确定所述用户当前所处的第二场景;将所述第二场景确定为所述第一场景。在一具体实施方式中,所述根据所述第一语音信号和所述当前所处的第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象具体包括:若所述第一语音信号中仅包括所述第一动作,则从已建立的用户场景数据栈中获取所述第一场景中的所述第一动作的操作对象及所述操作对象被执行的第一概率;根据所述第一概率确定所述操作对象的优先级;对优先级最高的所述操作对象执行所述第一操作。在一具体实施方式中,所述根据所述第一语音信号和所述当前所处的第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象具体包括:若所述第一语音信号中仅包括所述第一对象,则从已建立的用户场景数据栈中获取所述第一场景中的与所述第一对象匹配的操作动作和所述操作动作被执行的第二概率;根据所述第二概率确定与所述第一对象匹配的操作动作的优先级;对所述第一对象执行优先级最高的所述操作动作。在一具体实施方式中,所述建立用户场景数据栈具体包括:获取用户输入的历史语音信息,对所述历史语音信息进行解析,获得用户输入历史语音信息所处的第三场景、所述历史语音信息预期要执行的第三动作和所述第三动作操作的第三对象;保存所述第三场景、第三动作以及第三对象及其三者之间的对应关系,形成所述用户场景数据栈。本专利技术第二方面提供一种语音识别处理器,所述处理器包括:接收识别单元,用于接收并识别用户输入的第一语音信号,所述第一语音信号包括预期要执行的第一动作或所述第一动作操作的第一对象;第一场景确定单元,用于获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景;第一动作和第一对象确定单元,用于根据所述第一语音信号和所述第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象,并发送控制指令,所述控制指令控制对所述第一对象执行所述第一动作。在一具体实施方式中,所述第一场景确定单元具体用于:获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,所述第二语音信号包括预期要执行的第二动作和所述第二动作操作的第二对象;根据所述第二动作和所述第二对象确定所述用户在输入所述第二语音信号时所处的第二场景;将所述第二场景确定为所述第一场景。在一具体实施方式中,所述第一场景确定单元具体用于:获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,所述第二语音信号仅包括预期要执行的第二动作或仅包括预期要执行的第二动作操作的第二对象;根据所述第二操作动作确定所述用户当前所处的第二场景,或根据所述第二对象确定所述用户当前所处的第二场景;将所述第二场景确定为所述第一场景。在一具体实施方式中,所述第一动作和第一对象确定单元具体用于:若所述第一语音信号中仅包括所述第一动作,则从已建立的用户场景数据栈中获取所述第一场景中的所述第一动作的操作对象及所述操作对象被执行的第一概率;根据所述第一概率确定所述操作对象的优先级;对优先级最高的所述操作对象执行所述第一操作。在一具体实施方式中,所述第一动作和第一对象确定单元具体用于:若所述第一语音信号中仅包括所述第一对象,则从已建立的用户场景数据栈中获取所述第一场景中的与所述第一对象匹配的操作动作和所述操作动作被执行的第二概率;根据所述第二概率确定与所述第一对象匹配的操作动作的优先级;对所述第一对象执行优先级最高的所述操作动作。在一具体实施方式中,所述系统还包括:获取用户输入的历史语音信息,对所述历史语音信息进行解析,获得用户输入历史语音信息所处的第三场景、所述历史语音信息预期要执行的第三动作和所述第三动作操作的第三对象;保存所述第三场景、第三动作以及第三对象及其三者之间的对应关系,形成所述用户场景数据栈。本专利技术第三方面提供一种语音识别处理系统,包括拾音设备、执行设备和前述的处理器,其中,所述拾音设备用于采集用户输入的第一语音信号,并将所述第一语音信号发送给所述处理器;所述执行设备用于接收所述控制指令,并对所述第一对象执行所述第一动作。本专利技术第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被计算机设备执行时实现前述的方法步骤。本专利技术第五方面提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序以使所述计算机设备执行所述的方法的步本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n接收并解析用户输入的第一语音信号,确定所述第一语音信号预期要执行的第一动作或所述第一动作操作的第一对象;/n获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景;/n根据所述第一语音信号和所述第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象,并发送控制指令,所述控制指令用于控制对所述第一对象执行所述第一动作。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
接收并解析用户输入的第一语音信号,确定所述第一语音信号预期要执行的第一动作或所述第一动作操作的第一对象;
获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景;
根据所述第一语音信号和所述第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象,并发送控制指令,所述控制指令用于控制对所述第一对象执行所述第一动作。


2.根据权利要求1所述的方法,其特征在于,所述获取接收所述第一语音信号之前的设定时间内的用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景具体包括:
获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,所述第二语音信号包括预期要执行的第二动作和所述第二动作操作的第二对象;
根据所述第二动作和所述第二对象确定所述用户在输入所述第二语音信号时所处的第二场景;
将所述第二场景确定为所述第一场景。


3.根据权利要求1所述的方法,其特征在于,所述获取接收所述第一语音信号之前的设定时间内的用户输入的第二语音信号,根据所述第二语音信号确定所述用户当前所处的第一场景具体包括:
获取接收所述第一语音信号之前的设定时间内用户输入的第二语音信号,所述第二语音信号仅包括预期要执行的第二动作或仅包括预期要执行的第二动作操作的第二对象;
根据所述第二操作动作确定所述用户当前所处的第二场景,或根据所述第二对象确定所述用户当前所处的第二场景;
将所述第二场景确定为所述第一场景。


4.根据权利要求2或3所述的方法,其特征在于,所述根据所述第一语音信号和所述当前所处的第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象具体包括:
若所述第一语音信号中仅包括所述第一动作,则从已建立的用户场景数据栈中获取所述第一场景中的所述第一动作的操作对象及所述操作对象被执行的第一概率;
根据所述第一概率确定所述操作对象的优先级;
对优先级最高的所述操作对象执行所述第一操作。


5.根据权利要求2或3所述的方法,其特征在于,所述根据所述第一语音信号和所述当前所处的第一场景确定所述第一语音信号中预期要执行的第一动作和所述第一动作操作的第一对象具体包括:
若所述第一语音信号中仅包括所述第一对象,则从已建立的用户场景数据栈中获取所述第一场景中的与所述第一对象匹配的操作动作和所述操作动作被执行的第二概率;
根据所述第二概率确定与所述第一对象匹配的操作动作的优先级;
对所述第一对象执行优先级最高的所述操作动作。


6.根据权利要求4或5所述的方法,其特征在于,所述建立用户场景数据栈具体包括:
获取用户输入的历史语音信息,对所述历史语音信息进行解析,获得用户输入历史语音信息所处的第三场景、所述历史语音信息预期要执行的第三动作和所述第三动作操作的第三对象;
保存所述第三场景、第三动作以及第三对象及其三者之间的对应关系,形成所述用户场景数据栈。


7.一种语音识别处理器,其特征在于,所述处理器包括:
接收识别单元,用于接收并识别用户输入的第一语音信号,确定所述第一语音信号预期要执行的第一动作或所述第一动作操作的第一...

【专利技术属性】
技术研发人员:葛友杰
申请(专利权)人:星络智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1