语音处理方法及装置制造方法及图纸

技术编号:16271416 阅读:22 留言:0更新日期:2017-09-22 22:59
本发明专利技术是关于一种语音处理方法及装置,其中,方法包括:接收终端设备采集的包含用户意图的当前语音信息;对所述当前语音信息进行语音识别,得到第一语音识别结果;对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性;根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作。通过该技术方案,可以保证在语音识别过程中能够理解用户的完整意图,从而满足用户的意图,提升用户的使用体验。

Voice processing method and apparatus

The present invention relates to a voice processing method and device, the method includes: voice information contains the current user intention of receiving terminal equipment acquisition; the current voice information for speech recognition, speech recognition results obtained first; the semantic analysis of the first speech recognition results, and according to the semantic analysis results include determining the first speech recognition results in user intent integrity; according to the integrity of the user intent, to determine whether the operation immediately performs the first speech recognition results corresponding to the. Through the technical scheme, it can guarantee that the whole intention of the user can be understood in the speech recognition process so as to satisfy the user's intention and enhance the user's use experience.

【技术实现步骤摘要】
语音处理方法及装置
本专利技术涉及语音识别
,尤其涉及一种语音处理方法及装置。
技术介绍
相关技术中,在进行语音采集的过程中,客户端会发送结束命令,表示一句话结束,服务器可进行语义理解,返回理解结果。但是客户端判断结束的位置可能不准确,因为如果环境噪声比较大,语音采集有可能停不掉。或者用户在语句中间停顿(可能在思考),如导航到……东单,则语音采集可能在导航到的后面就结束,然后东单作为第二个句子再发送,这样会导致两个句子的语义理解都不完整,从而不能满足用户的意图。
技术实现思路
本专利技术实施例提供一种语音处理方法及装置,用以实现在语音识别过程中能够理解用户的完整意图,从而满足用户的意图,提升用户的使用体验。根据本专利技术实施例的第一方面,提供一种语音处理方法,用于服务器,包括:接收终端设备采集的包含用户意图的当前语音信息;对所述当前语音信息进行语音识别,得到第一语音识别结果;对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性;根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作。在该实施例中,对当前语音信息进行语音识别得到第一语音识别结果,并根据第一语音识别结果中包含的用户意图的完整性确定是否立即执行该语音识别结果对应的处理操作,这样,可以保证在语音识别过程中能够理解用户的完整意图,从而满足用户的意图,提升用户的使用体验。在一个实施例中,所述根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作,包括:当确定所述当前语音信息中包含的用户意图不完整时,立即执行所述第一语音识别结果对应的处理操作,并获取下一个语音信息对应的第二语音识别结果;将所述第一语音识别结果和所述第二语音识别结果进行拼接处理,得到第三语音识别结果;对所述第三语音识别结果进行语义解析,并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性;当所述第三语音识别结果中包含的用户意图完整时,用所述第三语音识别结果修正所述第一语音识别结果,并执行所述第三语音识别结果对应的处理操作;当所述第三语音识别结果中包含的用户意图不完整,则对所述第二语音识别结果进行语义解析。在该实施例中,如果当前语音信息对应的语音识别结果中,包含的用户意图不完整,则可以先立即执行该语音信息对应的处理操作,如返回用户意图给终端设备,然后等待下一个语音信息对应的语音识别结果,将两个语音识别结果结合,如果结合后可以得到完整的用户意图,则执行结合后的语音识别结果对应的处理操作,从而可以保证在语音识别过程中能够理解用户的完整意图,从而满足用户的意图,提升用户的使用体验。在一个实施例中,所述根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作,包括:当确定所述当前语音信息中包含的用户意图不完整时,等待预设时长;确定在所述预设时长内,是否获取到下一个语音信息对应的第二语音识别结果;当确定在所述预设时长内未获取到所述第二语音识别结果时,执行所述第一语音识别结果对应的处理操作;当确定在所述预设时长内获取到所述第二语音识别结果时,将所述第一语音识别结果和所述第二语音识别结果进行拼接处理,得到第三语音识别结果;对所述第三语音识别结果进行语义解析,并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性;当所述第三语音识别结果中包含的用户意图完整时,执行所述第三语音识别结果对应的处理操作;当所述第三语音识别结果中包含的用户意图不完整时,执行所述第一语音识别结果对应的处理操作,并对所述第二语音识别结果进行语义解析。在该实施例中,在确定当前语音信息对应的第一语音识别结果中包含的用户意图不完整时,可以不立即执行该语音识别结果对应的处理操作,而是等待下一个语音识别结果的到来,如果在预设时长内获取到第二语音识别结果,则将两个语音识别结果拼接在一起进行语义解析,如果得到的用户意图完整,则执行拼接后的语音识别结果对应的处理操作,如果得到的用户意图不完整,则执行第一语音识别结果对应的处理操作,并将第二语音识别结果进行单独语义解析。而如果预设时长内未获取到第二语音识别结果,则直接执行第一语音识别结对应的处理操作。这样,可以尽量满足用户的意图,避免因解析一个语音结果造成的用户意图理解错误,提升用户的使用体验。在一个实施例中,所述根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作,还包括:当在所述预设时长后获取到所述第二语音识别结果时,将所述第一语音识别结果和所述第二语音识别结果进行拼接处理,得到第三语音识别结果;对所述第三语音识别结果进行语义解析,并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性;当所述第三语音识别结果中包含的用户意图完整时用所述第三语音识别结果修正所述第一语音识别结果,并执行所述第三语音识别结果对应的处理操作;当所述第三语音识别结果中包含的用户意图不完整时,对所述第二语音识别结果进行语义解析。在该实施例中,在预设时长后收到第二语音识别结果时,也可以将第一语音识别结果和第二语音识别结果拼接到一起进行语义理解,如果得到的用户意图完整,则可以用两者结合后的第三语音识别结果修正第一语音识别结果,从而可以尽量满足用户的意图,避免因解析一个语音结果造成的用户意图理解错误,提升用户的使用体验。在一个实施例中,所述方法还包括:对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的个数;根据所述第一语音识别结果中包含的用户意图的个数对所述第一语音识别结果进行拆分处理,得到多个第四语音识别结果;分别执行每个第四语音识别结果对应的处理操作。在该实施例中,如果一个语音识别结果中包含多个意图,则可以将多个用户意图进行拆分,分别执行各个用户意图,进一步提升用户的使用体验。在一个实施例中,对所述当前语音信息进行语音识别,得到第一语音识别结果,包括:对所述当前语音信息进行语音识别,以生成所述当前语音信息对应的文本信息和静音信息;根据所述文本信息、所述静音信息和所述文本信息中上下文之间的相关性,将所述文本信息划分为有效文本信息和非有效文本信息,其中,所述非有效文本信息包括静音信息和无效文本信息;从所述文本信息中提取出所述有效文本信息,将所述有效文本信息确定为所述第一语音识别结果;丢弃所述非有效文本信息。在该实施例中,对语音信息进行识别,得到文本信息和静音信息,进而将文本信息划分为有效文本信息和非有效文本信息,从而将非有效文本信息丢弃,将有效文本信息作为语音识别结果,这样,使得语音识别结果更准确。根据本专利技术实施例的第二方面,提供一种语音处理装置,包括:接收模块,用于接收终端设备采集的包含用户意图的当前语音信息;识别模块,用于对所述当前语音信息进行语音识别,得到第一语音识别结果;解析模块,用于对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性;第一确定模块,用于根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作。在一个实施例中,所述第一确定模块包括:第一执行子模块,用于当确定所述当前语音信息中包含的用户意图不完整时,立即执行所述本文档来自技高网...
语音处理方法及装置

【技术保护点】
一种语音处理方法,用于服务器,其特征在于,包括:接收终端设备采集的包含用户意图的当前语音信息;对所述当前语音信息进行语音识别,得到第一语音识别结果;对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性;根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作。

【技术特征摘要】
1.一种语音处理方法,用于服务器,其特征在于,包括:接收终端设备采集的包含用户意图的当前语音信息;对所述当前语音信息进行语音识别,得到第一语音识别结果;对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性;根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作。2.根据权利要求1所述的方法,其特征在于,所述根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作,包括:当确定所述当前语音信息中包含的用户意图不完整时,立即执行所述第一语音识别结果对应的处理操作,并获取下一个语音信息对应的第二语音识别结果;将所述第一语音识别结果和所述第二语音识别结果进行拼接处理,得到第三语音识别结果;对所述第三语音识别结果进行语义解析,并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性;当所述第三语音识别结果中包含的用户意图完整时,用所述第三语音识别结果修正所述第一语音识别结果,并执行所述第三语音识别结果对应的处理操作;当所述第三语音识别结果中包含的用户意图不完整,则对所述第二语音识别结果进行语义解析。3.根据权利要求1所述的方法,其特征在于,所述根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作,包括:当确定所述当前语音信息中包含的用户意图不完整时,等待预设时长;确定在所述预设时长内,是否获取到下一个语音信息对应的第二语音识别结果;当确定在所述预设时长内未获取到所述第二语音识别结果时,执行所述第一语音识别结果对应的处理操作;当确定在所述预设时长内获取到所述第二语音识别结果时,将所述第一语音识别结果和所述第二语音识别结果进行拼接处理,得到第三语音识别结果;对所述第三语音识别结果进行语义解析,并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性;当所述第三语音识别结果中包含的用户意图完整时,执行所述第三语音识别结果对应的处理操作;当所述第三语音识别结果中包含的用户意图不完整时,执行所述第一语音识别结果对应的处理操作,并对所述第二语音识别结果进行语义解析。4.根据权利要求3所述的方法,其特征在于,所述根据所述用户意图的完整性,确定是否立即执行所述第一语音识别结果对应的处理操作,还包括:当在所述预设时长后获取到所述第二语音识别结果时,将所述第一语音识别结果和所述第二语音识别结果进行拼接处理,得到第三语音识别结果;对所述第三语音识别结果进行语义解析,并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性;当所述第三语音识别结果中包含的用户意图完整时用所述第三语音识别结果修正所述第一语音识别结果,并执行所述第三语音识别结果对应的处理操作;当所述第三语音识别结果中包含的用户意图不完整时,对所述第二语音识别结果进行语义解析。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述第一语音识别结果进行语义解析,并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的个数;根据所述第一语音识别结果中包含的用户意图的个数对所述第一语音识别结果进行拆分处理,得到多个第四语音识别结果;分别执行每个第四语音识别结果对应的处理操作。6.根据权利要求1所述的方法,其特征在于,对所述当前语音信息进行语音识别,得到第一语音识别结果,包括:对所述当前语音信息进行语音识别,以生成所述当前语音信息对应的文本信息和静音信息;根据所述文本信息、所述静音信息和所述文本信息中上下文之间的相关性,将所述文本信息划分为有效文本信息和非有效文本信息,其中,所述非有效文本信息包括静音信息和无效文本信息;从所述文本信息中提取出所述有效文本信息,将所述有效文本信息确定为所述第一语音识别结果;丢弃所述非有效文本信息。7.一种语音处理装置,用于服务器,其特征在于,包括:接收模块,用于接收终端设备采集的包含用户意图的当前语音信息;识别模块,用于...

【专利技术属性】
技术研发人员:全刚
申请(专利权)人:北京云知声信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1