语音处理方法及装置制造方法及图纸

技术编号：16271416 阅读：22 留言：0更新日期：2017-09-22 22:59

本发明专利技术是关于一种语音处理方法及装置，其中，方法包括：接收终端设备采集的包含用户意图的当前语音信息；对所述当前语音信息进行语音识别，得到第一语音识别结果；对所述第一语音识别结果进行语义解析，并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性；根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作。通过该技术方案，可以保证在语音识别过程中能够理解用户的完整意图，从而满足用户的意图，提升用户的使用体验。

Voice processing method and apparatus

The present invention relates to a voice processing method and device, the method includes: voice information contains the current user intention of receiving terminal equipment acquisition; the current voice information for speech recognition, speech recognition results obtained first; the semantic analysis of the first speech recognition results, and according to the semantic analysis results include determining the first speech recognition results in user intent integrity; according to the integrity of the user intent, to determine whether the operation immediately performs the first speech recognition results corresponding to the. Through the technical scheme, it can guarantee that the whole intention of the user can be understood in the speech recognition process so as to satisfy the user's intention and enhance the user's use experience.

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法及装置
本专利技术涉及语音识别
，尤其涉及一种语音处理方法及装置。
技术介绍
相关技术中，在进行语音采集的过程中，客户端会发送结束命令，表示一句话结束，服务器可进行语义理解，返回理解结果。但是客户端判断结束的位置可能不准确，因为如果环境噪声比较大，语音采集有可能停不掉。或者用户在语句中间停顿(可能在思考)，如导航到……东单，则语音采集可能在导航到的后面就结束，然后东单作为第二个句子再发送，这样会导致两个句子的语义理解都不完整，从而不能满足用户的意图。
技术实现思路
本专利技术实施例提供一种语音处理方法及装置，用以实现在语音识别过程中能够理解用户的完整意图，从而满足用户的意图，提升用户的使用体验。根据本专利技术实施例的第一方面，提供一种语音处理方法，用于服务器，包括：接收终端设备采集的包含用户意图的当前语音信息；对所述当前语音信息进行语音识别，得到第一语音识别结果；对所述第一语音识别结果进行语义解析，并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性；根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作。在该实施例中，对当前语音信息进行语音识别得到第一语音识别结果，并根据第一语音识别结果中包含的用户意图的完整性确定是否立即执行该语音识别结果对应的处理操作，这样，可以保证在语音识别过程中能够理解用户的完整意图，从而满足用户的意图，提升用户的使用体验。在一个实施例中，所述根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作，包括：当确定所述当前语音信息中包含的用户意图不完整时，立即执行...
语音处理方法及装置

【技术保护点】
一种语音处理方法，用于服务器，其特征在于，包括：接收终端设备采集的包含用户意图的当前语音信息；对所述当前语音信息进行语音识别，得到第一语音识别结果；对所述第一语音识别结果进行语义解析，并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性；根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作。

【技术特征摘要】
1.一种语音处理方法，用于服务器，其特征在于，包括：接收终端设备采集的包含用户意图的当前语音信息；对所述当前语音信息进行语音识别，得到第一语音识别结果；对所述第一语音识别结果进行语义解析，并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的完整性；根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作。2.根据权利要求1所述的方法，其特征在于，所述根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作，包括：当确定所述当前语音信息中包含的用户意图不完整时，立即执行所述第一语音识别结果对应的处理操作，并获取下一个语音信息对应的第二语音识别结果；将所述第一语音识别结果和所述第二语音识别结果进行拼接处理，得到第三语音识别结果；对所述第三语音识别结果进行语义解析，并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性；当所述第三语音识别结果中包含的用户意图完整时，用所述第三语音识别结果修正所述第一语音识别结果，并执行所述第三语音识别结果对应的处理操作；当所述第三语音识别结果中包含的用户意图不完整，则对所述第二语音识别结果进行语义解析。3.根据权利要求1所述的方法，其特征在于，所述根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作，包括：当确定所述当前语音信息中包含的用户意图不完整时，等待预设时长；确定在所述预设时长内，是否获取到下一个语音信息对应的第二语音识别结果；当确定在所述预设时长内未获取到所述第二语音识别结果时，执行所述第一语音识别结果对应的处理操作；当确定在所述预设时长内获取到所述第二语音识别结果时，将所述第一语音识别结果和所述第二语音识别结果进行拼接处理，得到第三语音识别结果；对所述第三语音识别结果进行语义解析，并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性；当所述第三语音识别结果中包含的用户意图完整时，执行所述第三语音识别结果对应的处理操作；当所述第三语音识别结果中包含的用户意图不完整时，执行所述第一语音识别结果对应的处理操作，并对所述第二语音识别结果进行语义解析。4.根据权利要求3所述的方法，其特征在于，所述根据所述用户意图的完整性，确定是否立即执行所述第一语音识别结果对应的处理操作，还包括：当在所述预设时长后获取到所述第二语音识别结果时，将所述第一语音识别结果和所述第二语音识别结果进行拼接处理，得到第三语音识别结果；对所述第三语音识别结果进行语义解析，并根据语义解析结果确定所述第三语音识别结果中包含的用户意图的完整性；当所述第三语音识别结果中包含的用户意图完整时用所述第三语音识别结果修正所述第一语音识别结果，并执行所述第三语音识别结果对应的处理操作；当所述第三语音识别结果中包含的用户意图不完整时，对所述第二语音识别结果进行语义解析。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：对所述第一语音识别结果进行语义解析，并根据语义解析结果确定所述第一语音识别结果中包含的用户意图的个数；根据所述第一语音识别结果中包含的用户意图的个数对所述第一语音识别结果进行拆分处理，得到多个第四语音识别结果；分别执行每个第四语音识别结果对应的处理操作。6.根据权利要求1所述的方法，其特征在于，对所述当前语音信息进行语音识别，得到第一语音识别结果，包括：对所述当前语音信息进行语音识别，以生成所述当前语音信息对应的文本信息和静音信息；根据所述文本信息、所述静音信息和所述文本信息中上下文之间的相关性，将所述文本信息划分为有效文本信息和非有效文本信息，其中，所述非有效文本信息包括静音信息和无效文本信息；从所述文本信息中提取出所述有效文本信息，将所述有效文本信息确定为所述第一语音识别结果；丢弃所述非有效文本信息。7.一种语音处理装置，用于服务器，其特征在于，包括：接收模块，用于接收终端设备采集的包含用户意图的当前语音信息；识别模块，用于...

【专利技术属性】
技术研发人员：全刚，
申请(专利权)人：北京云知声信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人