语音处理方法和装置制造方法及图纸

技术编号:18401164 阅读:22 留言:0更新日期:2018-07-08 20:40
本发明专利技术涉及一种语音处理方法和装置,该方法包括:在接收到用户的语音信息时,将语音信息转换为文本信息;对文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;获取用户的当前行为信息,并将当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;根据各个操作请求的综合概率,对用户进行响应;本发明专利技术能反映用户实际需求,减少设备与用户之间的交互次数,提高用户体验,使得设备能够达到智能化要求。

Speech processing methods and devices

The invention relates to a speech processing method and device. The method includes: converting the speech information into text information when receiving the user's voice information, semantic analysis of the text information, and obtaining the probability of multiple operation requests and various operation requests expected by the user. The probability is recorded as the first probability; The current behavior information of the user and the current behavior information are input to the behavior analysis model, and the probability of multiple operation requests and operation requests expected by the user is obtained. The probability is recorded as the second probability, and the comprehensive probability of the operation request is obtained according to the first probability and the second probability of each operation request; according to the individual probability, the probability of the operation request is obtained. The comprehensive probability of the operation request responds to the user. The invention can reflect the user's actual demand, reduce the number of interaction between the equipment and the user, improve the user experience, and make the device achieve the intelligent requirement.

【技术实现步骤摘要】
语音处理方法和装置
本专利技术涉及移动通信
,尤其是涉及一种语音处理方法和装置。
技术介绍
随着语音识别技术的发展,大量的基于语音识别技术的应用层出不穷,基于语音导航的IVR(InteractiveVoiceResponse,即互动式语音应答)智能交互系统逐渐广泛的应用于各种客服系统中,其作为智能化服务渠道也被大家所熟悉和接受。为提升产品易用性,语音导航需要有很高的智能化交互能力,否则将会大大影响客户的交互体验,降低系统满意度。目前,语音导航系统保障其智能化主要依赖其语音识别能力和语义分析能力。其中,语音识别能力是指将用户输入的语音转写为文本的能力,通常通过对大量语音数据的训练得到语言模型,基于语言模型识别用户语音。语义分析能力是指当用户输入的语音为非标准语音时,根据语义分析模型确定用户实际需求的能力,通常基于大量的用户语音文本和确定的用户实际需求确认得到。训练语音或者语义模型时需要根据实际的场景需要,通过训练一部分语音、语料来得到一个专用语音和语义模型。为保证语音导航系统的智能性,对语义模型的准确性要求很高,而现有的提升语义模型识别能力的方法主要包括通过模型算法优化,或者增大模型训练数据源,但暂时仍然难以达到智能化要求。由于现有的语音导航系统对语义模型的依赖程度高,但仅依靠语义模型往往不能反映用户实际需求,导致语音导航系统不能给用户实用的反馈,使得语音导航系统不能达到其智能化要求。
技术实现思路
针对以上缺陷,本专利技术提供一种语音处理方法和装置,能够反映用户实际需求,减少设备与用户之间的交互次数,提高用户体验,使得设备能够达到智能化要求。第一方面,本专利技术提供的语音处理方法包括:在接收到用户的语音信息时,将所述语音信息转换为文本信息;对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;根据各个操作请求的综合概率,对所述用户进行响应;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信息和投诉行为信息中的至少一种。可选的,在将所述语音信息转换为文本信息之前,所述方法还包括:检测出所述语音信息的静音部分,并去掉所述静音部分,得到有效语音信息;相应的,所述将所述语音信息转换为文本信息,包括:将所述有效语音信息转换为文本信息。可选的,在将所述语音信息转换为文本信息之前,所述方法还包括:预先针对不同的地域信息或身份ID信息定制多个声学和语言模型;在接收到用户的语音信息后,获取用户的身份ID信息或者地域信息,并根据所述身份ID信息或所述地域信息,选择对应的声学和语言模型;对应的,所述将所述语音信息转换为文本信息,包括:利用选择的声学和语言模型将所述语音信息转换为文本信息。可选的,采用下式计算所述综合概率:P(An)=Pv(An)*Pa(An)式中,Pv(An)为第An个操作请求的第一概率,Pa(An)为第An个操作请求的第二概率,P(An)为第An个操作请求的综合概率。可选的,所述根据各个操作请求的综合概率,对所述用户进行响应,包括:对各个操作请求的综合概率进行排序;根据排序结果,提供显示有多个操作请求对应的虚拟按键的界面,或者,将多个操作请求对应的链接发送至用户终端。可选的,所述获取所述用户的当前行为信息,包括:在接收到用户的语音信息时,获取所述用户的当前行为信息。可选的,所述获取所述用户的当前行为信息,包括:在声讯服务台、在线客服系统和客户管理系统中的至少一个中获取所述当前行为信息。第二方面,本专利技术提供一种语音处理装置,包括:转换模块,用于在接收到用户的语音信息时,将所述语音信息转换为文本信息;语义分析模块,用于对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;行为分析模块,用于获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;综合计算模块,用于根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;响应模块,用于根据各个操作请求的综合概率,对所述用户进行响应;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信息和投诉行为信息中的至少一种。可选的,所述转换模块具体用于在接收到用户的语音信息时,检测出所述语音信息的静音部分,并去掉所述静音部分,得到有效语音信息;将所述有效语音信息转换为文本信息。可选的,所述转换模块具体用于:预先针对不同的地域信息或身份ID信息定制多个声学和语言模型;在接收到用户的语音信息后,获取用户的身份ID信息或者地域信息,并根据所述身份ID信息或所述地域信息,选择对应的声学和语言模型;利用选择的声学和语言模型将所述语音信息转换为文本信息。本专利技术提供的语音处理方法和装置,首先将语音信息转换为文本信息,然后对文本信息进行语义分析,得到用户可能提出的多个操作请求及第一概率,然后基于用户的行为信息,得到用户可能提出的多个操作请求及第二概率,然后将两概率结合,得到综合概率,而后基于综合概率对用户进行响应。这里,引入了用户行为信息,即用户的个性化信息,使得语音的处理识别不单单依赖于语义分析模型,还能反映用户实际需求,更加理解或预测用户的真实意图,使得执行上述方法的设备能够给用户实时的反馈,减少设备与用户之间的交互次数,提高用户体验,使得设备能够达到智能化要求。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1示出了本专利技术一实施例中语音处理方法的流程示意图;图2示出了本专利技术一实施例中语音导航设备的结构框图。具体实施方式下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。第一方面,本专利技术提供一种语音处理方法,该方法可以应用于语音导航系统中,具体包括:S1、在接收到用户的语音信息时,将所述语音信息转换为文本信息;S2、对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;S3、获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:在接收到用户的语音信息时,将所述语音信息转换为文本信息;对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;根据各个操作请求的综合概率,对所述用户进行响应;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信息和投诉行为信息中的至少一种。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:在接收到用户的语音信息时,将所述语音信息转换为文本信息;对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;根据各个操作请求的综合概率,对所述用户进行响应;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信息和投诉行为信息中的至少一种。2.根据权利要求1所述的语音处理方法,其特征在于,在将所述语音信息转换为文本信息之前,所述方法还包括:检测出所述语音信息的静音部分,并去掉所述静音部分,得到有效语音信息;相应的,所述将所述语音信息转换为文本信息,包括:将所述有效语音信息转换为文本信息。3.根据权利要求1所述的语音处理方法,其特征在于,在将所述语音信息转换为文本信息之前,所述方法还包括:预先针对不同的地域信息或身份ID信息定制多个声学和语言模型;在接收到用户的语音信息后,获取用户的身份ID信息或者地域信息,并根据所述身份ID信息或所述地域信息,选择对应的声学和语言模型;对应的,所述将所述语音信息转换为文本信息,包括:利用选择的声学和语言模型将所述语音信息转换为文本信息。4.根据权利要求1所述的语音处理方法,其特征在于,采用下式计算所述综合概率:P(An)=Pv(An)*Pa(An)式中,Pv(An)为第An个操作请求的第一概率,Pa(An)为第An个操作请求的第二概率,P(An)为第An个操作请求的综合概率。5.根据权利要求1所述的语音处理方法,其特征在于,所述根据各个操作请求的综合概率,对所述用户进行响应,包括:对各个操作请求的综合概率进行...

【专利技术属性】
技术研发人员:叶勇申宗杰方国梁
申请(专利权)人:中国移动通信集团浙江有限公司中国移动通信集团公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1