The invention relates to a speech processing method and device. The method includes: converting the speech information into text information when receiving the user's voice information, semantic analysis of the text information, and obtaining the probability of multiple operation requests and various operation requests expected by the user. The probability is recorded as the first probability; The current behavior information of the user and the current behavior information are input to the behavior analysis model, and the probability of multiple operation requests and operation requests expected by the user is obtained. The probability is recorded as the second probability, and the comprehensive probability of the operation request is obtained according to the first probability and the second probability of each operation request; according to the individual probability, the probability of the operation request is obtained. The comprehensive probability of the operation request responds to the user. The invention can reflect the user's actual demand, reduce the number of interaction between the equipment and the user, improve the user experience, and make the device achieve the intelligent requirement.
【技术实现步骤摘要】
语音处理方法和装置
本专利技术涉及移动通信
,尤其是涉及一种语音处理方法和装置。
技术介绍
随着语音识别技术的发展,大量的基于语音识别技术的应用层出不穷,基于语音导航的IVR(InteractiveVoiceResponse,即互动式语音应答)智能交互系统逐渐广泛的应用于各种客服系统中,其作为智能化服务渠道也被大家所熟悉和接受。为提升产品易用性,语音导航需要有很高的智能化交互能力,否则将会大大影响客户的交互体验,降低系统满意度。目前,语音导航系统保障其智能化主要依赖其语音识别能力和语义分析能力。其中,语音识别能力是指将用户输入的语音转写为文本的能力,通常通过对大量语音数据的训练得到语言模型,基于语言模型识别用户语音。语义分析能力是指当用户输入的语音为非标准语音时,根据语义分析模型确定用户实际需求的能力,通常基于大量的用户语音文本和确定的用户实际需求确认得到。训练语音或者语义模型时需要根据实际的场景需要,通过训练一部分语音、语料来得到一个专用语音和语义模型。为保证语音导航系统的智能性,对语义模型的准确性要求很高,而现有的提升语义模型识别能力的方法主要包括通过模型算法优化,或者增大模型训练数据源,但暂时仍然难以达到智能化要求。由于现有的语音导航系统对语义模型的依赖程度高,但仅依靠语义模型往往不能反映用户实际需求,导致语音导航系统不能给用户实用的反馈,使得语音导航系统不能达到其智能化要求。
技术实现思路
针对以上缺陷,本专利技术提供一种语音处理方法和装置,能够反映用户实际需求,减少设备与用户之间的交互次数,提高用户体验,使得设备能够达到智能化要求。第一方面,本 ...
【技术保护点】
1.一种语音处理方法,其特征在于,包括:在接收到用户的语音信息时,将所述语音信息转换为文本信息;对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;根据各个操作请求的综合概率,对所述用户进行响应;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信息和投诉行为信息中的至少一种。
【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:在接收到用户的语音信息时,将所述语音信息转换为文本信息;对所述文本信息进行语义分析,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第一概率;获取所述用户的当前行为信息,并将所述当前行为信息输入行为分析模型,得到用户期望提出的多个操作请求及各个操作请求的概率,该概率记为第二概率;根据每一操作请求的第一概率和第二概率,得到该操作请求的综合概率;根据各个操作请求的综合概率,对所述用户进行响应;其中,所述行为分析模型为预先根据用户的历史行为信息以及用户选定的操作请求通过模型训练方法得到;行为信息包括上网行为信息、通话行为信息、业务订购行为信息和投诉行为信息中的至少一种。2.根据权利要求1所述的语音处理方法,其特征在于,在将所述语音信息转换为文本信息之前,所述方法还包括:检测出所述语音信息的静音部分,并去掉所述静音部分,得到有效语音信息;相应的,所述将所述语音信息转换为文本信息,包括:将所述有效语音信息转换为文本信息。3.根据权利要求1所述的语音处理方法,其特征在于,在将所述语音信息转换为文本信息之前,所述方法还包括:预先针对不同的地域信息或身份ID信息定制多个声学和语言模型;在接收到用户的语音信息后,获取用户的身份ID信息或者地域信息,并根据所述身份ID信息或所述地域信息,选择对应的声学和语言模型;对应的,所述将所述语音信息转换为文本信息,包括:利用选择的声学和语言模型将所述语音信息转换为文本信息。4.根据权利要求1所述的语音处理方法,其特征在于,采用下式计算所述综合概率:P(An)=Pv(An)*Pa(An)式中,Pv(An)为第An个操作请求的第一概率,Pa(An)为第An个操作请求的第二概率,P(An)为第An个操作请求的综合概率。5.根据权利要求1所述的语音处理方法,其特征在于,所述根据各个操作请求的综合概率,对所述用户进行响应,包括:对各个操作请求的综合概率进行...
【专利技术属性】
技术研发人员:叶勇,申宗杰,方国梁,
申请(专利权)人:中国移动通信集团浙江有限公司,中国移动通信集团公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。