一种语音处理方法和装置制造方法及图纸

技术编号:16459164 阅读:23 留言:0更新日期:2017-10-25 23:44
本发明专利技术公开了一种语音处理方法,按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理。本发明专利技术还公开了一种语音处理装置。

A speech processing method and device

The invention discloses a method for speech processing, according to the standard of business text classification of the presupposition of service types, determine the standard text of the type of business operations; speech recognition obtained, and converted into text categories; language function of each basic text of the basic unit of language, and the language units determine the conversion after use; the vector space model to determine the weight vector matrix the weight vectors of the basic language unit corresponding to the composition; based on the standard business text and business type, and the weight vector matrix, determining the weight vector matrix in each weight vector corresponding to the basic language unit of the type of business; according to the type of business and the function of language types of the basic language unit, the basic unit of language consists of the text output, and the output of the text Handle\u3002 The invention also discloses a speech processing device.

【技术实现步骤摘要】
一种语音处理方法和装置
本专利技术涉及语音处理技术,尤其涉及一种语音处理方法和装置。
技术介绍
呼叫中心也称为客户服务中心,呼叫中心的主要功能是通过热线电话、咨询电话,由受过训练的客服人员专门接听、处理来电客户的各类问题,如咨询、投诉、建议等;现有的客户服务模式受限于客服人员的个人能力,由于客服人员的语调差异、语差异速、用语规范性、业务理解度、业务熟悉度、业务解释准确性等,而造成服务质量不一致,甚至出现一些错误;因此,客户接受到的服务是一种非标准化、非规范化的服务,会因客服人员差异而受影响;因此,如何为客户提供标准化、规范化的语音服务,是服务提供商亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种语音处理方法和装置,能对客服人员的语音进行智能、标准、统一地处理,从而为客户提供标准化、规范化的语音服务。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术实施例提供了一种语音处理方法,所述方法包括:按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;所述方法还包括:识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理。上述方案中,所述确定转换后文本的各基本语言单位,包括:通过文本分词,确定所述转换后文本的字、和/或词、和/或短语、和/或短句。上述方案中,所述根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型,包括:采用学习向量量化(LVQ,LearningVectorQuantization)神经网络分析所述权值向量矩阵;采用向量空间模型确定所述各标准业务文本的权值向量,并将所述各分类的标准业务文本的权值向量确定为所述LVQ神经网络的隐含层神经元的权值向量;根据所述各标准业务文本的业务类型,预先确定胜出神经元对应的业务类型;将所述向量矩阵设置为所述LVQ神经网络的输入向量,确定所述权值向量矩阵中各权值向量对应的业务类型;根据所述权值向量矩阵中各权值向量对应的业务类型,确定所述各权值向量对应的所述各基本语言单位的业务类型。上述方案中,所述将所述各基本语言单位组成输出文本,包括:根据业务类型和语言功能类别,对所述各基本语言单位进行屏蔽、和/或修正、和/或保持处理,并将处理完成的所述各基本语言单位组成输出文本。上述方案中,所述对所述输出文本进行后处理,包括:将所述输出文本转换成语音;和/或,根据所述输出文本进行知识库检索;和/或,对所述输出文本中的具体业务内容进行具体业务办理;和/或,对所述输出文本进行质检。上述方案中,所述按预设业务类型对各标准业务文本进行分类,包括:按非法业务和合法业务对各标准业务文本进行分类;所述语言功能类别,包括:具体业务内容、和/或惯用词、和/或中性名词、和/或语气词。本专利技术实施例还提供了一种语音处理装置,所述装置包括:分类模块、确定模块,向量确定模块、分析模块,处理模块;其中,所述分类模块,用于按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;所述确定模块,用于识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;所述向量确定模块,用于采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;所述分析模块,用于根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;所述处理模块,用于根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理。上述方案中,所述确定模块,具体用于:通过文本分词,确定转换后文本的字、和/或词、和/或短语、和/或短句。上述方案中,所述分析模块,具体用于:采用LVQ神经网络分析所述权值向量矩阵;采用向量空间模型确定所述各标准业务文本的权值向量,并将所述各分类的标准业务文本的权值向量确定为所述LVQ神经网络的隐含层神经元的权值向量;根据所述各标准业务文本的业务类型,预先确定胜出神经元对应的业务类型;将所述向量矩阵设置为所述LVQ神经网络的输入向量,确定所述权值向量矩阵中各权值向量对应的业务类型;根据所述权值向量矩阵中各权值向量对应的业务类型,确定所述各权值向量对应的所述各基本语言单位的业务类型。上述方案中,所述处理模块,具体用于:根据业务类型和语言功能类别,对所述各基本语言单位进行屏蔽、和/或修正、和/或保持处理,并将处理完成的所述各基本语言单位组成输出文本;所述处理模块,还用于:将所述输出文本转换成语音;和/或,根据所述输出文本进行知识库检索;和/或,对所述输出文本中的具体业务内容进行具体业务办理;和/或,对所述输出文本进行质检。本专利技术实施例所提供的语音处理方法和装置,按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理;进一步将输出文本转换成语音;如此,可以对客服人员的语音进行智能屏蔽、修正、规范提示等标准统一的处理,将不规范的语音转换成规范、标准的语音,从而为客户提供标准化、规范化的语音服务,提升用户服务质量。附图说明图1为本专利技术实施例语音处理方法的流程示意图;图2为本专利技术实施例LVQ神经网络的拓扑图;图3为本专利技术具体示例软件处理流程示意图;图4为本专利技术实施例语音处理装置的组成结构示意图。具体实施方式本专利技术实施例中,按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理。下面结合实施例对本专利技术再作进一步详细的说明。本专利技术实施例提供的语音处理方法,如图1所示,包括:步骤101:按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;这里,可以根据实际业务的需求,将现有的各标准业务文本定义为合法、非法两类,其中,合法文本可以包括:用户号码、品牌、用户归属地、用户已办理业务、用户可办本文档来自技高网...
一种语音处理方法和装置

【技术保护点】
一种语音处理方法,其特征在于,所述方法包括:按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;所述方法还包括:识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理。

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:按预设业务类型对各标准业务文本进行分类,确定各标准业务文本的业务类型;所述方法还包括:识别获取的语音,并转换成文本;确定转换后文本的各基本语言单位、以及所述各基本语言单位的语言功能类别;采用向量空间模型确定所述各基本语言单位对应的权值向量组成的权值向量矩阵;根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型;根据所述各基本语言单位的业务类型和语言功能类别,将所述各基本语言单位组成输出文本,并对所述输出文本进行后处理。2.根据权利要求1所述的方法,其特征在于,所述确定转换后文本的各基本语言单位,包括:通过文本分词,确定所述转换后文本的字、和/或词、和/或短语、和/或短句。3.根据权利要求1所述的方法,其特征在于,所述根据所述各标准业务文本及其业务类型、和所述权值向量矩阵,确定所述权值向量矩阵中所述各权值向量对应的基本语言单位的业务类型,包括:采用学习向量量化LVQ神经网络分析所述权值向量矩阵;采用向量空间模型确定所述各标准业务文本的权值向量,并将所述各分类的标准业务文本的权值向量确定为所述LVQ神经网络的隐含层神经元的权值向量;根据所述各标准业务文本的业务类型,预先确定胜出神经元对应的业务类型;将所述向量矩阵设置为所述LVQ神经网络的输入向量,确定所述权值向量矩阵中各权值向量对应的业务类型;根据所述权值向量矩阵中各权值向量对应的业务类型,确定所述各权值向量对应的所述各基本语言单位的业务类型。4.根据权利要求1所述的方法,其特征在于,所述将所述各基本语言单位组成输出文本,包括:根据业务类型和语言功能类别,对所述各基本语言单位进行屏蔽、和/或修正、和/或保持处理,并将处理完成的所述各基本语言单位组成输出文本。5.根据权利要求1至4任一项所述的方法,其特征在于,所述对所述输出文本进行后处理,包括:将所述输出文本转换成语音;和/或,根据所述输出文本进行知识库检索;和/或,对所述输出文本中的具体业务内容进行具体业务办理;和/或,对所述输出文本进行质检。6.根据权利要求1至4任一项所述的方法,其特征在于,所述按预设业务类型...

【专利技术属性】
技术研发人员:康洪傅华曾侃温建军
申请(专利权)人:中国移动通信集团四川有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1