语音处理方法、决策树模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:31088058 阅读:14 留言:0更新日期:2021-12-01 12:46
本申请涉及人工智能技术和智慧城市领域,具体公开了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质,所述方法包括:获取坐席当前的通话文本;获取预设产品对应的标准话术,根据标准话术中的条款将标准话术中的多个语句进行拼接,得到多个第一拼接语句;将通话文本拆分分割成多个语句,计算多个语句与多个第一拼接语句的相似度,并根据相似度将多个所述语句进行拼接,得到多个第二拼接语句;计算第二拼接语句与第一拼接语句的语句相似度,以及根据通话文本的词频表计算每个第二拼接语句相对词频表的词频分值;将第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型,得到坐席质检结果。得到坐席质检结果。得到坐席质检结果。

【技术实现步骤摘要】
语音处理方法、决策树模型训练方法、装置、设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种语音处理方法、决策树模型训练方法、装置、设备及存储介质。

技术介绍

[0002]座席在通过电话给客户介绍产品时,需要正确完整地介绍产品,比如产品的条款、产品的构成、产品的方案等均需要给客户一一介绍,座席介绍的内容不可以有遗漏和错误,比如要介绍a产品的条款却说了b产品。为了提高坐席的服务质量,因此需要对坐席进行质检,即检查座席是否完整地介绍产品内容。目前的坐席质检方式是通过人工监听录音的方式实现对坐席质检的,人工监听效率较低。

技术实现思路

[0003]本申请提供了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质,以提高坐席质检的准确率,尤其对座席是否完整地介绍产品内容,可以给出较好的质检结果。
[0004]第一方面,本申请提供了一种基于坐席质检系统的语音处理方法,所述坐席质检系统包括电话系统和检测装置,所述检测装置用于对所述电话系统的通话进行检测,所述方法包括:
[0005]获取坐席当前通过电话系统给客户介绍预设产品时的语音信息,对当前的所述语音信息进行语音识别得到对应的通话文本;
[0006]获取所述预设产品对应的标准话术,根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接,得到多个第一拼接语句;
[0007]将所述通话文本拆分分割成多个语句,计算多个所述语句与多个所述第一拼接语句的相似度,并根据所述相似度将多个所述语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
[0008]计算所述第二拼接语句与所述第一拼接语句的语句相似度,以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值;
[0009]将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型,得到所述坐席质检结果。
[0010]第二方面,本申请还提供了一种决策树模型训练方法,所述决策树模型训练方法包括:
[0011]获取预设产品的标准话术和训练样本,所述训练样本包括多个样本;
[0012]根据所述标准话术的条款将每个所述条款下的多个语句进行拼接,得到多个第一拼接语句;
[0013]将所述训练样本中的每个样本对应的文本分割成多个语句,计算每个所述样本的每个语句与每个所述第一拼接语句的相似度,并根据所述相似度将每个所述样本的多个语
句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
[0014]获取所述第二拼接语句与所述第一拼接语句的语句相似度,根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值;
[0015]将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数,利用决策树模型进行训练,得到训练好的决策树模型。
[0016]第三方面,本申请还提供了一种语音处理装置,所述语音处理装置包括:
[0017]获取识别模块,用于获取坐席当前通过电话系统给客户介绍预设产品时的语音信息,对当前的所述语音信息进行语音识别得到对应的通话文本;
[0018]获取拼接模块,用于获取所述预设产品对应的标准话术,根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接,得到多个第一拼接语句;
[0019]计算拼接模块,用于将所述通话文本拆分分割成多个语句,计算多个所述语句与多个所述第一拼接语句的相似度,并根据所述相似度将多个所述语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
[0020]参数计算模块,用于计算所述第二拼接语句与所述第一拼接语句的语句相似度,以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值;
[0021]输入质检模块,用于将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型,得到所述坐席质检结果。
[0022]第四方面,本申请还提供了一种决策树模型训练装置,所述决策树模型训练装置包括:
[0023]样本获取模块,用于获取预设产品的标准话术和训练样本,所述训练样本包括多个样本;
[0024]第一拼接模块,用于根据所述标准话术的条款将每个所述条款下的多个语句进行拼接,得到多个第一拼接语句;
[0025]第二拼接模块,用于将所述训练样本中的每个样本对应的文本分割成多个语句,计算每个所述样本的每个语句与每个所述第一拼接语句的相似度,并根据所述相似度将每个所述样本的多个语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
[0026]分值计算模块,用于获取所述第二拼接语句与所述第一拼接语句的语句相似度,根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值;
[0027]模型训练模块,用于将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数,利用决策树模型进行训练,得到训练好的决策树模型。
[0028]第五方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如本申请实施例提供任意一种所述的语音处理方法,或者任意一种所述的决策树模型训练方法。
[0029]第六方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如本申请实施例提
供任意一种所述的语音处理方法,或者任意一种所述的决策树模型训练方法。
[0030]本申请公开了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质,其中决策树模型训练方法用于给坐席质检系统训练决策树模型,语音处理方法利用训练好的决策树模型,能够快速准确地检测出坐席是否完整地介绍产品内容,提高质检效率和准确率。
附图说明
[0031]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本申请实施例提供的一种坐席质检系统的示意性框图;
[0033]图2是本申请实施例提供的一种决策树模型训练方法的示意流程图;
[0034]图3是本申请实施例提供一种语音处理方法的示意流程图;
[0035]图4是本申请实施例提供的一种语音处理装置的示意性框图;
[0036]图5是本申请实施例提供一种训练装置的示意性框图;
[0037]图6是本申请实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
[0038]下面将结合本申请实施例中的附图,对本申请实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种决策树模型训练方法,其特征在于,所述方法包括:获取预设产品的标准话术和训练样本,所述训练样本包括多个样本;根据所述标准话术的条款将每个所述条款下的多个语句进行拼接,得到多个第一拼接语句;将所述训练样本中的每个样本对应的文本分割成多个语句,计算每个所述样本的每个语句与每个所述第一拼接语句的相似度,并根据所述相似度将每个所述样本的多个语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;获取所述第二拼接语句与所述第一拼接语句的语句相似度,根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值;将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数,利用决策树模型进行训练,得到训练好的决策树模型。2.一种基于坐席质检系统的语音处理方法,其特征在于,所述坐席质检系统包括电话系统和检测装置,所述检测装置用于对所述电话系统的通话进行检测,所述方法包括:获取坐席当前通过电话系统给客户介绍预设产品时的语音信息,对当前的所述语音信息进行语音识别得到对应的通话文本;获取所述预设产品对应的标准话术,根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接,得到多个第一拼接语句;将所述通话文本拆分分割成多个语句,计算多个所述语句与多个所述第一拼接语句的相似度,并根据所述相似度将多个所述语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;计算所述第二拼接语句与所述第一拼接语句的语句相似度,以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值;将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型,得到所述坐席质检结果。3.根据权利要求2所述的方法,其特征在于,所述计算多个所述语句与多个所述第一拼接语句的相似度,包括:对多个语句与多个第一拼接语句进行onehot编码,得到所述通话文本的第一编码向量和所述标准话术的第二编码向量;根据所述第一编码向量和所述第二编码向量,利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度。4.根据权利要求3所述的方法,其特征在于,所述相似度公式为余弦相似度公式,所述余弦相似度公式为:在该余弦相似度公式中,cos(θ)表示余弦相似度,A
i
表示所述第一编码向量中第i个量,B
i
表示所述第二编码向量中第i个量。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述通话文本进行分词,并计算分词后每个词的词频;根据所述词频提取所述通话文本的关键词,将提取的关键词组成词频表。6.根据权利要求2所述的...

【专利技术属性】
技术研发人员:梁国铿
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1