语音处理方法、决策树模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：31088058 阅读：14 留言：0更新日期：2021-12-01 12:46

本申请涉及人工智能技术和智慧城市领域，具体公开了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质，所述方法包括：获取坐席当前的通话文本；获取预设产品对应的标准话术，根据标准话术中的条款将标准话术中的多个语句进行拼接，得到多个第一拼接语句；将通话文本拆分分割成多个语句，计算多个语句与多个第一拼接语句的相似度，并根据相似度将多个所述语句进行拼接，得到多个第二拼接语句；计算第二拼接语句与第一拼接语句的语句相似度，以及根据通话文本的词频表计算每个第二拼接语句相对词频表的词频分值；将第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到坐席质检结果。得到坐席质检结果。得到坐席质检结果。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、决策树模型训练方法、装置、设备及存储介质

[0001]本申请涉及人工智能领域，尤其涉及一种语音处理方法、决策树模型训练方法、装置、设备及存储介质。

技术介绍

[0002]座席在通过电话给客户介绍产品时，需要正确完整地介绍产品，比如产品的条款、产品的构成、产品的方案等均需要给客户一一介绍，座席介绍的内容不可以有遗漏和错误，比如要介绍a产品的条款却说了b产品。为了提高坐席的服务质量，因此需要对坐席进行质检，即检查座席是否完整地介绍产品内容。目前的坐席质检方式是通过人工监听录音的方式实现对坐席质检的，人工监听效率较低。

技术实现思路

[0003]本申请提供了一种语音处理方法、决策树模型训练方法、装置、设备及存储介质，以提高坐席质检的准确率，尤其对座席是否完整地介绍产品内容，可以给出较好的质检结果。
[0004]第一方面，本申请提供了一种基于坐席质检系统的语音处理方法，所述坐席质检系统包括电话系统和检测装置，所述检测装置用于对所述电话系统的通话进行检测，所述方法包括：
[0005]获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本；
[0006]获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句；
[0007]将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语...

【技术保护点】

【技术特征摘要】
1.一种决策树模型训练方法，其特征在于，所述方法包括：获取预设产品的标准话术和训练样本，所述训练样本包括多个样本；根据所述标准话术的条款将每个所述条款下的多个语句进行拼接，得到多个第一拼接语句；将所述训练样本中的每个样本对应的文本分割成多个语句，计算每个所述样本的每个语句与每个所述第一拼接语句的相似度，并根据所述相似度将每个所述样本的多个语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；获取所述第二拼接语句与所述第一拼接语句的语句相似度，根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值；将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数，利用决策树模型进行训练，得到训练好的决策树模型。2.一种基于坐席质检系统的语音处理方法，其特征在于，所述坐席质检系统包括电话系统和检测装置，所述检测装置用于对所述电话系统的通话进行检测，所述方法包括：获取坐席当前通过电话系统给客户介绍预设产品时的语音信息，对当前的所述语音信息进行语音识别得到对应的通话文本；获取所述预设产品对应的标准话术，根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接，得到多个第一拼接语句；将所述通话文本拆分分割成多个语句，计算多个所述语句与多个所述第一拼接语句的相似度，并根据所述相似度将多个所述语句进行拼接，得到多个第二拼接语句，其中，所述第二拼接语句的数量与所述第一拼接语句的数量相同；计算所述第二拼接语句与所述第一拼接语句的语句相似度，以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值；将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型，得到所述坐席质检结果。3.根据权利要求2所述的方法，其特征在于，所述计算多个所述语句与多个所述第一拼接语句的相似度，包括：对多个语句与多个第一拼接语句进行onehot编码，得到所述通话文本的第一编码向量和所述标准话术的第二编码向量；根据所述第一编码向量和所述第二编码向量，利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度。4.根据权利要求3所述的方法，其特征在于，所述相似度公式为余弦相似度公式，所述余弦相似度公式为：在该余弦相似度公式中，cos(θ)表示余弦相似度，A
i
表示所述第一编码向量中第i个量，B
i
表示所述第二编码向量中第i个量。
5.根据权利要求2所述的方法，其特征在于，所述方法还包括：对所述通话文本进行分词，并计算分词后每个词的词频；根据所述词频提取所述通话文本的关键词，将提取的关键词组成词频表。6.根据权利要求2所述的...

【专利技术属性】
技术研发人员：梁国铿，
申请(专利权)人：平安普惠企业管理有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人