客户音频数据的处理方法、装置和服务器制造方法及图纸

技术编号：39177020 阅读：11 留言：0更新日期：2023-10-27 08:24

本说明书提供了客户音频数据的处理方法、装置和服务器，可用于人工智能领域。基于该方法，在得到包含有目标客户的语音记录的目标音频数据后，先根据预设的拆分规则，将该目标音频数据拆分成多个音频片段；再提取得到音频片段的语音情绪特征；并根据音频片段的语音情绪特征，构建得到针对目标音频数据的语音情绪特征曲线；同时将音频片段转换为对应的文本片段；提取得到文本片段的文字情绪特征；并根据文本片段的文字情绪特征，构建得到针对目标音频数据的文字情绪特征曲线；再组合语音情绪特征曲线和文字情绪特征曲线，得到联合情绪特征曲线；根据联合情绪特征曲线，能够在目标语音客服服务过程中精准地确定出导致目标客户不满意的异常节点。满意的异常节点。满意的异常节点。

全部详细技术资料下载

【技术实现步骤摘要】
客户音频数据的处理方法、装置和服务器

[0001]本说明书属于人工智能
，尤其涉及客户音频数据的处理方法、装置和服务器。

技术介绍

[0002]在金融服务场景中，客户常常会通过线上语音客服等方式向金融交易服务机构咨询问题或者寻求帮助。并且，在线上语音客服结束后，系统服务器还会接收到客户基于提示信息针对本次语音客服服务所反馈的满意度评价结果。
[0003]基于现有方法，系统服务器大多只能根据所接收到的满意度评价结果，粗粒度地判断该客户针对本次语音客服服务整体上是否满意。如果客户针对本次语音客服服务不满意，基于现有方法无法进一步细粒度地分析并确定出导致该客户不满意的具体节点，以及具体原因。进而导致后续无法有效地对相关客服服务进行改进。
[0004]针对上述问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本说明书提供了一种客户音频数据的处理方法、装置和服务器，能够精准、高效地从目标语音客服服务过程中回溯确定出导致目标客户不满意的异常节点。
[0006]本说明书提供了一种客户音频数据的处理方法，包括：
[0007]获取目标音频数据；其中，所述目标音频数据包括在向目标客户提供目标语音客服服务时采集到的目标客户的语音记录；
[0008]根据预设的拆分规则，将目标音频数据拆分成多个音频片段；
[0009]提取得到音频片段的语音情绪特征；并根据音频片段的语音情绪特征，构建得到针对目标音频数据的语音情绪特征曲线；
[0010]将所述多个音频片段...

【技术保护点】

【技术特征摘要】
1.一种客户音频数据的处理方法，其特征在于，包括：获取目标音频数据；其中，所述目标音频数据包括在向目标客户提供目标语音客服服务时采集到的目标客户的语音记录；根据预设的拆分规则，将目标音频数据拆分成多个音频片段；提取得到音频片段的语音情绪特征；并根据音频片段的语音情绪特征，构建得到针对目标音频数据的语音情绪特征曲线；将所述多个音频片段转换为对应的多个文本片段；提取得到文本片段的文字情绪特征；并根据文本片段的文字情绪特征，构建得到针对目标音频数据的文字情绪特征曲线；组合所述语音情绪特征曲线和文字情绪特征曲线，得到针对目标音频数据的联合情绪特征曲线；根据所述联合情绪特征曲线，在目标语音客服服务过程中确定出导致目标客户不满意的异常节点。2.根据权利要求1所述的方法，其特征在于，获取目标音频数据，包括：接收目标客户针对目标语音客服服务的目标反馈结果；根据所述目标反馈结果，检测目标客户针对目标语音客服服务的满意度是否符合要求；在确定目标客户针对目标语音客服服务的满意度不符合要求的情况下，从预设的数据库中搜索在向目标客户提供目标语音客服服务时采集到的目标客户的语音记录，作为所述目标音频数据。3.根据权利要求1所述的方法，其特征在于，根据预设的拆分规则，将目标音频数据拆分成多个音频片段，包括：根据预设的拆分规则，对目标音频数据进行语音活动检测，得到对应的语音活动检测结果；根据语音活动检测结果，在目标音频数据中确定出语音活动的起始时间和结束时间；根据语音活动的起始时间和结束时间，从目标音频数据中截取对应的音频片段。4.根据权利要求1所述的方法，其特征在于，所述语音情绪特征包括以下至少之一：分贝特征、音高特征、声调特征、语速特征；相应的，语音情绪特征曲线包括以下至少之一：分贝特征曲线、音高特征曲线、声调特征曲线、语速特征曲线。5.根据权利要求4所述的方法，其特征在于，在所述语音情绪特征至少包括分贝特征的情况下，提取得到音频片段的语音情绪特征；并根据音频片段的语音情绪特征，构建得到针对目标音频数据的语音情绪特征曲线，包括：检测并确定音频片段所包含的各个发音单元的能量值；根据音频片段所包含的各个发音单元的能量值，提取得到该音频片段的分贝特征；按序组合拼接多个音频片段的分贝特征，得到针对目标音频数据的分贝特征曲线。6.根据权利要求4所述的方法，其特征在于，在所述语音情绪特征至少包括音高特征的情况下，提取得到音频片段的语音情绪特征；并根据音频片段的语音情绪特征，构建得到针对目标音频数据的语音情绪特征曲线，包括：
将音频片段划分为多个窗口；将所述多个窗口中的各个窗口的时域信号转换为对应的频域信号；对音频片段中的多个窗口中的各个窗口的频域信号分别进行主频成分搜索，以得到该音频片段的音高特征；按序组合拼接多个音频片段的音高特征，得到针对目标音频数据的音高特征曲线。7.根据权利要求4所述的方法，其特征在于，在所述语音情绪特征至少包括声调特征的情况下，提取得到音频片段的语音情绪特征；并根据音频片段的语音情绪特征，构建得到针对目标音频数据的语音情绪特征曲线，包括：通过对所述音频片段进行短时傅里叶变换，得到音频片段的频谱；根据音频片段的频谱，提取得到该音频片段的声调特征；按序组合拼接多个音频片段的声调特征，得到针对目标音频数据的声调特征曲线。8....

【专利技术属性】
技术研发人员：娄潇，商晓冉，赵彤彤，郭蒙，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人