接待段数量的统计方法、装置、设备及介质制造方法及图纸

技术编号：38810717 阅读：13 留言：0更新日期：2023-09-15 19:49

本申请涉及一种接待段数量的统计方法、装置、设备及介质，该方法包括：获取在接待时间段内接收到的至少一个语音数据，并将各个语音数据组合得到语音数据集；识别语音数据集中的会话文本，以及对语音数据集进行分割，得到分割结果；根据会话文本以及分割结果确定语音数据集中的目标语音；通过目标语音确定接待时间段内的接待段数量。本申请通过提取录音数据中的有效录音方法，解决了存在干扰语音导致统计结果不准确的问题。果不准确的问题。果不准确的问题。

全部详细技术资料下载

【技术实现步骤摘要】
接待段数量的统计方法、装置、设备及介质

[0001]本申请涉及深度学习
，尤其涉及一种接待段数量的统计方法、装置、设备及介质。

技术介绍

[0002]为了提高员工处理用户业务事项的效率及提高用户体验，各领域普遍将员工接待用户的数量这一指标作为员工的重要考核指标，例如，金融领域中，银行通过统计员工接待用户数量这一项指标作为员工的绩效考核。传统方式统计出来的接待段和真实值差异比较大，因为会话环境中会出现很多的影响因素导致统计结果不准确，比如：销售录音可能会将其他销售的销售录音也录进来，导致数据中有冗余；销售人员之间的谈话被作为接待数据进行统计，会干扰统计结果。
[0003]针对上述“会话环境中会出现很多的影响因素导致统计结果不准确”的问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请提供了一种接待段数量的统计方法、装置、设备及介质，以解决上述“会话环境中会出现很多的影响因素导致统计结果不准确”的技术问题。
[0005]根据本申请实施例的一个方面，本申请提供了一种接待段数量的统计方法，包括：获取在接待时间段内接收到的至少一个语音数据，并将各个语音数据组合得到语音数据集；识别语音数据集中的会话文本，以及对语音数据集进行分割，得到分割结果；根据会话文本以及分割结果确定语音数据集中的目标语音；通过目标语音确定接待时间段内的接待段数量。
[0006]可选地，识别语音数据集中的会话文本包括：对语音数据集中的各个语音数据进行文本识别，获得初始文本；获取与初始文本中的字词对...

【技术保护点】

【技术特征摘要】
1.一种接待段数量的统计方法，其特征在于，包括：获取在接待时间段内接收到的至少一个语音数据，并将各个所述语音数据组合得到语音数据集；识别所述语音数据集中的会话文本，以及对所述语音数据集进行分割，得到分割结果；根据所述会话文本以及所述分割结果确定所述语音数据集中的目标语音；通过所述目标语音确定所述接待时间段内的接待段数量。2.根据权利要求1所述的方法，其特征在于，所述识别所述语音数据集中的会话文本包括：对所述语音数据集中的各个所述语音数据进行文本识别，获得初始文本；获取与所述初始文本中的字词对应的会话时刻，以确定各个所述字词与所述会话时刻的对应关系；保存所述初始文本与所述对应关系，得到所述会话文本。3.根据权利要求1所述的方法，其特征在于，所述对所述语音数据集进行分割，得到分割结果包括：对所述语音数据集中的各个所述语音数据进行切分，得到多个预设长度的语音片段；提取各个所述语音片段中的声纹向量；组合各个所述声纹向量得到声纹向量矩阵；根据声纹向量矩阵获得相似度矩阵；对所述相似度矩阵中的各个所述语音片段进行聚类，并将聚类结果作为所述分割结果。4.根据权利要求2所述的方法，其特征在于，所述根据所述会话文本以及所述分割结果确定所述语音数据集中的目标语音包括：根据所述分割结果确定所述语音数据集中的无效语音，其中，所述无效语音为不包括第一对象语音的语音；根据所述会话文本确定所述语音数据集中的重复语音，其中，所述重复语音为被不同语音采集设备采集到的相同语音；滤除所述语音数据集中的所述无效语音以及所述重复语音，得到所述目标语音。5.根据权利要求4所述的方法，其特征在于，所述根据所述会话文本确定所述语音数据集中的重复语音包括：按照所述对应关系将所述会话文本中的所述初始文本与所述会话时刻对齐；在同一时间段内存在...

【专利技术属性】
技术研发人员：赵亮，姜平，雍坤，何敏，
申请(专利权)人：北京明略昭辉科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人