接待段数量的统计方法、装置、设备及介质制造方法及图纸

技术编号:38810717 阅读:13 留言:0更新日期:2023-09-15 19:49
本申请涉及一种接待段数量的统计方法、装置、设备及介质,该方法包括:获取在接待时间段内接收到的至少一个语音数据,并将各个语音数据组合得到语音数据集;识别语音数据集中的会话文本,以及对语音数据集进行分割,得到分割结果;根据会话文本以及分割结果确定语音数据集中的目标语音;通过目标语音确定接待时间段内的接待段数量。本申请通过提取录音数据中的有效录音方法,解决了存在干扰语音导致统计结果不准确的问题。果不准确的问题。果不准确的问题。

【技术实现步骤摘要】
接待段数量的统计方法、装置、设备及介质


[0001]本申请涉及深度学习
,尤其涉及一种接待段数量的统计方法、装置、设备及介质。

技术介绍

[0002]为了提高员工处理用户业务事项的效率及提高用户体验,各领域普遍将员工接待用户的数量这一指标作为员工的重要考核指标,例如,金融领域中,银行通过统计员工接待用户数量这一项指标作为员工的绩效考核。传统方式统计出来的接待段和真实值差异比较大,因为会话环境中会出现很多的影响因素导致统计结果不准确,比如:销售录音可能会将其他销售的销售录音也录进来,导致数据中有冗余;销售人员之间的谈话被作为接待数据进行统计,会干扰统计结果。
[0003]针对上述“会话环境中会出现很多的影响因素导致统计结果不准确”的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请提供了一种接待段数量的统计方法、装置、设备及介质,以解决上述“会话环境中会出现很多的影响因素导致统计结果不准确”的技术问题。
[0005]根据本申请实施例的一个方面,本申请提供了一种接待段数量的统计方法,包括:获取在接待时间段内接收到的至少一个语音数据,并将各个语音数据组合得到语音数据集;识别语音数据集中的会话文本,以及对语音数据集进行分割,得到分割结果;根据会话文本以及分割结果确定语音数据集中的目标语音;通过目标语音确定接待时间段内的接待段数量。
[0006]可选地,识别语音数据集中的会话文本包括:对语音数据集中的各个语音数据进行文本识别,获得初始文本;获取与初始文本中的字词对应的会话时刻,以确定各个字词与会话时刻的对应关系;保存初始文本与对应关系,得到会话文本。
[0007]可选地,对语音数据集进行分割,得到分割结果包括:对语音数据集中的各个语音数据进行切分,得到多个预设长度的语音片段;提取各个语音片段中的声纹向量;组合各个声纹向量得到声纹向量矩阵;根据声纹向量矩阵获得相似度矩阵;对相似度矩阵中的各个语音片段进行聚类,并将聚类结果作为分割结果。
[0008]可选地,根据会话文本以及分割结果确定语音数据集中的目标语音包括:根据分割结果确定语音数据集中的无效语音,其中,无效语音为不包括第一对象语音的语音;根据会话文本确定语音数据集中的重复语音,其中,重复语音为被不同语音采集设备采集到的相同语音;滤除语音数据集中的无效语音以及重复语音,得到目标语音。
[0009]可选地,根据会话文本确定语音数据集中的重复语音包括:按照对应关系将会话文本中的初始文本与会话时刻对齐;在同一时间段内存在多个文本片段的情况下,对多个文本片段进行对比,获得文本相似度;将与文本相似度大于相似度阈值的文本片段对应的
语音确定为重复语音。
[0010]可选地,根据分割结果确定语音数据集中的无效语音包括:获取第二对象的第一声纹特征;确定分割结果中与第一声纹特征匹配的语音片段;将语音片段确定为无效语音。
[0011]可选地,通过目标语音确定接待时间段内的接待段数量包括:提取目标语音中的第二声纹特征;根据第二声纹特征对目标语音进行聚类,得到不同的语音簇;根据目标语音的会话文本合并处于同一会话中的语音簇,得到目标簇;统计目标簇的数量,并将目标簇的数量确定为接待时间段内的接待段数量。
[0012]根据本申请实施例的另一个方面,本申请还提供了一种接待段数量的统计装置,包括:获取模块,用于获取在接待时间段内接收到的至少一个语音数据,并将各个语音数据组合得到语音数据集;识别模块,用于识别语音数据集中的会话文本,以及对语音数据集进行分割,得到分割结果;第一确定模块,用于根据会话文本以及分割结果确定语音数据集中的目标语音;第二确定模块,用于通过目标语音确定接待时间段内的接待段数量。
[0013]根据本申请实施例的另一个方面,本申请还提供了一种电子设备,包括存储器、处理器、通信接口及通信总线,存储器中存储有可在处理器上运行的计算机程序,存储器、处理器通过通信总线和通信接口进行通信,处理器执行计算机程序时实现上述任一方法的步骤。
[0014]根据本申请实施例的另一个方面,本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述任一方法。
[0015]本申请技术方案可以应用于深度学习技术进行语音识别与处理的设计。
[0016]本申请实施例提供的上述技术方案与相关技术相比具有如下优点:
[0017]本申请提供一种接待段数量的统计方法,包括:获取在接待时间段内接收到的至少一个语音数据,并将各个语音数据组合得到语音数据集;识别语音数据集中的会话文本,以及对语音数据集进行分割,得到分割结果;根据会话文本以及分割结果确定语音数据集中的目标语音;通过目标语音确定接待时间段内的接待段数量。本申请通过提取录音数据中的有效录音方法,解决了存在干扰语音导致统计结果不准确的问题。
附图说明
[0018]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0019]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为根据本申请实施例提供的一种可选的接待段数量的统计方法的流程图;
[0021]图2为根据本申请实施例提供的另一种可选的接待段数量的统计方法的流程图;
[0022]图3为根据本申请实施例提供的一种可选的接待段数量的统计装置的框图;
[0023]图4为根据本申请实施例提供的一种可选的电子设备结构示意图。
具体实施方式
[0024]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例
中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
[0026]业务中存在大量语音销售数据,一个重要的需求是从语音数据中提取出来有多少个接待段,接待段是指在一个完整的销售会话中,销售员一般只有一个人,而客户语音可能是一个或者多个,通常业务场景中,只有一个是主客户,其他是陪伴购物人员,此段语音的接待段被认为是一个人,简单化的理解,接待段的数量对应的就是客户的数量。
[0027]传统方式统计出来的接待段和真实值差异比较大,会有很多意向不到的问题,比如:销售录音可能会将附近的销售录音也录进来,导致数据中有冗余;录音数据还有噪声干扰的问题,销售之间的通话需要先进行剔除本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种接待段数量的统计方法,其特征在于,包括:获取在接待时间段内接收到的至少一个语音数据,并将各个所述语音数据组合得到语音数据集;识别所述语音数据集中的会话文本,以及对所述语音数据集进行分割,得到分割结果;根据所述会话文本以及所述分割结果确定所述语音数据集中的目标语音;通过所述目标语音确定所述接待时间段内的接待段数量。2.根据权利要求1所述的方法,其特征在于,所述识别所述语音数据集中的会话文本包括:对所述语音数据集中的各个所述语音数据进行文本识别,获得初始文本;获取与所述初始文本中的字词对应的会话时刻,以确定各个所述字词与所述会话时刻的对应关系;保存所述初始文本与所述对应关系,得到所述会话文本。3.根据权利要求1所述的方法,其特征在于,所述对所述语音数据集进行分割,得到分割结果包括:对所述语音数据集中的各个所述语音数据进行切分,得到多个预设长度的语音片段;提取各个所述语音片段中的声纹向量;组合各个所述声纹向量得到声纹向量矩阵;根据声纹向量矩阵获得相似度矩阵;对所述相似度矩阵中的各个所述语音片段进行聚类,并将聚类结果作为所述分割结果。4.根据权利要求2所述的方法,其特征在于,所述根据所述会话文本以及所述分割结果确定所述语音数据集中的目标语音包括:根据所述分割结果确定所述语音数据集中的无效语音,其中,所述无效语音为不包括第一对象语音的语音;根据所述会话文本确定所述语音数据集中的重复语音,其中,所述重复语音为被不同语音采集设备采集到的相同语音;滤除所述语音数据集中的所述无效语音以及所述重复语音,得到所述目标语音。5.根据权利要求4所述的方法,其特征在于,所述根据所述会话文本确定所述语音数据集中的重复语音包括:按照所述对应关系将所述会话文本中的所述初始文本与所述会话时刻对齐;在同一时间段内存在...

【专利技术属性】
技术研发人员:赵亮姜平雍坤何敏
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1