电话信道数据快速提取方法、装置及计算机可读存储介质制造方法及图纸

技术编号:33084566 阅读:13 留言:0更新日期:2022-04-15 10:45
本发明专利技术涉及人计算机技术领域,提供了一种电话信道数据快速提取方法,包含步骤:获取待提取信道数据中的有效音频,其中所述待提取信道数据为至少两人通话过程中采集到的信道数据;将所述有效音频分割为若干片段;通过比对相邻所述片段的声纹特征,确定出属于第一说话人的片段以及说话人变更片段;根据所述第一说话人的片段以及所述变更片段,对所述有效音频中属于所述第一说话人的片段进行聚类,得到所述第一说话人的有效音频。基于本发明专利技术实施例所提供的方法可自动快速提取出说话人的有效音频,无需依赖人工,节省了成本且提升数据采集效率。此外,还提供了一种电话信道数据快速提取装置及计算机可读存储介质。取装置及计算机可读存储介质。取装置及计算机可读存储介质。

【技术实现步骤摘要】
电话信道数据快速提取方法、装置及计算机可读存储介质


[0001]本申请涉及计算机信息
,尤其涉及一种电话信道数据快速提取方法、装置及计算机可读存储介质。

技术介绍

[0002]人工智能领域通常需要大量的数据来支撑,例如训练样本、输入层数据等,都需要进行包含采集、清洗、分类、标记、构建等预处理,这些预处理工作主要靠人工来实现,因此无论是算法模型的训练还是模型应用所需的数据,都需要投入大量的人力成本,且比较耗时。
[0003]人工智能技术在电话通话的应用中同样会遇到类似的问题,电话信道数据主要分为两大类:一种为双声道数据,两个声道分别存放打电话两端的说话人的音频,另一种是单声道数据,两个说话人的音频都放在同一个信道中。在双人通话的场景下,针对第一种情况可以直接通过声道分离提取出两个说话人的音频数据,但针对第二种情况目前只能采用人工手动标记的方式,将音频进行分割、识别再合成的方式来实现不同说话人音频数据的采集,并且单声道数据在实际应用中占有很大的比例,如何实现对单声道数据中各说话人的音频数据的快速提取,是亟待解决的问题。

技术实现思路

[0004]针对上述问题,本申请的实施例提供了一种电话信道数据快速提取方法,所述方法包含步骤:获取待提取信道数据中的有效音频,其中所述待提取信道数据为至少两人通话过程中采集到的信道数据;将所述有效音频分割为若干片段;通过比对相邻所述片段的声纹特征,确定出属于第一说话人的片段以及说话人变更片段;根据所述第一说话人的片段以及所述变更片段,对所述有效音频中属于所述第一说话人的片段进行聚类,得到所述第一说话人的有效音频。
[0005]在一实施中,所述将所述有效音频分割为若干片段包含基于数据长度或时间长度对所述有效音频依次分割,得到固定长度的各个所述片段。
[0006]在一实施中,相邻两个所述片段中包含部分相同数据。
[0007]在一实施中,所述通过比对相邻两个所述片段的声纹特征,确定出属于第一说话人的片段以及说话人变更片段包含:确定所述第一说话人的声纹特征;基于声纹识别模型依次对各个所述片段进行识别,得到各所述的片段的声纹特征;滑动比对前后相邻的两个所述片段的声纹特征,确定该两个所述片段是否属于同一说话人,以确定各个所述片段中属于所述第一说话人的片段以及不属于所述第一说话人的片段;将所述不属于第一说话人的片段确定为说话人变更片段。
[0008]在一实施中,所述确定所述第一说话人的声纹特征包含:预先收集所述第一说话人的语音音频,基于所述声纹识别模型对所述语音音频进行计算,得到所述第一说话人的声纹特征;或者,将所述有效音频中的第一个片段对应的声纹特征确定为所述第一说话人
的声纹特征。
[0009]在一实施中,所述根据所述第一说话人的片段以及所述变更片段,对所述有效音频中属于所述第一说话人的片段进行聚类,得到所述第一说话人的有效音频包含:按顺序从所述第一说话人的片段中确定出连续的N个片段,作为基础聚类片段;从所述基础聚类片段的最后位置往后依次获取其他片段,作为新聚类片段,直到所述基础聚类片段与所述新聚类片段中变更片段的占比超过预设比例为止;对所述基础聚类片段和所述新聚类片段进行聚类,得到所述第一说话人的有效音频。
[0010]在一实施中,所述方法还包含将所述变更片段确定为属于第二说话人的片段,对所述第二说话人的片段进行聚类,得到所述第二说话人的有效音频。
[0011]在一实施中,所述所述方法还包含:将所述变更片段确定为属于其他说话人的片段;获取其他说话人的声纹特征;确定各个片段所属的说话人;分别对各个所述说话人的片段进行聚类,得到各个说话人的有效音频。
[0012]基于同样的专利技术构思,本申请还提供了一种电话信道数据快速提取装置,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例所提供的电话信道数据快速提取方法。
[0013]此外,本申请另提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述实施例所提供的电话信道数据快速提取方法。
[0014]基于本申请实施例所提供的电话信道数据快速提取方法、装置及计算机可读存储介质,可实现对电话信道数据的自动快速提取,无需人工介入,显著提升了数据提取效率。
附图说明
[0015]一个或多个实施方式通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施方式的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
[0016]图1绘示本申请实施例一所提供的电话信道数据快速提取方法流程图;
[0017]图2绘示本申请实施例一所提供方法中有效音频分割过程示意图;
[0018]图3绘示本申请实施例一中步骤S103的实施方法;
[0019]图4绘示本申请实施例一中滑动比对过程示意图;
[0020]图5绘示本申请实施例二所提供的电话信道数据快速提取方法流程图。
具体实施方式
[0021]为使本申请实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
[0022]在本申请实施例中所提供的电话信道数据快速提取方法,通过对电话信道数据进行有效音频提取,以初步过滤非人声噪声数据,通过将有效音频分割为片段,并对片段识
别,确定出属于第一说话人的片段和变更片段,进而根据第一说话人的片段以及变更片段,对有效音频中属于第一说话人的片段进行聚类,得到第一说话人的有效音频,整个过程无需人工介入,可自动快速完成,在提取属于说话人的有效音频过滤了干扰数据,使得最终提取出的音频数据更加准确。以下将结合具体的应用场景,对本申请实施例进行详细说明。
[0023]实施例一
[0024]在本实施例中,待提取信道数据中的说话人为第一说话人和第二说话人,基于本实施例所提供的方法,可分别将属于第一说话人和第二说话人的音频进行快速有效的提取。具体请参考图1,图1绘示本申请实施例一所提供的电话信道数据快速提取方法流程图。如图1所示,所述方法包含步骤:
[0025]S101,获取待提取信道数据中的有效音频。
[0026]具体而言,待提取信道数据可以为两人通话过程中采集到的单声道信道数据。在本实施例中,可VAD(Voice Activity Detection,语音活动检测)技术对数据清洗,保留有效音频,其中,有效音频是指有包含语音的音频数据,可以理解的是电话通话过程中,通常会存在背景音、静默音等非语音音频数据被一并收集,该些音频数据会成为人声本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电话信道数据快速提取方法,其特征在于,所述方法包含步骤:获取待提取信道数据中的有效音频,其中所述待提取信道数据为至少两人通话过程中采集到的信道数据;将所述有效音频分割为若干片段;通过比对相邻所述片段的声纹特征,确定出属于第一说话人的片段以及说话人变更片段;根据所述第一说话人的片段以及所述变更片段,对所述有效音频中属于所述第一说话人的片段进行聚类,得到所述第一说话人的有效音频。2.如权利要求1所述的电话信道数据快速提取方法,其特征在于,所述将所述有效音频分割为若干片段包含基于数据长度或时间长度对所述有效音频依次分割,得到固定长度的各个所述片段。3.如权利要求2所述的电话信道数据快速提取方法,其特征在于,相邻两个所述片段中包含部分相同数据。4.如权利要求1所述的电话信道数据快速提取方法,其特征在于,所述通过比对相邻两个所述片段的声纹特征,确定出属于第一说话人的片段以及说话人变更片段包含:确定所述第一说话人的声纹特征;基于声纹识别模型依次对各个所述片段进行识别,得到各所述的片段的声纹特征;滑动比对前后相邻的两个所述片段的声纹特征,确定该两个所述片段是否属于同一说话人,以确定各个所述片段中属于所述第一说话人的片段以及不属于所述第一说话人的片段;将所述不属于第一说话人的片段确定为说话人变更片段。5.如权利要求4所述的电话信道数据快速提取方法,其特征在于,所述确定所述第一说话人的声纹特征包含:预先收集所述第一说话人的语音音频,基于所述声纹识别模型对所述语音音频进行计算,得到所述第一说话人的声纹特征;或者,将所述有效音频中的第一个片段对应的声纹特征确定为...

【专利技术属性】
技术研发人员:刘焕玉肖龙源李稀敏叶志坚
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1