音频切分方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36702241 阅读:9 留言:0更新日期:2023-03-01 09:20
本发明专利技术提供一种音频切分方法、装置、电子设备和存储介质,其中方法包括:确定待切分的双声道音频;分别对双声道音频中的第一声道音频和第二声道音频进行静音段标注,得到第一声道音频中的静音段和第二声道音频中的静音段;基于第一声道音频中的静音段和第二声道音频中的静音段,确定双声道音频中的共性静音分隔点,并基于共性静音分隔点,对第一声道音频进行切分,得到多个第一切分音频段;对各第一切分音频段进行静音段切除,得到各第二切分音频段,基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频,克服了定时切分无法区分客户的缺陷,实现了以客户为单位的音频切分,为不同的服务质检和服务评价提供了助力。价提供了助力。价提供了助力。

【技术实现步骤摘要】
音频切分方法、装置、电子设备和存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种音频切分方法、装置、电子设备和存储介质。

技术介绍

[0002]为了能够对营业厅工作人员的服务进行质检和评价,通常需对营业厅音频进行切分,而考虑到不同客户所办理的业务可能不同,且不同业务对接的工作人员也不同,因此需将营业厅音频按照客户办理业务的顺序进行切分,以实现不同业务对应工作人员的服务质检和评价。
[0003]目前,针对于营业厅音频的切分方案,多是使用拾音硬件进行定时切分和音频上传,而无法按照办理客户进行音频切分,难以区分客户,成效不高,无法实现不同业务对应工作人员的服务质检和评价。

技术实现思路

[0004]本专利技术提供一种音频切分方法、装置、电子设备和存储介质,用以解决现有技术中仅能进行定时切分,而无法区分音频对应的客户,以致切分方法的成效不高的缺陷,实现了以客户为单位的音频切分。
[0005]本专利技术提供一种音频切分方法,包括:
[0006]确定待切分的双声道音频;
[0007]分别对所述双声道音频中的第一声道音频和第二声道音频进行静音段标注,得到所述第一声道音频中的静音段和所述第二声道音频中的静音段;
[0008]基于所述第一声道音频中的静音段和所述第二声道音频中的静音段,确定所述双声道音频中的共性静音分隔点,并基于所述共性静音分隔点,对所述第一声道音频进行切分,得到多个第一切分音频段;
[0009]对各第一切分音频段进行静音段切除,得到各第二切分音频段,基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频。
[0010]根据本专利技术提供的一种音频切分方法,所述基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频,包括:
[0011]按照各第二切分音频段在所述第一声道音频中的顺序进行组合,得到客户组合音频;
[0012]基于所述客户组合音频中相邻的第二切分音频段的声纹特征之间的相似度,确定所述客户组合音频中的疑似音频端点;
[0013]基于所述客户组合音频中相邻的疑似音频端点之间的音频时长,以及预设噪音时长,对所述疑似音频端点进行过滤,得到客户音频端点,并基于所述客户音频端点确定以客户为单位的客户音频。
[0014]根据本专利技术提供的一种音频切分方法,所述基于所述客户组合音频中相邻的第二
切分音频段的声纹特征之间的相似度,确定所述客户组合音频中的疑似音频端点,包括:
[0015]若所述客户组合音频中两个相邻的第二切分音频段的声纹特征之间的相似度小于预设相似度,则将两个相邻的第二切分音频段的音频组合点作为所述客户组合音频的候选音频端点;
[0016]否则,将两个相邻的第二切分音频段的音频组合点作为所述客户组合音频的非候选音频端点;
[0017]基于所述客户组合音频中相邻的非候选音频端点对应的第二切分音频段的声纹特征之间的相似度,以及预设相似度,对所述候选音频端点进行过滤,得到所述疑似音频端点。
[0018]根据本专利技术提供的一种音频切分方法,所述分别对所述双声道音频中的第一声道音频和第二声道音频进行静音段标注,得到所述第一声道音频中的静音段和所述第二声道音频中的静音段,包括:
[0019]确定所述第一声道音频和所述第二声道音频中各音频帧的帧能量,基于所述各音频帧的帧能量,以及能量门限值,确定所述各音频帧的静音检测状态,所述能量门限值基于对应声道音频确定;
[0020]基于所述第一声道音频和所述第二声道音频中音频窗包含的音频帧数,以及所述各音频帧的静音检测状态,确定所述第一声道音频中的静音段和所述第二声道音频中的静音段。
[0021]根据本专利技术提供的一种音频切分方法,所述基于所述第一声道音频中的静音段和所述第二声道音频中的静音段,确定所述双声道音频中的共性静音分隔点,包括:
[0022]确定所述第一声道音频中静音段的静音端点,以及所述第二声道音频中静音段的静音端点;
[0023]从所述第一声道音频中静音段的静音端点,以及所述第二声道音频中静音段的静音端点中,选取共性静音端点,所述共性静音端点在所述第一声道音频和所述第二声道音频中对应的音频帧均处于静音段内;
[0024]基于所述共性静音端点在对应声道音频中静音段的静音时长,以及预设静音时长,对所述共性静音端点进行过滤,得到共性静音分隔点。
[0025]根据本专利技术提供的一种音频切分方法,所述对各第一切分音频段进行静音段切除,得到各第二切分音频段,包括:
[0026]对各第一切分音频段进行静音段切除,得到各静音切除音频段;
[0027]基于所述各静音切除音频段的音频时长,以及预设音频时长进行音频过滤,得到各第二切分音频段。
[0028]根据本专利技术提供的一种音频切分方法,所述基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频,之后还包括:
[0029]基于所述第二声道音频,确定标准音频端点;
[0030]基于所述标准音频端点和所述客户音频,确定音频切分正确率;
[0031]基于所述音频切分正确率,调整客户音频端点。
[0032]本专利技术还提供一种音频切分装置,包括:
[0033]音频确定单元,用于确定待切分的双声道音频;
[0034]静音标注单元,用于分别对所述双声道音频中的第一声道音频和第二声道音频进行静音段标注,得到所述第一声道音频中的静音段和所述第二声道音频中的静音段;
[0035]音频切分单元,用于基于所述第一声道音频中的静音段和所述第二声道音频中的静音段,确定所述双声道音频中的共性静音分隔点,并基于所述共性静音分隔点,对所述第一声道音频进行切分,得到多个第一切分音频段;
[0036]客户音频确定单元,用于对各第一切分音频段进行静音段切除,得到各第二切分音频段,基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频。
[0037]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的音频切分方法。
[0038]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的音频切分方法。
[0039]本专利技术提供的音频切分方法、装置、电子设备和存储介质,通过静音段标注所得的第一声道音频中的静音段和第二声道音频中的静音段,确定双声道音频中的共性静音分隔点,并利用共性静音分隔点,对第一声道音频进行切分,切除切分所得的多个第一切分音频段中的静音段,得到各第二切分音频段,基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频,克服了传统方案中仅能进行定时切分,而无法区分音频对应的客户,以致切分方法的成效不高的缺陷,实现了以客户为单位的音频切分,为不同的服务质检和服务评价提供了助力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频切分方法,其特征在于,包括:确定待切分的双声道音频;分别对所述双声道音频中的第一声道音频和第二声道音频进行静音段标注,得到所述第一声道音频中的静音段和所述第二声道音频中的静音段;基于所述第一声道音频中的静音段和所述第二声道音频中的静音段,确定所述双声道音频中的共性静音分隔点,并基于所述共性静音分隔点,对所述第一声道音频进行切分,得到多个第一切分音频段;对各第一切分音频段进行静音段切除,得到各第二切分音频段,基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频。2.根据权利要求1所述的音频切分方法,其特征在于,所述基于各第二切分音频段的声纹特征进行客户音频组合,得到以客户为单位的客户音频,包括:按照各第二切分音频段在所述第一声道音频中的顺序进行组合,得到客户组合音频;基于所述客户组合音频中相邻的第二切分音频段的声纹特征之间的相似度,确定所述客户组合音频中的疑似音频端点;基于所述客户组合音频中相邻的疑似音频端点之间的音频时长,以及预设噪音时长,对所述疑似音频端点进行过滤,得到客户音频端点,并基于所述客户音频端点确定以客户为单位的客户音频。3.根据权利要求2所述的音频切分方法,其特征在于,所述基于所述客户组合音频中相邻的第二切分音频段的声纹特征之间的相似度,确定所述客户组合音频中的疑似音频端点,包括:若所述客户组合音频中两个相邻的第二切分音频段的声纹特征之间的相似度小于预设相似度,则将两个相邻的第二切分音频段的音频组合点作为所述客户组合音频的候选音频端点;否则,将两个相邻的第二切分音频段的音频组合点作为所述客户组合音频的非候选音频端点;基于所述客户组合音频中相邻的非候选音频端点对应的第二切分音频段的声纹特征之间的相似度,以及预设相似度,对所述候选音频端点进行过滤,得到所述疑似音频端点。4.根据权利要求1至3中任一项所述的音频切分方法,其特征在于,所述分别对所述双声道音频中的第一声道音频和第二声道音频进行静音段标注,得到所述第一声道音频中的静音段和所述第二声道音频中的静音段,包括:确定所述第一声道音频和所述第二声道音频中各音频帧的帧能量,基于所述各音频帧的帧能量,以及能量门限值,确定所述各音频帧的静音检测状态,所述能量门限值基于对应声道音频确定;基于所述第一声道音频和所述第二声道音频中音频窗包含的音频帧数,以及所述各音频帧的静音检测状态,确定所述第一声道音频中的静音段和所述第二声道音频...

【专利技术属性】
技术研发人员:唐文涛陈凯利刘晓苓樊红林马瑜苟玉鹏刘东杨俊逸黄敬
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1