说话人日志生成方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号:33353259 阅读:38 留言:0更新日期:2022-05-08 10:03
本发明专利技术实施例提供了一种说话人日志生成方法、装置、计算机设备及可读存储介质,涉及语音检测领域。本发明专利技术实施例提供的方法,首先,获取语音信号对应的相似度矩阵;然后,根据第一预设参数和相似度矩阵,确定目标聚类矩阵和说话人数量,其中,目标聚类矩阵由相似度矩阵经锐化处理得到,第一预设参数约束锐化处理的过程,在第一预设参数的约束下得到的目标聚类矩阵满足预设聚类条件;接着,根据说话人数量对目标聚类矩阵进行聚类,得到说话人标签;最后,根据说话人标签对语音信号进行分割,生成说话人日志,从而避免了背景噪音以及“未知说话人数量”的情况影响聚类得到的说话人标签的准确度,进而提高了说话人日志的精度。进而提高了说话人日志的精度。进而提高了说话人日志的精度。

【技术实现步骤摘要】
说话人日志生成方法、装置、计算机设备及可读存储介质


[0001]本专利技术涉及语音检测领域,具体而言,涉及一种说话人日志生成方法、装置、计算机设备及可读存储介质。

技术介绍

[0002]说话人日志是语音检测领域中的一个常见任务,与语音识别任务的判断

when says what

不同,说话人日志任务需要判断

who says when

。说话人日志将一段语音信号中的多个说话人的说话片段进行区分,它的精度是很多语音检测领域的任务是否能够成功进行的前提。例如单通道的客服/客户录音质检任务,首先需要识别出客服的语音片段,然后对语音片段的内容进行识别,最后再进行违规判断。现有的说话人日志生成技术是直接对基于语音信号生成的相似度矩阵进行聚类来获取说话人标签,再利用说话人标签对语音信号进行分割,得到相应的说话人日志,受背景噪音以及“未知说话人数量”情况的影响,通过聚类得到的说话人标签的准确度较差,进而影响说话人日志的精度。

技术实现思路

[0003]为了克服现有技术的不足,本专利技术实施例提供了一种说话人日志生成方法、装置、计算机设备及可读存储介质,具体方案如下:
[0004]第一方面,本专利技术实施例提供了一种说明人日志生成方法,所述方法包括:
[0005]获取语音信号对应的相似度矩阵;
[0006]根据第一预设参数和所述相似度矩阵,确定目标聚类矩阵和说话人数量,其中,所述目标聚类矩阵由所述相似度矩阵经锐化处理得到,所述第一预设参数约束锐化处理的过程,在所述第一预设参数的约束下得到的所述目标聚类矩阵满足预设聚类条件;
[0007]根据所述说话人数量对所述目标聚类矩阵进行聚类,得到说话人标签;
[0008]根据所述说话人标签对所述语音信号进行分割,生成说话人日志。
[0009]在一种可能的实现方式中,所述获取语音信号对应的相似度矩阵的步骤包括:
[0010]将所述语音信号划分为多个语音片段;
[0011]将每一所述语音片段输入声纹检测模型,得到每一所述语音片段对应的说话人特征向量;
[0012]根据所有所述说话人特征向量,得到所述语言信号对应的相似度矩阵。
[0013]在一种可能的实现方式中,所述根据所有所述说话人特征向量,得到所述语言信号对应的相似度矩阵的步骤包括:
[0014]计算每一所述说话人特征向量与其他所述说话人特征向量之间的相似性系数;
[0015]根据所有所述相似性系数,得到所述语言信号对应的相似度矩阵。
[0016]在一种可能的实现方式中,所述根据第一预设参数和所述相似度矩阵,确定目标聚类矩阵和说话人数量的步骤包括:
[0017]利用多个第二预设参数分别约束所述相似度矩阵的锐化处理过程,得到多个待定
聚类矩阵,所述第二预设参数由所述相似度矩阵的维度确定;
[0018]根据经二值化和对称化处理后的每一所述待定聚类矩阵对应的拉普拉斯矩阵的特征值,从多个所述待定聚类矩阵中确定目标聚类矩阵,并将所述目标聚类矩阵对应的第二预设参数作为所述第一预设参数;
[0019]根据经二值化和对称化处理后的所述目标聚类矩阵对应的拉普拉斯矩阵的特征值,确定所述说话人数量。
[0020]在一种可能的实现方式中,所述根据经二值化和对称化处理后的每一所述待定聚类矩阵对应的拉普拉斯矩阵的特征值,从所有所述待定聚类矩阵中确定目标聚类矩阵的步骤包括:
[0021]针对每一所述待定聚类矩阵,对由其确定的特征值进行差分处理,得到该待定聚类矩阵对应的最大特征值差值,所述最大特征值差值表征该待定聚类矩阵的聚类容易度;
[0022]根据每一所述待定聚类矩阵对应的第二预设参数和最大特征值差值,从多个所述待定聚类矩阵中确定目标聚类矩阵。
[0023]在一种可能的实现方式中,所述根据每一所述待定聚类矩阵对应的第二预设参数和最大特征值差值,从多个所述待定聚类矩阵中确定目标聚类矩阵的步骤包括:
[0024]针对每一所述待定聚类矩阵,计算其对应的所述第二预设参数与所述最大特征值差值的比值;
[0025]将具有最小比值的所述待定聚类矩阵作为所述目标聚类矩阵。
[0026]在一种可能的实现方式中,所述根据所述说话人标签对所述语音信号进行分割,生成说话人日志的步骤包括:
[0027]根据所述说话人标签训练说话人识别模型;
[0028]将所述语音信号输入所述说话人识别模型,得到所述说话人日志。
[0029]第二方面,本专利技术实施例提供了一种说明人日志生成装置,所述装置包括:
[0030]获取模块,用于获取语音信号对应的相似度矩阵;
[0031]确定模块,根据第一预设参数和所述相似度矩阵,确定目标聚类矩阵和说话人数量,其中,所述目标聚类矩阵由所述相似度矩阵经锐化处理得到,所述第一预设参数约束锐化处理的过程,在所述第一预设参数的约束下得到的所述目标聚类矩阵满足预设聚类条件;
[0032]聚类模块,用于根据所述说话人数量对所述目标聚类矩阵进行聚类,得到说话人标签;
[0033]生成模块,用于根据所述说话人标签对所述语音信号进行分割,生成说话人日志。
[0034]第三方面,本专利技术实施例提供了一种计算机设备,该计算机设备包括:存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于在调用所述计算机程序时执行如第一方面所述的说话人日志生成方法。
[0035]第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的说话人日志生成方法。
[0036]相较于现有技术,本专利技术实施例提供的一种说话人日志生成方法、装置、计算机设备及可读存储介质,首先,获取语音信号对应的相似度矩阵;然后,根据第一预设参数和相似度矩阵,确定目标聚类矩阵和说话人数量,其中,目标聚类矩阵由相似度矩阵经锐化处理
得到,第一预设参数约束锐化处理的过程,在第一预设参数的约束下得到的目标聚类矩阵满足预设聚类条件;接着,根据说话人数量对目标聚类矩阵进行聚类,得到说话人标签;最后,根据说话人标签对语音信号进行分割,生成说话人日志。由于本专利技术实施例利用第一预设参数对相似度矩阵的锐化处理过程进行约束,得到满足预设聚类条件的目标聚类矩阵,再对目标聚类矩阵进行聚类,从而避免了背景噪音以及“未知说话人数量”的情况影响聚类得到的说话人标签的准确度,进而提高了说话人日志的精度。
附图说明
[0037]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0038]图1为本专利技术实施例提供的一种说话人日志实例示意图;
[0039]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种说明人日志生成方法,其特征在于,所述方法包括:获取语音信号对应的相似度矩阵;根据第一预设参数和所述相似度矩阵,确定目标聚类矩阵和说话人数量,其中,所述目标聚类矩阵由所述相似度矩阵经锐化处理得到,所述第一预设参数约束锐化处理的过程,在所述第一预设参数的约束下得到的所述目标聚类矩阵满足预设聚类条件;根据所述说话人数量对所述目标聚类矩阵进行聚类,得到说话人标签;根据所述说话人标签对所述语音信号进行分割,生成说话人日志。2.如权利要求1所述的方法,其特征在于,所述获取语音信号对应的相似度矩阵的步骤包括:将所述语音信号划分为多个语音片段;将每一所述语音片段输入声纹检测模型,得到每一所述语音片段对应的说话人特征向量;根据所有所述说话人特征向量,得到所述语言信号对应的相似度矩阵。3.如权利要求2所述的方法,其特征在于,所述根据所有所述说话人特征向量,得到所述语言信号对应的相似度矩阵的步骤包括:计算每一所述说话人特征向量与其他所述说话人特征向量之间的相似性系数;根据所有所述相似性系数,得到所述语言信号对应的相似度矩阵。4.如权利要求1所述的方法,其特征在于,所述根据第一预设参数和所述相似度矩阵,确定目标聚类矩阵和说话人数量的步骤包括:利用多个第二预设参数分别约束所述相似度矩阵的锐化处理过程,得到多个待定聚类矩阵,所述第二预设参数由所述相似度矩阵的维度确定;根据经二值化和对称化处理后的每一所述待定聚类矩阵对应的拉普拉斯矩阵的特征值,从多个所述待定聚类矩阵中确定目标聚类矩阵,并将所述目标聚类矩阵对应的第二预设参数作为所述第一预设参数;根据经二值化和对称化处理后的所述目标聚类矩阵对应的拉普拉斯矩阵的特征值,确定所述说话人数量。5.如权利要求4所述的方法,其特征在于,所述根据经二值化和对称化处理后的每一所述待定聚类矩阵对应的拉普拉斯矩阵的特征值,从所有所述待定聚类矩阵中确定目标聚类矩阵的步骤...

【专利技术属性】
技术研发人员:吕翔印晶晶卢恒
申请(专利权)人:上海喜马拉雅科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1