用户属性的识别方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:32736166 阅读:10 留言:0更新日期:2022-03-20 08:42
本公开涉及一种用户属性的识别方法、装置、电子设备及计算机可读介质,属于语音识别技术领域。该方法包括:获取待识别的通话语音数据,并提取所述通话语音数据对应的特征向量;将所述特征向量输入预先训练的外呼用户分类模型中,得到所述通话语音数据中的外呼用户的性别属性;根据所述外呼用户的性别属性从预先训练的两个接听用户分类模型中确定出目标接听用户分类模型;将所述特征向量输入所述目标接听用户分类模型中,得到所述通话语音数据中的接听用户的性别属性。本公开通过特征提取和模式匹配的方式,可以基于通话语音数据判断通话双方的角色类型和性别属性。通话双方的角色类型和性别属性。通话双方的角色类型和性别属性。

【技术实现步骤摘要】
用户属性的识别方法、装置、电子设备及计算机可读介质


[0001]本公开涉及语音识别
,具体而言,涉及一种用户属性的识别方法、用户属性的识别装置、电子设备及计算机可读介质。

技术介绍

[0002]通信运营商拥有体量庞大的用户数据,具有巨大价值,使用用户数据可以对用户做出全面的画像。但是,由于一些用户属性的准确性不能得到保证,因此可能会导致用户画像的不准确,对于通信运营商来说,可能会影响电话营销的成功率。
[0003]鉴于此,本领域亟需一种能够准确识别用户属性的方法。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的目的在于提供一种用户属性的识别方法、用户属性的识别装置、电子设备及计算机可读介质,进而至少在一定程度上提升用户属性的识别的准确性。
[0006]根据本公开的第一个方面,提供一种用户属性的识别方法,包括:
[0007]获取待识别的通话语音数据,并提取所述通话语音数据对应的特征向量;
[0008]将所述特征向量输入预先训练的外呼用户分类模型中,得到所述通话语音数据中的外呼用户的性别属性;
[0009]根据所述外呼用户的性别属性从预先训练的两个接听用户分类模型中确定出目标接听用户分类模型;
[0010]将所述特征向量输入所述目标接听用户分类模型中,得到所述通话语音数据中的接听用户的性别属性。
[0011]在本公开的一种示例性实施例中,所述提取所述通话语音数据对应的特征向量,包括:
[0012]通过预先训练的语音基础模型对所述通话语音数据中的每个语音帧的属性进行标注,其中,所述语音帧的属性包括男音、女音和静音;
[0013]根据属性为静音的所述语音帧所在的位置,将所述通话语音数据划分为多个语音数据片段;
[0014]根据各个所述语音帧的属性确定各个所述语音数据片段中的男音帧数比或女音帧数比;
[0015]根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量;
[0016]根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量;
[0017]根据所述帧数比分布统计量和所述基音频率分布统计量,得到所述通话语音数据
对应的特征向量。
[0018]在本公开的一种示例性实施例中,所述根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量,包括:
[0019]根据各个所述语音数据片段中的男音帧数比得到所述通话语音数据的男音帧数比数组,或者根据各个所述语音数据片段中的女音帧数比得到所述通话语音数据的女音帧数比数组;
[0020]获取预设的多个帧数比区间范围,根据所述男音帧数比数组和所述帧数比区间范围得到男音帧数比分布统计量,或者根据所述女音帧数比数组和所述帧数比区间范围得到女音帧数比分布统计量;
[0021]将所述男音帧数比分布统计量或者所述女音帧数比分布统计量作为所述通话语音数据的帧数比分布统计量。
[0022]在本公开的一种示例性实施例中,所述根据每个所述语音帧的基音频率确定所述通话语音数据对应的基音频率分布统计量,包括:
[0023]根据预设的有效基音频率区间去除所述通话语音数据中的噪音帧,得到所述通话语音数据中的有效语音帧;
[0024]根据各个所述有效语音帧的基音频率得到所述通话语音数据对应的基音频率数组;
[0025]获取预设的多个基音频率区间范围,并根据所述基音频率数组和所述基音频率区间范围得到所述通话语音数据对应的基音频率分布统计量。
[0026]在本公开的一种示例性实施例中,所述语音基础模型的训练方法包括:
[0027]获取历史通话语音数据,并根据所述历史通话语音数据中语音帧的属性得到男音训练样本、女音训练样本和静音训练样本;
[0028]分别从所述男音训练样本、所述女音训练样本和所述静音训练样本中提取对应的语音特征,并通过所述语音特征训练得到男音基础模型、女音基础模型和静音基础模型。
[0029]在本公开的一种示例性实施例中,所述外呼用户分类模型的训练方法包括:
[0030]获取所述外呼用户分类模型对应的第一语音训练数据,并获取各个所述第一语音训练数据对应的外呼属性;
[0031]确定各个所述第一语音训练数据对应的特征向量,并根据各个所述第一语音训练数据对应的特征向量得到外呼特征向量组;
[0032]根据所述第一语音训练数据对应的外呼属性、所述外呼特征向量组以及预设分类算法训练得到所述外呼用户分类模型。
[0033]在本公开的一种示例性实施例中,所述接听用户分类模型的训练方法包括:
[0034]获取所述接听用户分类模型对应的第二语音训练数据,并获取各个所述第二语音训练数据对应的接听属性;
[0035]确定各个所述第二语音训练数据对应的特征向量,并根据各个所述第二语音训练数据对应的特征向量得到接听特征向量组;
[0036]通过所述外呼用户分类模型将所述接听特征向量组按照外呼属性划分为第一接听特征向量组和第二接听特征向量组;
[0037]根据所述第二语音训练数据对应的接听属性、所述第一接听特征向量组以及预设
分类算法训练得到第一接听用户分类模型;
[0038]根据所述第二语音训练数据对应的接听属性、所述第二接听特征向量组以及预设分类算法训练得到第二接听用户分类模型。
[0039]根据本公开的第二方面,提供一种用户属性的识别装置,包括:
[0040]特征向量获取模块,用于获取待识别的通话语音数据,并提取所述通话语音数据对应的特征向量;
[0041]外呼属性确定模块,用于将所述特征向量输入预先训练的外呼用户分类模型中,得到所述通话语音数据中的外呼用户的性别属性;
[0042]接听模型确定模块,用于根据所述外呼用户的性别属性从预先训练的两个接听用户分类模型中确定出目标接听用户分类模型;
[0043]接听属性确定模块,用于将所述特征向量输入所述目标接听用户分类模型中,得到所述通话语音数据中的接听用户的性别属性。
[0044]根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的用户属性的识别方法。
[0045]根据本公开的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的用户属性的识别方法。
[0046]本公开示例性实施例可以具有以下有益效果:
[0047]本公开示例实施方式的用户属性的识别方法中,通过提取待识别的通话语音数据对应的特征向量,并将特征向量输入外呼用户分类模型中得到通话语音数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户属性的识别方法,其特征在于,包括:获取待识别的通话语音数据,并提取所述通话语音数据对应的特征向量;将所述特征向量输入预先训练的外呼用户分类模型中,得到所述通话语音数据中的外呼用户的性别属性;根据所述外呼用户的性别属性从预先训练的两个接听用户分类模型中确定出目标接听用户分类模型;将所述特征向量输入所述目标接听用户分类模型中,得到所述通话语音数据中的接听用户的性别属性。2.根据权利要求1所述的用户属性的识别方法,其特征在于,所述提取所述通话语音数据对应的特征向量,包括:通过预先训练的语音基础模型对所述通话语音数据中的每个语音帧的属性进行标注,其中,所述语音帧的属性包括男音、女音和静音;根据属性为静音的所述语音帧所在的位置,将所述通话语音数据划分为多个语音数据片段;根据各个所述语音帧的属性确定各个所述语音数据片段中的男音帧数比或女音帧数比;根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量;根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量;根据所述帧数比分布统计量和所述基音频率分布统计量,得到所述通话语音数据对应的特征向量。3.根据权利要求2所述的用户属性的识别方法,其特征在于,所述根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量,包括:根据各个所述语音数据片段中的男音帧数比得到所述通话语音数据的男音帧数比数组,或者根据各个所述语音数据片段中的女音帧数比得到所述通话语音数据的女音帧数比数组;获取预设的多个帧数比区间范围,根据所述男音帧数比数组和所述帧数比区间范围得到男音帧数比分布统计量,或者根据所述女音帧数比数组和所述帧数比区间范围得到女音帧数比分布统计量;将所述男音帧数比分布统计量或者所述女音帧数比分布统计量作为所述通话语音数据的帧数比分布统计量。4.根据权利要求2所述的用户属性的识别方法,其特征在于,所述根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量,包括:根据预设的有效基音频率区间去除所述通话语音数据中的噪音帧,得到所述通话语音数据中的有效语音帧;根据各个所述有效语音帧的基音频率得到所述通话语音数据对应的基音频率数组;获取预设的多个基音频率区间范围,并根据所述基音频率数组和所述基音频率区间范围得到所述通话语音数据对应的基音频率分布统计量。5.根据权利要求2所述的用户属性的识别方法,其特征在于,所述语音基础模型的训练
...

【专利技术属性】
技术研发人员:李婷梁天健陈以松熊杰肖锋刘冬寅邓莉
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1