【技术实现步骤摘要】
用户属性的识别方法、装置、电子设备及计算机可读介质
[0001]本公开涉及语音识别
,具体而言,涉及一种用户属性的识别方法、用户属性的识别装置、电子设备及计算机可读介质。
技术介绍
[0002]通信运营商拥有体量庞大的用户数据,具有巨大价值,使用用户数据可以对用户做出全面的画像。但是,由于一些用户属性的准确性不能得到保证,因此可能会导致用户画像的不准确,对于通信运营商来说,可能会影响电话营销的成功率。
[0003]鉴于此,本领域亟需一种能够准确识别用户属性的方法。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0005]本公开的目的在于提供一种用户属性的识别方法、用户属性的识别装置、电子设备及计算机可读介质,进而至少在一定程度上提升用户属性的识别的准确性。
[0006]根据本公开的第一个方面,提供一种用户属性的识别方法,包括:
[0007]获取待识别的通话 ...
【技术保护点】
【技术特征摘要】
1.一种用户属性的识别方法,其特征在于,包括:获取待识别的通话语音数据,并提取所述通话语音数据对应的特征向量;将所述特征向量输入预先训练的外呼用户分类模型中,得到所述通话语音数据中的外呼用户的性别属性;根据所述外呼用户的性别属性从预先训练的两个接听用户分类模型中确定出目标接听用户分类模型;将所述特征向量输入所述目标接听用户分类模型中,得到所述通话语音数据中的接听用户的性别属性。2.根据权利要求1所述的用户属性的识别方法,其特征在于,所述提取所述通话语音数据对应的特征向量,包括:通过预先训练的语音基础模型对所述通话语音数据中的每个语音帧的属性进行标注,其中,所述语音帧的属性包括男音、女音和静音;根据属性为静音的所述语音帧所在的位置,将所述通话语音数据划分为多个语音数据片段;根据各个所述语音帧的属性确定各个所述语音数据片段中的男音帧数比或女音帧数比;根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量;根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量;根据所述帧数比分布统计量和所述基音频率分布统计量,得到所述通话语音数据对应的特征向量。3.根据权利要求2所述的用户属性的识别方法,其特征在于,所述根据各个所述语音数据片段中的男音帧数比或女音帧数比得到所述通话语音数据的帧数比分布统计量,包括:根据各个所述语音数据片段中的男音帧数比得到所述通话语音数据的男音帧数比数组,或者根据各个所述语音数据片段中的女音帧数比得到所述通话语音数据的女音帧数比数组;获取预设的多个帧数比区间范围,根据所述男音帧数比数组和所述帧数比区间范围得到男音帧数比分布统计量,或者根据所述女音帧数比数组和所述帧数比区间范围得到女音帧数比分布统计量;将所述男音帧数比分布统计量或者所述女音帧数比分布统计量作为所述通话语音数据的帧数比分布统计量。4.根据权利要求2所述的用户属性的识别方法,其特征在于,所述根据各个所述语音帧对应的基音频率确定所述通话语音数据的基音频率分布统计量,包括:根据预设的有效基音频率区间去除所述通话语音数据中的噪音帧,得到所述通话语音数据中的有效语音帧;根据各个所述有效语音帧的基音频率得到所述通话语音数据对应的基音频率数组;获取预设的多个基音频率区间范围,并根据所述基音频率数组和所述基音频率区间范围得到所述通话语音数据对应的基音频率分布统计量。5.根据权利要求2所述的用户属性的识别方法,其特征在于,所述语音基础模型的训练
...
【专利技术属性】
技术研发人员:李婷,梁天健,陈以松,熊杰,肖锋,刘冬寅,邓莉,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。