【技术实现步骤摘要】
声纹识别的方法、装置、电子设备和计算机可读介质
[0001]本专利技术公开的实施例涉及计算机
,具体涉及用于声纹识别的方法、装置、电子设备和计算机可读介质。
技术介绍
[0002]声纹识别作为生物识别技术的一种,也称为说话人验证。说话人验证的任务通常是通过评估注册与测试话语之间的相似度来决定是否接受说话者的身份信息。
[0003]现有的说话人验证方法通常有两个步骤。第一步为提取说话者信息,即说话人嵌入向量,其目的是从可变长度话语中提取固定长度向量。第二步为评分,旨在计算说话人嵌入向量之间的相似度。这些方法往往需要大量的样本支撑,并且识别结果的精度较差。
技术实现思路
[0004]本专利技术公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本专利技术公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]本专利技术公开的一些实施例提出了用于声纹识别的方法、装置、电子设备和计算机可读介质 ...
【技术保护点】
【技术特征摘要】
1.一种用于声纹识别的方法,包括:S201,获取目标语音特征;S202,提取所述目标语音特征的帧级别语音特征;S203,利用注意力池化网络,对所述帧级别语音特征进行过滤,得到第一目标特征;S204,对所述第一目标特征进行整合,得到第二目标特征;S205,基于所述第二目标特征、交叉熵函数和目标特征库,生成所述目标语音特征对应的识别结果。2.根据权利要求1所述的方法,其中,所述对所述第一目标特征进行整合得到第二目标特征的步骤包括:将所述第一目标特征输入到至少两层全连接层,得到所述第二目标特征。3.根据权利要求1所述的方法,其中,所述提取所述目标语音特征的帧级别语音特征的步骤包括:将所述目标语音特征输入到至少一层卷积神经网络,得到所述帧级别语音特征。4.根据权利要求3所述的方法,其中,所述至少一层卷积神经网络中的每层卷积神经网络是由稠密连接的至少一层残差网络所构成的卷积神经网络。5.根据权利要求3
‑
4之一所述的方法,其中,所述至少一层卷积神经网络中的每层卷积神经网络包括至少一层瓶颈层。6.根据权利要求1
‑
5之一所...
【专利技术属性】
技术研发人员:孔天龙,宋丹丹,欧阳鹏,尹首一,
申请(专利权)人:北京清微智能信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。