当前位置: 首页 > 专利查询>天津大学专利>正文

基于长尾分布提升语音分类尾部识别准确度的方法技术

技术编号:28035662 阅读:46 留言:0更新日期:2021-04-09 23:17
本发明专利技术公开了一种基于长尾分布提升语音分类尾部识别准确度的方法,针对头部类别在反向传播中计算所得的梯度对于尾部类别的梯度是负影响,设计了一均衡损失函数,该均衡损失函数的设计包括:设置阈值因子、计算阈值函数和计算该均衡损失函数。在语音分类模型训练过程中采用该均衡损失函数,采用该均衡损失函数可以将头部类别在反向传播过程中计算所得的梯度对于尾部类别的影响被忽略掉,通过忽略头部类别对于尾部类别的梯度影响,使得分类结果对于头部类别和尾部类别均衡对待,有效解决了传统损失函数应用在长尾分类问题中对于头部类别的偏差问题,从而提升语音分类模型的整体分类效果。

【技术实现步骤摘要】
基于长尾分布提升语音分类尾部识别准确度的方法
本专利技术属于语音分类领域的损失函数设计领域,特别涉及一种用于处理长尾分布数据的均衡损失函数。
技术介绍
语音分类是当前深度学习领域中一项重要而且具有广泛商业应用价值的领域。但是当前用于模型训练的数据集大多呈现长尾分布,是一种特殊的非对称分布,其中一部分类别包含的数据量非常多,称为头部类别,而相对应的另一部分类别所包含的数据量非常少,称为尾部类别。由于尾部类别所包含的数据相对于头部类别所包含的数据特别少,使用传统的损失函数会引起分类结果偏向于头部类别从而造成总体分类结果的偏差。往往尾部类别所包含的信息又具有不可忽略的意义。传统的损失函数对各个类别进行无差别对待,从而造成整体分类效果偏向于头部类别。分析发现,头部类别在反向传播中计算所得的梯度对于尾部类别的梯度是负影响,从而专利技术了一种均衡损失函数,忽略掉这部分产生负影响的梯度,从而提升模型的总体分类性能。
技术实现思路
本专利技术针对长尾分布数据的不均衡问题以及尾部类别由于数据量不充足导致的特征信息表征能力不足问题,提出一种基于本文档来自技高网...

【技术保护点】
1.一种基于长尾分布提升语音分类尾部识别准确度的方法,其特征在于,针对头部类别在反向传播中计算所得的梯度对于尾部类别的梯度是负影响,设计了一均衡损失函数,在语音分类模型训练过程中采用该均衡损失函数,通过忽略头部类别对于尾部类别的梯度影响,使得分类结果对于头部类别和尾部类别均衡对待,从而提升语音分类模型的整体分类效果。/n

【技术特征摘要】
1.一种基于长尾分布提升语音分类尾部识别准确度的方法,其特征在于,针对头部类别在反向传播中计算所得的梯度对于尾部类别的梯度是负影响,设计了一均衡损失函数,在语音分类模型训练过程中采用该均衡损失函数,通过忽略头部类别对于尾部类别的梯度影响,使得分类结果对于头部类别和尾部类别均衡对待,从而提升语音分类模型的整体分类效果。


2.根据权利要求书1所述的基于长尾分布提升语音分类尾部识别准确度的方法,其特征在于,所述均衡损失函数的设计过程包括:设置阈值因子λ、计算阈值函数Tλ(x)和计算均衡损失函数;其中:
设置阈值因...

【专利技术属性】
技术研发人员:谢宗霞王艳清
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1