一种数据分类方法及计算设备技术

技术编号：27878111 阅读：13 留言：0更新日期：2021-03-31 01:02

本发明专利技术公开了一种数据分类方法，在计算设备中执行，包括：获取待分类的数据；将该数据输入预设的多标签分类模型，以便多标签分类模型输出该数据属于每一个类别的概率，其中，多标签分类模型在训练时的损失函数适于提高目标类别的分类准确率；当最大概率对应的类别为目标类别，且最大概率大于等于预设的概率阈值时，将目标类别作为该数据所属的类别。本发明专利技术一并公开了相应的计算设备。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据分类方法及计算设备
本专利技术涉及音频数据处理
，尤其涉及一种数据分类方法及计算设备。
技术介绍
近年来，人工智能技术飞速发展，已被应用到多个领域。分类问题是人工智能算法中的一大类，应用非常广泛。在实际分类问题中，有时会碰到一种场景，即对特定类别的分类准确率要求很高，而不关心其召回率以及其他类别的分类准确率。例如，在智能外呼场景中，智能外呼机器人模拟真人向被叫用户发起语音通话，进行访问、营销等活动。根据智能外呼的语音通话情况，采用分类模型来将用户分为明确有意向、可能有意向、明确无意向三类，对于明确有意向的用户进行人工电话回访，以向这些用户提供定制化的服务。在该场景中，智能外呼服务商更关心筛选出的明确有意向类别的准确率，而不关心有没有漏检明确有意向的用户以及可能有意向、明确无意向类别的准确率。提高明确有意向类别的分类准确率，可以减少不必要的人工电话量，从而提高服务效率。现有的分类模型在分类准确率上对所有类别一视同仁，无法满足提高特定类别分类准确率的需求。
技术实现思路
为此，本专利技术提供一种数据分类方法及计算设备，以力图解决或至少缓解上面存在的问题。根据本专利技术的第一个方面，提供一种数据分类方法，在计算设备中执行，包括：获取待分类的数据；将所述数据输入预设的多标签分类模型，以便所述多标签分类模型输出所述数据属于每一个类别的概率，其中，所述多标签分类模型在训练时的损失函数适于提高目标类别的分类准确率；当最大概率对应的类别为所述目标类别，且所述最大概率大于等于预设的概率...

【技术保护点】
1.一种数据分类方法，在计算设备中执行，包括：/n获取待分类的数据；/n将所述数据输入预设的多标签分类模型，以便所述多标签分类模型输出所述数据属于每一个类别的概率，其中，所述多标签分类模型在训练时的损失函数适于提高目标类别的分类准确率；/n当最大概率对应的类别为所述目标类别，且所述最大概率大于等于预设的概率阈值时，将目标类别作为所述数据所属的类别。/n

【技术特征摘要】
1.一种数据分类方法，在计算设备中执行，包括：
获取待分类的数据；
将所述数据输入预设的多标签分类模型，以便所述多标签分类模型输出所述数据属于每一个类别的概率，其中，所述多标签分类模型在训练时的损失函数适于提高目标类别的分类准确率；
当最大概率对应的类别为所述目标类别，且所述最大概率大于等于预设的概率阈值时，将目标类别作为所述数据所属的类别。

2.如权利要求1所述的方法，其中，所述损失函数适于对训练样本的真实类别标签不是所述目标类别，但所述多标签分类模型输出的类别为所述目标类别的情形进行惩罚。

3.如权利要求1或2所述的方法，其中，所述多标签分类模型的损失函数为：

其中，C为类别的数量；
yj用于表示训练样本的真实类别标签是否为第j个类别，当yj＝1时，表示训练样本的真实类别标签是第j个类别，当yj＝0时，表示训练样本的真实类别标签不是第j个类别；
pj为多标签分类模型输出的训练样本属于第j个类别的概率；
λj为第j个类别的权重，其中，所述目标类别的权重大于其他类别的权重。

4.如权利要求1-3中任一项所述的方法，...

【专利技术属性】
技术研发人员：黄萧，李林，徐丞申，刘荣，
申请(专利权)人：天津车之家数据信息技术有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人