一种面向深度学习的数据去偏方法技术

技术编号：33372836 阅读：26 留言：0更新日期：2022-05-11 22:39

本发明专利技术公开了一种面向深度学习的数据去偏方法，首先构建原始样本数据集，并对原始数据集进行预处理。再构建并训练用于消除偏见的对抗式生成网络模型，并计算对抗网络模型的损失函数。然后训练对抗网络模型，学习原始样本数据集中与敏感性相关的偏见信息。再构建权重矩阵，利用权重矩阵针对学习到的偏见信息相关程度赋予不同的权重以消除偏见信息，得到已经经过偏见消除的数据集，并且将该已经消除偏见的数据集用于后续的训练过程，以提高后续深度学习模型分类的准确性。本发明专利技术方法使得输入的原始样本数据集中与敏感属性有关的偏见信息被消除以提高分类结果的公平性，同时也保证了分类主任务的精度不会受到显著影响。分类主任务的精度不会受到显著影响。分类主任务的精度不会受到显著影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向深度学习的数据去偏方法

[0001]本专利技术属于深度学习领域，具体涉及一种基于面向深度学习的数据去偏方法。

技术介绍

[0002]深度学习技术以及使用深度学习技术搭建的人工智能模型具备比较强的自主学习能力，将具备这种能力的产品落地也即使用了深度学习技术的人工智能模型，各种人工智能落地项目帮助人们在生产生活中做出多样化以及复杂化的决策，并且将很多人力无法完成的问题简单化，因此人工智能技术也广泛应用于人们生产生活的方方面面，比如智慧医疗、自然语言处理、图像识别、广告精准投放、信贷发放决策、智慧教育以及刑事司法领域等，并且人工智能技术在这些领域也发挥了良好的效果，带来了良好的经济效益和社会效益。随着研究人员的研究不断深入，以及针对人工智能技术的不断创新，使得深度学习模型的性能不断提高同时算法复杂度不断下降，以深度学习为代表的人工智能技术已经逐步渗透进人们生活的方方面面。
[0003]然而最新的研究表明，虽然应用深度学习技术可以帮助人们获得更为精准的预测和分类结果以及为决策提供强有力的技术支撑，但是，深度学习模型在...

【技术保护点】

【技术特征摘要】
1.一种面向深度学习的数据去偏方法，其特征在于，包括以下步骤：(1)获取原始数据，并对原始数据包含的类别属性进行标记；根据标记的类别属性得到原始样本数据集；(2)构建用于偏见消除的对抗网络模型，并计算对抗网络模型的损失函数；(3)训练步骤(2)构建的对抗网络模型，利用步骤(2)计算的损失函数通过对抗式的训练不断进行迭代，学习原始样本数据集中与敏感属性相关的偏见信息；(4)将步骤(3)生成的去偏数据集输入对抗网络模型进行分类训练；(5)构建权重矩阵，根据步骤(3)中的训练结果利用权重矩阵针对学习到的偏见信息相关程度赋予不同的权重以消除偏见信息；(6)以权重矩阵的形式导出已经经过偏见消除的数据集，并且将该已经消除偏见的数据集用于继续训练对抗网络模型。2.根据权利要求1所述的面向深度学习的数据去偏方法，其特征在于，所述步骤(2)具体为：所述对抗网络模型包括分类器、判别器和自编码器；所述作用于分类器的损失函数为L
C
：式中，记录了分类器输出的分类结果，Y
i
代表实际的分类结果；所述作用于判别器的损失函数为L
D
：其中，为判别器输出的预测结果，g
i
...

【专利技术属性】
技术研发人员：陈晋音，陈一鸣，陈奕芃，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人