一种基于偏见神经元的数据去偏方法和装置制造方法及图纸

技术编号:34897334 阅读:89 留言:0更新日期:2022-09-10 13:57
本发明专利技术公开了一种基于偏见神经元的数据去偏方法和装置,首先获取原始数据,并对所述原始数据中的类别属性进行标记,得到标记后的数据集,记作数据集X;再翻转数据集X中的敏感属性构成数据集X

【技术实现步骤摘要】
一种基于偏见神经元的数据去偏方法和装置


[0001]本专利技术属于人工智能领域,具体涉及一种基于偏见神经元的数据去偏方法和装置。

技术介绍

[0002]随着人工智能的飞速发展,以深度学习为代表的人工智能技术如雨后春笋般蓬勃发展起 来,逐渐渗透到远程医疗、语音识别、目标检测、自然语言处理等典型各类应用场景中,并 且发挥了很好的效果,带来了巨大的经济效益和社会效益。在应用过程中,深度学习技术展 现出了自身强大的学习样本数据集内在规律以及高度抽象化特征的能力,帮助人们解决了生 成生活中遇到的很多复杂的模式识别以及分类预测问题。因此,深度学习技术也逐步渗透进 人们生产和日常生活中,将人们从繁重且重复的劳动中解放出来。
[0003]深度学习技术虽然可以帮助人们获得更准确的分类以及预测结果以帮助政策制定者做出 决策支撑、帮助人们提高工作效率和产生更多的社会效益。然而不断有新的研究表明,深度 学习模型容易因为模型在训练时所使用的原始样本数据中存在偏见而做出有失偏颇的决策, 如果相关的组织和决策者放弃使用深度学习技术来开展他们的业务,则可能会导致会在激本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于偏见神经元的数据去偏方法,其特征在于,包括以下步骤:(1)获取原始数据,并对所述原始数据中的类别属性进行标记,得到标记后的数据集,记作数据集X;所述原始数据为带有敏感属性的文本数据集;(2)翻转数据集X中的敏感属性构成数据集X

,利用数据集X和数据集X

筛选深度学习模型中的偏见神经元;(3)构建反向数据集;(4)取k的反向数据集中的样本扩充至数据集X中合成增强数据集,随后将增强数据集输入至深度模型θ,并对深度模型θ进行训练,直到深度模型θ的分类精度大于80%,完成去偏;所述深度模型θ为五层全连接模型,所述k的取值为30%~50%。2.根据权利要求1所述的一种基于偏见神经元的数据去偏方法,其特征在于,所述步骤(2)具体包括以下子步骤:(2.1)翻转数据集X中的敏感属性构成数据集X

,使得数据集X

中的每个样本的敏感属性值与数据集X中对应样本的敏感属性值不同,但其他所有属性值相同;所述数据集X为{x1,x2,...x
i
,...x
N
},数据集X

为{x
′1,x
′2,...x

i
,...x

N
},N表示数据集X中共有N个样本,x
i
表示数据集X中的第i个样本,i=1,2,...i,...N,x
i
和x

i
之间敏感属性相反但其他所有属性值相同;将数据集X中的每个样本x
i
和数据集X

中的每个样本x

i
组成样本实例对(x
i
,x
...

【专利技术属性】
技术研发人员:陈晋音陈一鸣陈奕芃郑海斌赵云波
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1