反事实公平性的预测模型训练方法、预测方法及其装置制造方法及图纸

技术编号：40536054 阅读：6 留言：0更新日期：2024-03-01 13:58

本发明专利技术提供一种反事实公平性的预测模型训练方法、预测方法及其装置，该预测模型训练方法包括：获取包括多个样本的训练数据集，每个样本包括含有敏感属性的多个属性和观测结果；基于属性和观测结果生成部分有向无环图，从中查找可能影响敏感属性的属性，生成敏感属性的多个父节点集；基于每个父节点集训练对应预设的倾向性得分模型，输出父节点集对样本的敏感属性值的倾向得分估计值；基于每个倾向得分估计值和对应的预测结果训练对应预设的因果效应模型，输出敏感属性对预测结果的因果效应估计值；基于所有因果效应估计值训练预设的预测模型，结合最小‑最大联合学习算法交替训练因果效应模型和预测模型，使训练好的预测模型满足反事实公平性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习算法，尤其涉及一种基于部分有向无环图的反事实公平性的预测模型训练方法、预测方法及其装置。

技术介绍

1、将机器学习算法变得公平对于针对具有不同敏感属性(例如性别等)的子群体或个体做出安全可信的决策至关重要。为了实现公平的预测，以前的研究已经提出了基于关联和基于因果的公平性概念。具体而言，基于关联的公平性研究了敏感属性与预测结果之间的统计独立性，而基于因果的子群公平性则限制了敏感属性对预测结果的因果影响。

2、在上述公平性概念中，反事实公平性考虑了在特定个体或群体内的因果效应，要求在现实世界没有干预和在对敏感属性进行干预的反事实世界中，预测结果应该相同。尽管已经开发了许多算法来实现反事实公平性，但其中大多数需要真实的因果有向无环图(directed acyclic graph，dag)是完全已知的。然而，在实践中通常无法直接获得真实的因果dag和结构方程。此外，如果没有强假设(例如线性和附加噪声)，通常无法从仅观察到的数据中恢复出真实的因果dag。

3、为了解决上述真实的因果dag无法获得的问题，最近的一项研究提出了使用观测数据，首先将观测变量分类为三类的方法：明确的非后代、可能的后代和明确的后代，这些分类是针对敏感属性而言的。接下来，通过注意到如果预测是敏感属性的非后代的函数，则预测将在反事实情况下具有公平性，提出了两种实现反事实公平性的算法：fair(使用明确的非后代节点进行预测)和fairrelax(进一步结合可能的后代进行预测)。

4、尽管这在理论上是合理的，但fa

技术实现思路

1、鉴于此，本专利技术实施例提供了一种反事实公平性的预测模型训练方法、预测方法及其装置，以消除或改善现有技术中存在的一个或更多个缺陷。

2、本专利技术的一个方面提供了一种反事实公平性的预测模型训练方法，该方法包括以下步骤：

3、获取训练数据集，所述训练数据集包括多个样本，每个样本包括含有敏感属性在内的多个属性和作为标签的对应的观测结果；

4、基于作为节点的属性和观测结果生成部分有向无环图，从所述部分有向无环图中查找可能影响所述敏感属性的属性，基于查找结果生成所述敏感属性的多个可能的父节点集；

5、基于每个可能的父节点集训练对应的预设的倾向性得分模型，所述倾向性得分模型用于输出所述可能的父节点集对于样本的敏感属性值的倾向得分估计值；

6、基于每个倾向得分估计值和对应的预测结果训练对应的预设的因果效应模型，所述因果效应模型用于输出所述敏感属性对于预测结果的因果效应估计值；

7、基于所有的因果效应估计值训练预设的预测模型，结合最小-最大联合学习算法交替训练所述因果效应模型和所述预测模型，以满足反事实公平性的预测模型作为训练好的公平的预测模型。

8、在本专利技术的一些实施例中，所述基于作为节点的属性和观测结果生成部分有向无环图，从所述部分有向无环图中查找可能影响所述敏感属性的属性，基于查找结果生成所述敏感属性的多个可能的父节点集的步骤，包括：

9、利用因果发现算法对所述训练数据集进行学习，生成完全部分有向无环图；

10、利用局部学习算法查找所述完全部分有向无环图中可能影响所述敏感属性的属性；

11、将可能影响所述敏感属性的属性进行排列组合，若所述排列组合没有引入新的对撞结构或者诱导的子图是完全图，则判定该排列组合为所述敏感属性的可能的父节点集。

12、在本专利技术的一些实施例中，在基于每个可能的父节点集训练对应的预设的倾向性得分模型的步骤中，通过每个所述可能的父节点集中的属性对所述敏感属性进行拟合，并通过最小化交叉熵损失训练对应的倾向性得分模型。

13、在本专利技术的一些实施例中，在基于每个倾向得分估计值和对应的预测结果训练对应的预设的因果效应模型，所述因果效应模型用于输出所述敏感属性对于预测结果的因果效应估计值的步骤中，通过对每个所述可能的父节点集对于样本的敏感属性值的倾向得分估计值进行逆概率加权，得到对应的敏感属性对于预测结果的因果效应的无偏估计。

14、在本专利技术的一些实施例中，在基于每个倾向得分估计值和对应的预测结果训练对应的预设的因果效应模型的步骤中，通过最小化目标损失训练对应的因果效应模型。

15、在本专利技术的一些实施例中，在基于所有的因果效应估计值训练预设的预测模型，结合最小-最大联合学习算法交替训练所述因果效应模型和所述预测模型，以满足反事实公平性的预测模型作为训练好的公平的预测模型的步骤中，根据每个样本的敏感属性对于预测结果的因果效应估计值，通过最小化平均预测误差，将所述因果效应估计值最大时的反事实公平性违反作为惩罚项对所述预测模型进行训练，并通过不断更新迭代的过程得到满足反事实公平性的预测模型。

16、在本专利技术的一些实施例中，所述观测结果包括：改变人的身体健康、性别、年龄和接受教育的水平等属性中至少一个的情况下，工作是否录用或成绩是否合格的结果；

17、所述敏感属性包括：人的身体健康、性别、年龄和接受教育的水平等属性中的至少一个。

18、本专利技术的另一方面提供了一种反事实公平性的预测方法，该方法包括以下步骤：

19、获取测试数据集，所述测试数据集包括多个样本，每个样本包括含有敏感属性在内的多个属性；

20、将所述测试数据集输入利用如前所述预测模型训练方法训练好的预测模型中，所述预测模型用于输出满足反事实公平性的预测结果。

21、本专利技术的又一方面提供了一种反事实公平性的预测模型训练装置，该装置包括：计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如前所述预测模型训练方法的步骤。

22、本专利技术的又一方面提供了一种反事实公平性的预测装置，该装置包括：计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如前所述预测方法的步骤。

23、本专利技术的又一方面提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如前所述反事实公平性的预测模型训练方法和预测方法的步骤。

24、本专利技术的反事实公平性的预测模型训练方法、预测方法及其装置，在真实因果图未知的情况下，能够保证本文档来自技高网...

【技术保护点】

1.一种反事实公平性的预测模型训练方法，其特征在于，该方法的步骤包括：

2.根据权利要求1所述的方法，其特征在于，所述基于作为节点的属性和观测结果生成部分有向无环图，从所述部分有向无环图中查找可能影响所述敏感属性的属性，基于查找结果生成所述敏感属性的多个可能的父节点集的步骤，包括：

3.根据权利要求1所述的方法，其特征在于，在基于每个可能的父节点集训练对应预设的倾向性得分模型的步骤中，通过每个所述可能的父节点集中的属性对所述敏感属性进行拟合，并通过最小化交叉熵损失训练对应的倾向性得分模型。

4.根据权利要求1所述的方法，其特征在于，在基于每个倾向得分估计值和对应的预测结果训练对应预设的因果效应模型，所述因果效应模型用于输出所述敏感属性对于预测结果的因果效应估计值的步骤中，通过对每个所述可能的父节点集对于样本的敏感属性值的倾向得分估计值进行逆概率加权，得到对应的敏感属性对于预测结果的因果效应的无偏估计。

5.根据权利要求4所述的方法，其特征在于，在基于每个倾向得分估计值和对应的预测结果训练对应预设的因果效应模型的步骤中，通过最小化目标

6.根据权利要求1所述的方法，其特征在于，在基于所有的因果效应估计值训练预设的预测模型，结合最小-最大联合学习算法交替训练所述因果效应模型和所述预测模型，以满足反事实公平性的预测模型作为训练好的公平的预测模型的步骤中，根据每个样本的敏感属性对于预测结果的因果效应估计值，通过最小化平均预测误差，将所述因果效应估计值最大时的反事实公平性违反作为惩罚项对所述预测模型进行训练，并通过不断更新迭代的过程得到满足反事实公平性的预测模型。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述观测结果包括：改变人的身体健康、性别、年龄和接受教育的水平属性中至少一个的情况下，工作是否录用或成绩是否合格的结果；

8.一种反事实公平性的预测方法，其特征在于，该方法的步骤包括：

9.一种反事实公平性的预测模型训练装置，包括计算机设备，所述计算机设备包括处理器和存储器，其特征在于，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如权利要求1至7中任一项所述方法的步骤。

10.一种反事实公平性的预测装置，包括计算机设备，所述计算机设备包括处理器和存储器，其特征在于，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如权利要求8所述方法的步骤。

...

【技术特征摘要】

1.一种反事实公平性的预测模型训练方法，其特征在于，该方法的步骤包括：

5.根据权利要求4所述的方法，其特征在于，在基于每个倾向得分估计值和对应的预测结果训练对应预设的因果效应模型的步骤中，通过最小化目标损失训练对应的因果效应模型。

6.根据权利要求1所述的方法，其特征在于，在基于所有的因果效应估计值训练预设的预测模型，结合最...

【专利技术属性】
技术研发人员：刘越，李昊轩，郑淳元，耿直，张坤，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人