【技术实现步骤摘要】
SHAP特征归因方法、装置、设备及可读存储介质
本申请涉及金融科技(Fintech)的人工智能
,尤其涉及一种SHAP特征归因方法、装置、设备及可读存储介质。
技术介绍
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。随着计算机软件和人工智能的不断发展,机器学习的应用也越来越广泛,也发展出了一系列的高性能的机器学习模型,例如,随机森林、梯度提升树、深度学习等,但这些机器学习模型内部原理难以理解,在业务应用场景中,建模人员难以理解这些模型,进而导致建模人员难以去应用和调试这些机器学习模型,目前,通常通过SHAP(SHapleyAdditiveexPlanations,沙普利可加性模型解释方法)来解释模型,进而帮助建模人员去理解模型,但是在计算模型的SHAP结果时,往往需要大量的样本,而当前的SHAP计算方法却只能进行单机实现,进而导致计算单个样本的全局SHA ...
【技术保护点】
1.一种SHAP特征归因方法,其特征在于,所述SHAP特征归因方法应用于驱动端,所述SHAP特征归因方法包括:/n获取待解释数据,并将所述待解释数据分发到与所述驱动端关联的执行端;/n将预设待解释模型广播至所述执行端,以供所述执行端基于所述待解释模型并行计算所述待解释数据中各样本特征对应的边际效益期望以及标注标签期望值;/n接收所述执行端反馈的各所述边际效益期望和所述标注标签期望值,并基于各所述边际效益期望和所述标注标签期望值,计算所述待解释数据对应的SHAP结果。/n
【技术特征摘要】
1.一种SHAP特征归因方法,其特征在于,所述SHAP特征归因方法应用于驱动端,所述SHAP特征归因方法包括:
获取待解释数据,并将所述待解释数据分发到与所述驱动端关联的执行端;
将预设待解释模型广播至所述执行端,以供所述执行端基于所述待解释模型并行计算所述待解释数据中各样本特征对应的边际效益期望以及标注标签期望值;
接收所述执行端反馈的各所述边际效益期望和所述标注标签期望值,并基于各所述边际效益期望和所述标注标签期望值,计算所述待解释数据对应的SHAP结果。
2.如权利要求1所述SHAP特征归因方法,其特征在于,所述待解释数据包括一个或者多个特征,
所述基于各所述边际效益期望和所述标注标签期望值,计算所述待解释数据对应的SHAP结果的步骤包括:
生成各所述边际效益期望对应的输入数据表,并将所述输入数据表和所述标注标签期望值代入预设SHAP结果计算公式,并行计算各所述特征共同对应的所述SHAP结果。
3.如权利要求1所述SHAP特征归因方法,其特征在于,所述生成各所述边际效益期望对应的输入数据表,并将所述输入数据表和所述标注标签期望值代入预设SHAP结果计算公式,并行计算各所述特征共同对应的所述SHAP结果的步骤之后包括:
对各所述样本特征进行后处理,以去除各所述样本特征对应的异常点对所述SHAP结果的干扰作用,并将后处理后的所述样本特征和所述SHAP结果进行展示。
4.如权利要求3所述SHAP特征归因方法,其特征在于,所述SHAP结果包括一个或者多个SHAP值,所述后处理包括范围钳位处理和重编排,
所述对各所述样本特征进行后处理,以去除各所述样本特征对应的异常点对所述SHAP结果的干扰作用,并将后处理后的所述样本特征和所述SHAP结果进行展示的步骤包括:
对所述样本特征进行所述范围钳位处理,获得有限范围数据;
对所述有限范围数据进行所述重编排,以建立各所述样本特征和各所述SHAP值的映射关系,获得待展示数据,并将所述待展示数据进行展示。
5.如权利要求4所述SHAP特征归因方法,其特征在于,所述样本特征包括第一样本特征和第二样本特征,
所述将所述待展示数据进行展示的步骤包括:
基于所述待展示数据,建立所述第一样本特征对应的模型解释散点图;
基于所述第二样本特征对应的各样本特征值,对所述模型解释散点图中的各散点进行着色,并将着色后的所述模型解释散点图进行展示。
6.如权利要求4所述SHAP特征归因方法,其特征在于,所述异常点包括缺失值...
【专利技术属性】
技术研发人员:卓本刚,黄启军,唐兴兴,林冰垠,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。