解析分类结果的方法、装置及电子设备制造方法及图纸

技术编号:28320930 阅读:14 留言:0更新日期:2021-05-04 13:01
本发明专利技术公开了一种解析分类结果的方法、装置及电子设备。其中方法包括:获取目标样本经分类模型输出的所属类别;根据区别于所属类别的每一其他类别的历史样本,确定目标样本的对照样本;对于分类模型的每一输入特征,计算目标样本与对照样本在对应输入特征上的距离值;根据对于每一输入特征的距离值,获取目标样本的对应输入特征的特征值在目标样本属于所属类别上的贡献度。

【技术实现步骤摘要】
解析分类结果的方法、装置及电子设备
本专利技术涉及人工智能
,更具体地,涉及一种解析分类结果的方法、装置及电子设备。
技术介绍
目前,通常利用分类模型对待分类样本进行分类,以得到待分类样本所属的类别的分类结果。但是,大多数分类模型通常是一个黑盒机制,即大多数分类模型仅仅只能给出待分类样本的分类结果,而无法解析得到该分类结果的原因。虽然,存在少数分类模型(例如以随机森林模型、决策树模型等)能够解析所得到分类结果的原因,但是,一方面,该解析仅是宏观意义上的解析,而宏观意义上的解析对于分类模型在实际应用中意义有限。另一方面,该少数分类模型对应的解析方法仅仅适用于对应的分类模型,而无法移植到其他分类模型中。由于在实际应用中,尤其是在一些特殊的领域的应用中,具体解析通过分类模型所得到的分类结果的原因是非常重要的。例如在金融风控领域中,通常利用一个分类模型对人物画像进行分类,以将该人物画像分类为可进行贷款类别的人物画像,或者分类为不可进行贷款类别的人物画像。对于不可进行贷款类别的人物画像,解析该人物画像因为其中的哪些特征值导致不可进行贷款是非常重要的。因此,一种能够具体解析所有分类模型所得到的分类结果的方法亟待被提出。
技术实现思路
本专利技术的一个目的是提供一种解析分类结果的新技术方案。根据本专利技术的第一方面,提供了一种解析分类结果的方法,包括:获取目标样本经分类模型输出的所属类别;根据区别于所述所属类别的每一其他类别的历史样本,确定所述目标样本的对照样本;其中,所述其他类别为通过所述分类模型对对应历史样本分类所输出的区别于所述所属类别的分类结果;对于所述分类模型的每一输入特征,计算所述目标样本与所述对照样本在对应输入特征上的距离值;根据对于每一输入特征的所述距离值,获取所述目标样本的对应输入特征的特征值在所述目标样本属于所述所属类别上的贡献度。可选地,其中,所述计算所述目标样本与所述对照样本在对应输入特征上的距离值,包括:将所述对照样本的对于所述对应输入特征的特征值替换为所述目标样本的对于所述对应输入特征的特征值,得到第一新样本;获取通过所述分类模型输出所述对照样本属于所述所属类别的第一分类概率;获取通过所述分类模型输出所述第一新样本属于所述所属类别的第二分类概率;根据所述第二分类概率与所述第一分类概率的差值,确定所述目标样本与所述对照样本在所述对应输入特征上的距离值。可选地,其中,所述计算所述目标样本与所述对照样本在对应输入特征上的距离值,包括:将所述目标样本的对于所述对应输入特征的特征值替换为所述对照样本对于所述对应输入特征的特征值,得到第二新样本;获取通过所述分类模型输出所述目标样本属于所述所属类别的第三分类概率;获取通过所述分类模型输出所述第二新样本属于所述所属类别的第四分类概率;根据所述第三分类概率与所述第四分类概率的差值,确定所述目标样本与所述对照样本在所述对应输入特征上的距离值。可选地,其中,所述根据区别于所述所属类别的每一其他类别的历史样本,确定所述目标样本的对照样本,包括:根据所述每一其他类别的历史样本,确定每一其他类别的中心样本;获取通过所述分类模型输出所述每一其他类别的中心样本属于所属分类的第五分类概率;将所有所述第五分类概率中最小分类概率对应的中心样本,作为所述目标样本的对照样本。可选地,所述根据所述每一其他类别的历史样本,确定每一其他类别的中心样本,包括:计算所述每一其他类别的历史样本中属于同一所述输入特征的特征值的平均值;将所述每一其他类别的所有所述输入特征对应的平均值组成的样本,作为所述每一其他类别的中心样本。可选地,其中,所述方法还包括:响应于任一设定事件的触发,执行所述获取目标样本经分类模型输出的所属类别的步骤。可选地,其中,所述方法还包括:提供用于输入解析样本的分类结果的解析指令的输入入口;获取通过所述输入入口输入的所述解析指令,将对应样本作为所述目标样本,执行所述获取目标样本经分类模型输出的所属类别的步骤。可选地,其中,所述方法还包括:输出所述目标样本对于每一输入特征的特征值的所述贡献度。可选地,所述输出所述目标样本对于每一输入特征的特征值的所述贡献度,包括:根据获得的所述贡献度,生成反映所述贡献度与所述目标样本的所述特征值间的对应关系的映射数据表;展示所述映射数据表。根据本专利技术的第二方面,提供了一种解析分类结果的装置,包括:第一获取模块,用于获取目标样本经分类模型输出的所属类别;确定模块,用于根据区别于所述所属类别的每一其他类别的历史样本,确定所述目标样本的对照样本;其中,所述其他类别为通过所述分类模型对对应历史样本分类所输出的区别于所述所属类别的分类结果;计算模块,用于对于所述分类模型的每一输入特征,计算所述目标样本与所述对照样本在对应输入特征上的距离值;第二获取模块,用于根据对于每一输入特征的所述距离值,获取所述目标样本的对应输入特征的特征值在所述目标样本属于所述所属类别上的贡献度。根据本专利技术的第三方面,提供了一种电子设备,其中,包括:根据第二方面所述的装置;或者,处理器和存储器,所述存储器用于存储可执行的指令,所述指令用于控制所述处理器执行根据第一方面中任一项所述的方法。根据本专利技术的第四方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机指令,当所述存储介质中的计算机指令由处理器执行时,实现如第一方面中任一项所述的方法。在本专利技术实施例中,对于分类模型的每一输入特征,通过计算目标样本与对照样本在对应输入特征上的距离值,可以获取到目标样本中的每一输入特征的特征值对于目标样本属于所属类别的贡献度。即本专利技术实施例提供的解析分类结果的方法,可具体解析分类模型得到的分类结果的原因。同时,本专利技术实施例提供的解析分类结果的方法并不对分类模型进行限制,因此可适用于任何一种分类模型。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是显示可用于实现本专利技术的实施例的电子设备的硬件配置的例子的框图。图2示出了本专利技术的实施例的解析分类结果的方法的流程图。图3示出了本专利技术的实施例的解析分类结果的装置的框图。图4示出了本专利技术的实施例的电子设备的框图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。...

【技术保护点】
1.一种解析分类结果的方法,其特征在于,包括:/n获取目标样本经分类模型输出的所属类别;/n根据区别于所述所属类别的每一其他类别的历史样本,确定所述目标样本的对照样本;其中,所述其他类别为通过所述分类模型对对应历史样本分类所输出的区别于所述所属类别的分类结果;/n对于所述分类模型的每一输入特征,计算所述目标样本与所述对照样本在对应输入特征上的距离值;/n根据对于每一输入特征的所述距离值,获取所述目标样本的对应输入特征的特征值在所述目标样本属于所述所属类别上的贡献度。/n

【技术特征摘要】
1.一种解析分类结果的方法,其特征在于,包括:
获取目标样本经分类模型输出的所属类别;
根据区别于所述所属类别的每一其他类别的历史样本,确定所述目标样本的对照样本;其中,所述其他类别为通过所述分类模型对对应历史样本分类所输出的区别于所述所属类别的分类结果;
对于所述分类模型的每一输入特征,计算所述目标样本与所述对照样本在对应输入特征上的距离值;
根据对于每一输入特征的所述距离值,获取所述目标样本的对应输入特征的特征值在所述目标样本属于所述所属类别上的贡献度。


2.根据权利了要求1所述的方法,其特征在于,其中,所述计算所述目标样本与所述对照样本在对应输入特征上的距离值,包括:
将所述对照样本的对于所述对应输入特征的特征值替换为所述目标样本的对于所述对应输入特征的特征值,得到第一新样本;
获取通过所述分类模型输出所述对照样本属于所述所属类别的第一分类概率;
获取通过所述分类模型输出所述第一新样本属于所述所属类别的第二分类概率;
根据所述第二分类概率与所述第一分类概率的差值,确定所述目标样本与所述对照样本在所述对应输入特征上的距离值。


3.根据权利要求1所述的方法,其特征在于,其中,所述计算所述目标样本与所述对照样本在对应输入特征上的距离值,包括:
将所述目标样本的对于所述对应输入特征的特征值替换为所述对照样本对于所述对应输入特征的特征值,得到第二新样本;
获取通过所述分类模型输出所述目标样本属于所述所属类别的第三分类概率;
获取通过所述分类模型输出所述第二新样本属于所述所属类别的第四分类概率;
根据所述第三分类概率与所述第四分类概率的差值,确定所述目标样本与所述对照样本在所述对应输入特征上的距离值。


4.根据权利要求1所述的方法,其特征在于,其中,所述根据区别于所述所属类别的每一其他类别的历史样本,确定所述目标样本的对照样本,包括:
根据所述每一其他类别的历史样本,确定每一其他类别的中心样本;
获取通过所述分类模型输出所述每一其他类别的中心样本...

【专利技术属性】
技术研发人员:陈龙倪煜杜俭峰
申请(专利权)人:北京金山云网络技术有限公司北京金山云科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1