交互式特征分箱处理方法、设备及可读存储介质技术

技术编号:23363285 阅读:20 留言:0更新日期:2020-02-18 17:22
本发明专利技术公开了一种交互式特征分箱处理方法、设备和可读存储介质,所述交互式特征分箱处理方法包括:获取数据表,并将所述数据表接入预设特征分箱组件,以对所述数据表中的特征进行分箱,获得初始特征分箱结果,基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果。本发明专利技术解决了特征分箱方法局限性强的技术问题。

Method, equipment and readable storage medium of interactive feature bin splitting

【技术实现步骤摘要】
交互式特征分箱处理方法、设备及可读存储介质
本专利技术涉及金融科技(Fintech)的机器学习
,尤其涉及一种交互式特征分箱处理方法、设备及可读存储介质。
技术介绍
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。随着计算机软件和人工智能的不断发展,机器学习建模的应用也越来越广泛,在进行机器学习建模过程中,通常需要对输入机器学习模型的特征进行特征分箱,目前,常常需要业务建模人员结合对业务实际特征数据分布的理解对机器分箱后的特征施加人工处理,以提高机器学习模型的预测效果和减少建模的复杂度,其中,可通过代码开发实现所述人工处理,但由于业务建模人员缺乏代码开发能力和调试能力,利用代码开发实现所述人工处理对于业务建模人员的要求门槛过高且容易出错,而对于其他人工处理方法,例如通过Excel表格进行人工处理,工作效率极低,用户体验较差,所以,在现有技术中存在特征分箱方法局限性强的技术问题。
技术实现思路
本专利技术的主要目的在于提供一种交互式特征分箱处理方法、设备和可读存储介质,旨在解决现有技术中特征分箱方法局限性强的技术问题。为实现上述目的,本专利技术实施例提供一种交互式特征分箱处理方法,所述交互式特征分箱处理方法应用于交互式特征分箱处理设备,所述交互式特征分箱处理方法包括:获取数据表,并将所述数据表接入预设特征分箱组件,以对所述数据表中的特征进行分箱,获得初始特征分箱结果;基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果。可选地,所述交互式特征分箱包括交互式合并,所述分箱命令包括合并命令,所述基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果的步骤包括:基于所述合并命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待合并特征进行所述交互式合并,获得合并结果;计算所述合并结果对应的合并分箱效果参数,并将所述合并分箱效果参数与所述待合并特征的第一原分箱效果参数进行比对;当所述合并分箱效果参数小于所述第一原分箱效果参数时,则撤销所述交互式合并;当所述合并分箱效果参数大于或者等于所述第一原分箱效果参数时,则将进行所述交互式合并后的所述初始特征分箱结果作为所述目标特征分箱结果。可选地,所述合并命令包括第一类型合并命令和第二类型合并命令,所述待合并特征包括待合并区间型特征和待合并列名型特征,所述基于所述合并命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待合并特征进行所述交互式合并,获得合并结果的步骤包括:判断所述合并命令的类型,若所述合并命令为所述第一类型合并命令,则基于所述第一类型合并命令,在所述预设交互式分箱界面上对所述待合并区间型特征进行所述交互式合并,获得所述合并结果;若所述合并命令为所述第二类型合并命令,则基于所述第二类型合并命令,在所述预设交互式分箱界面上对所述待合并列名型特征进行所述交互式合并,获得所述合并结果。可选地,所述交互式特征分箱包括交互式拆分,所述分箱命令包括拆分命令,所述基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果的步骤包括:基于所述拆分命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待拆分特征进行所述交互式拆分,获得拆分结果;计算所述拆分结果对应的拆分分箱效果参数,并将所述拆分分箱效果参数与所述待拆分特征的第二原分箱效果参数进行比对;当所述拆分分箱效果参数小于所述第二原分箱效果参数时,则撤销所述交互式拆分;当所述拆分分箱效果参数大于或者等于所述第二原分箱效果参数时,则将进行所述交互式拆分后的所述初始特征分箱结果作为所述目标特征分箱结果。可选地,所述拆分命令包括第一类型拆分命令和第二类型拆分命令,所述待拆分特征包括待拆分区间型特征和待拆分列名型特征,所述基于所述拆分命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待拆分特征进行所述交互式拆分,获得拆分结果的步骤包括:判断所述拆分命令的类型,若所述拆分命令为所述第一类型拆分命令,则基于所述第一类型拆分命令对应的截至值,在所述预设交互式分箱界面上对所述待拆分区间型特征进行所述交互式拆分,获得所述拆分结果;若所述拆分命令为所述第二类型拆分命令,则基于所述第二类型拆分命令,在所述预设交互式分箱界面上对所述待拆分列名型特征进行所述交互式拆分,获得所述拆分结果。可选地,所述交互式特征分箱包括缺失值分箱合并和缺失值分箱拆分,所述分箱命令包括缺失值分箱合并命令和缺失值分箱拆分命令,所述基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果的步骤包括:判断所述分箱命令的类型,若所述分箱命令为缺失值分箱合并命令,则基于所述缺失值分箱合并命令,对所述初始特征分箱结果中的缺失值分箱进行交互式合并,获得所述目标特征分箱结果;若所述分箱命令为缺失值分箱拆分命令,则基于所述缺失值分箱拆分命令,对所述初始特征分箱结果中的缺失值分箱进行交互式拆分,获得所述目标特征分箱结果。可选地,所述交互式特征分箱包括空箱处理,其中,所述空箱处理包括空箱交互式调整和基于空箱参数调整,所述分箱命令包括空箱处理命令,所述基于用户输入的空箱处理命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果的步骤包括:判断所述空箱处理命令的类型,若所述空箱处理命令类型为第一类型命令,则对所述初始特征分箱结果进行所述空箱交互式调整,获得所述目标特征分箱结果;若所述空箱处理命令类型为第二类型命令,则对所述初始特征分箱结果基于空箱参数进行调整,获得所述目标特征分箱结果。可选地,所述将所述数据表接入预设特征分箱组件,以对所述数据表中的特征进行分箱,获得初始特征分箱结果的步骤包括:将所述数据表接入所述预设特征分箱组件,以基于用户输入的选择命令选择所述数据表中的待分箱特征;基于所述用户输入的参数配置命令,对所述预设特征分箱组件进行参数配置,获得待运行特征分箱组件;运行所述待运行特征分箱组件,以对所述待分箱特征进行所述特征分箱,获得所述初始特征分箱结果。本专利技术还提供一种交互式特征分箱处理装置,所述交互式特征分箱处理装置应用于交互式特征分箱处理设备,所述交互式特征分箱处理装置包括:机器分箱模块,用于所述获取数据表,并将所述数据表接入预设特征分箱组件,以对所述数据表中的特征进行分箱,获得初始特征分箱结果;交互式分箱模块,用于所述基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果。可选地,所述交互式分箱模块包括:交互式合并单元,用于基于所述合并命令,在预设交互式分箱界面本文档来自技高网...

【技术保护点】
1.一种交互式特征分箱处理方法,其特征在于,所述交互式特征分箱处理方法包括:/n获取数据表,并将所述数据表接入预设特征分箱组件,以对所述数据表中的特征进行分箱,获得初始特征分箱结果;/n基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果。/n

【技术特征摘要】
1.一种交互式特征分箱处理方法,其特征在于,所述交互式特征分箱处理方法包括:
获取数据表,并将所述数据表接入预设特征分箱组件,以对所述数据表中的特征进行分箱,获得初始特征分箱结果;
基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果。


2.如权利要求1所述交互式特征分箱处理方法,其特征在于,所述交互式特征分箱包括交互式合并,所述分箱命令包括合并命令,
所述基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果的步骤包括:
基于所述合并命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待合并特征进行所述交互式合并,获得合并结果;
计算所述合并结果对应的合并分箱效果参数,并将所述合并分箱效果参数与所述待合并特征的第一原分箱效果参数进行比对;
当所述合并分箱效果参数小于所述第一原分箱效果参数时,则撤销所述交互式合并;
当所述合并分箱效果参数大于或者等于所述第一原分箱效果参数时,则将进行所述交互式合并后的所述初始特征分箱结果作为所述目标特征分箱结果。


3.如权利要求2所述交互式特征分箱处理方法,其特征在于,所述合并命令包括第一类型合并命令和第二类型合并命令,所述待合并特征包括待合并区间型特征和待合并列名型特征,
所述基于所述合并命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待合并特征进行所述交互式合并,获得合并结果的步骤包括:
判断所述合并命令的类型,若所述合并命令为所述第一类型合并命令,则基于所述第一类型合并命令,在所述预设交互式分箱界面上对所述待合并区间型特征进行所述交互式合并,获得所述合并结果;
若所述合并命令为所述第二类型合并命令,则基于所述第二类型合并命令,在所述预设交互式分箱界面上对所述待合并列名型特征进行所述交互式合并,获得所述合并结果。


4.如权利要求1所述交互式特征分箱处理方法,其特征在于,所述交互式特征分箱包括交互式拆分,所述分箱命令包括拆分命令,
所述基于用户输入的分箱命令,对所述初始特征分箱结果进行交互式特征分箱,获得目标特征分箱结果的步骤包括:
基于所述拆分命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待拆分特征进行所述交互式拆分,获得拆分结果;
计算所述拆分结果对应的拆分分箱效果参数,并将所述拆分分箱效果参数与所述待拆分特征的第二原分箱效果参数进行比对;
当所述拆分分箱效果参数小于所述第二原分箱效果参数时,则撤销所述交互式拆分;
当所述拆分分箱效果参数大于或者等于所述第二原分箱效果参数时,则将进行所述交互式拆分后的所述初始特征分箱结果作为所述目标特征分箱结果。


5.如权利要求4所述交互式特征分箱处理方法,其特征在于,所述拆分命令包括第一类型拆分命令和第二类型拆分命令,所述待拆分特征包括待拆分区间型特征和待拆分列名型特征,
所述基于所述拆分命令,在预设交互式分箱界面上对所述初始特征分箱结果中的待拆分特征进行所述交互式拆分,获...

【专利技术属性】
技术研发人员:林冰垠陈瑞钦黄启军王跃唐兴兴李诗琦范涛陈天健
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1