【技术实现步骤摘要】
数据分箱及可视化展示方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种数据分箱及可视化展示方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着大数据分析的不断兴起,通过建模来进行数据分析越来越重要。在不同领域的建模场景中,出于模型可解释性、稳定性等要求,往往需要对连续变量离散化、对取值过多的离散变量进行重新组合,以此来提高分析结果的稳定性,降低分析的难度。例如,在金融领域的数据分析中,对年龄特征进行分箱处理,年龄>30是1,否则0,如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰。
[0003]目前现有的分箱算法,如等宽分箱、等频分箱、卡方分箱、熵值分箱等,都需要通过编写代码的方式对数据进行转换,对分析人员要求较高,数据分箱效率较低,同时无法灵活调整分箱结果,也无法对分箱结果进行展示。
技术实现思路
[0004]本专利技术提供一种数据分箱及可视化展示方法、装置、电子设备及可读存储介质,其主要目的在于解决数据分箱结果 ...
【技术保护点】
【技术特征摘要】
1.一种数据分箱及可视化展示方法,其特征在于,所述方法包括:获取分箱方法集合,对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合;接收待分箱数据,利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据;根据所述第一分箱数据生成原始分箱效果图,基于所述原始分箱效果图中的目标指标对所述第一分箱数据进行二次分箱,得到第二分箱数据;基于所述第二分箱数据生成标准分箱效果图。2.如权利要求1所述的数据分箱及可视化展示方法,其特征在于,所述对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合,包括:在预设的前端页面中设置分箱类别,将所述分箱方法集合中的方法添加至所述分箱类别中;利用预设的前端框架对添加完方法的前端页面进行封装,得到所述分箱组件集合。3.如权利要求1中所述的数据分箱及可视化展示方法,其特征在于,所述利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据,包括:按照预设维度对所述待分箱数据进行排序,得到第一排序数据集合;对所述第一排序数据集合中的数据进行去异常处理及缺失值填充处理,得到标准数据集合;接收数据分箱指令,根据所述数据分箱指令从所述分箱组件集合中选取目标组件;利用所述目标组件对所述标准数据集合进行数据分箱处理,得到所述第一分箱数据。4.如权利要求3所述的数据分箱及可视化展示方法,其特征在于,所述对所述第一排序数据集合中的数据进行去异常处理及缺失值填充处理,得到标准数据集合,包括:利用双边测试剔除方法对所述第一排序数据集合中的数据进行异常值剔除,得到去异常数据序列;利用预设的缺失值检测函数对所述去异常数据序列中的数据进行缺失值检测,并利用所述去异常数据序列中的平均值或中位值对缺失值进行填充,得到所述标准数据集合。5.如权利要求3所述的数据分箱及可视化展示方法,其特征在于,所述利用所述目标组件对所述标准数据集合进行数据分箱处理,得到所述第一分箱数据,包括:利用所述目标组件中封装的分箱算法计算所述标准数据集合的分箱区间;利用所述分箱区间对所述标准数据集合进行数据分组,对数据分组...
【专利技术属性】
技术研发人员:林瑜,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。