数据分箱及可视化展示方法、装置、设备及存储介质制造方法及图纸

技术编号:34405965 阅读:13 留言:0更新日期:2022-08-03 21:51
本发明专利技术涉及人工智能技术,揭露了一种数据分箱及可视化展示方法,包括:获取分箱方法集合,对分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合,接收待分箱数据,利用分箱组件集合对待分箱数据进行初次分箱处理,得到第一分箱数据,根据第一分箱数据生成原始分箱效果图,基于原始分箱效果图中的目标指标对第一分箱数据进行二次分箱,得到第二分箱数据,基于第二分箱数据生成标准分箱效果图。此外,本发明专利技术还涉及区块链技术,所述标准分箱效果图可存储在区块链的节点中。本发明专利技术还提出一种数据分箱及可视化展示方法装置、电子设备以及计算机可读存储介质。本发明专利技术可以解决数据分箱结果无法灵活调整及可视化展示的问题。箱结果无法灵活调整及可视化展示的问题。箱结果无法灵活调整及可视化展示的问题。

【技术实现步骤摘要】
数据分箱及可视化展示方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种数据分箱及可视化展示方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着大数据分析的不断兴起,通过建模来进行数据分析越来越重要。在不同领域的建模场景中,出于模型可解释性、稳定性等要求,往往需要对连续变量离散化、对取值过多的离散变量进行重新组合,以此来提高分析结果的稳定性,降低分析的难度。例如,在金融领域的数据分析中,对年龄特征进行分箱处理,年龄>30是1,否则0,如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰。
[0003]目前现有的分箱算法,如等宽分箱、等频分箱、卡方分箱、熵值分箱等,都需要通过编写代码的方式对数据进行转换,对分析人员要求较高,数据分箱效率较低,同时无法灵活调整分箱结果,也无法对分箱结果进行展示。

技术实现思路

[0004]本专利技术提供一种数据分箱及可视化展示方法、装置、电子设备及可读存储介质,其主要目的在于解决数据分箱结果无法灵活调整及可视化展示的问题。
[0005]为实现上述目的,本专利技术提供的一种数据分箱及可视化展示方法,包括:
[0006]获取分箱方法集合,对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合;
[0007]接收待分箱数据,利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据;
[0008]根据所述第一分箱数据生成原始分箱效果图,基于所述原始分箱效果图中的目标指标对所述第一分箱数据进行二次分箱,得到第二分箱数据;
[0009]基于所述第二分箱数据生成标准分箱效果图。
[0010]可选地,所述对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合,包括:
[0011]在预设的前端页面中设置分箱类别,将所述分箱方法集合中的方法添加至所述分箱类别中;
[0012]利用预设的前端框架对添加完方法的前端页面进行封装,得到所述分箱组件集合。
[0013]可选地,所述利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据,包括:
[0014]按照预设维度对所述待分箱数据进行排序,得到第一排序数据集合;
[0015]对所述第一排序数据集合中的数据进行去异常处理及缺失值填充处理,得到标准数据集合;
[0016]接收数据分箱指令,根据所述数据分箱指令从所述分箱组件集合中选取目标组件;
[0017]利用所述目标组件对所述标准数据集合进行数据分箱处理,得到所述第一分箱数据。
[0018]可选地,所述对所述第一排序数据集合中的数据进行去异常处理及缺失值填充处理,得到标准数据集合,包括:
[0019]利用双边测试剔除方法对所述第一排序数据集合中的数据进行异常值剔除,得到去异常数据序列;
[0020]利用预设的缺失值检测函数对所述去异常数据序列中的数据进行缺失值检测,并利用所述去异常数据序列中的平均值或中位值对缺失值进行填充,得到所述标准数据集合。
[0021]可选地,所述利用所述目标组件对所述标准数据集合进行数据分箱处理,得到所述第一分箱数据,包括:
[0022]利用所述目标组件中封装的分箱算法计算所述标准数据集合的分箱区间;
[0023]利用所述分箱区间对所述标准数据集合进行数据分组,对数据分组后的数据进行数据离散化处理,汇总所有离散化后的数据得到所述第一分箱数据。
[0024]可选地,所述根据所述第一分箱数据生成原始分箱效果图,包括:
[0025]获取预设的与所述分箱区间相对应的分箱标签;
[0026]将所述分箱标签及所述分箱标签对应的数据作为参数写入预构建的图形脚本模板,得到分箱图形脚本;
[0027]将所述分箱图形脚本转化为预设格式的可视化文件,对所述可视化文件进行异步加载,得到所述原始分箱效果图。
[0028]可选地,所述基于所述原始分箱效果图中的目标指标对所述第一分箱数据进行二次分箱,得到第二分箱数据,包括:
[0029]接收指标选取指令,将所述指标选取指令确定的指标作为所述目标指标;
[0030]计算所述第一分箱数据中每个分箱区间的所述目标指标的指标值;
[0031]对所有不满足预设范围的指标值对应的分箱区间内的数据进行二次分箱,汇总所有二次分箱后的数据,得到所述第二分箱数据。
[0032]为了解决上述问题,本专利技术还提供一种数据分箱及可视化展示装置,所述装置包括:
[0033]分箱方法集成模块,用于获取分箱方法集合,对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合;
[0034]初次分箱处理模块,用于接收待分箱数据,利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据;
[0035]二次分箱处理模块,用于根据所述第一分箱数据生成原始分箱效果图,基于所述原始分箱效果图中的目标指标对所述第一分箱数据进行二次分箱,得到第二分箱数据;
[0036]分箱数据展示模块,用于基于所述第二分箱数据生成标准分箱效果图。
[0037]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0038]存储器,存储至少一个计算机程序;及
[0039]处理器,执行所述存储器中存储的计算机程序以实现上述所述的数据分箱及可视化展示方法。
[0040]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的数据分箱及可视化展示方法。
[0041]本专利技术通过对不同的分箱方法进行组件集成,得到分箱组件集合,利用分箱组件集合对待分箱数据进行分箱处理,可以提高数据分箱效率。并且基于原始分箱效果图中的目标指标对所述第一分箱数据进行二次分箱,可以灵活进行分箱调整,同时每一次分箱结果都可以进行可视化展示,提高了分箱数据展示的便捷性。因此本专利技术提出的数据分箱及可视化展示方法、装置、电子设备及计算机可读存储介质,可以解决数据分箱结果无法灵活调整及可视化展示的问题。
附图说明
[0042]图1为本专利技术一实施例提供的数据分箱及可视化展示方法的流程示意图;
[0043]图2为本专利技术一实施例提供的数据分箱及可视化展示装置的功能模块图;
[0044]图3为本专利技术一实施例提供的实现所述数据分箱及可视化展示方法的电子设备的结构示意图。
[0045]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0046]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0047]本申请实施例提供一种数据分箱及可视化展示方法。所述数据分箱及可视化展示方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分箱及可视化展示方法,其特征在于,所述方法包括:获取分箱方法集合,对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合;接收待分箱数据,利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据;根据所述第一分箱数据生成原始分箱效果图,基于所述原始分箱效果图中的目标指标对所述第一分箱数据进行二次分箱,得到第二分箱数据;基于所述第二分箱数据生成标准分箱效果图。2.如权利要求1所述的数据分箱及可视化展示方法,其特征在于,所述对所述分箱方法集合中的分箱方法进行组件集成,得到分箱组件集合,包括:在预设的前端页面中设置分箱类别,将所述分箱方法集合中的方法添加至所述分箱类别中;利用预设的前端框架对添加完方法的前端页面进行封装,得到所述分箱组件集合。3.如权利要求1中所述的数据分箱及可视化展示方法,其特征在于,所述利用所述分箱组件集合对所述待分箱数据进行初次分箱处理,得到第一分箱数据,包括:按照预设维度对所述待分箱数据进行排序,得到第一排序数据集合;对所述第一排序数据集合中的数据进行去异常处理及缺失值填充处理,得到标准数据集合;接收数据分箱指令,根据所述数据分箱指令从所述分箱组件集合中选取目标组件;利用所述目标组件对所述标准数据集合进行数据分箱处理,得到所述第一分箱数据。4.如权利要求3所述的数据分箱及可视化展示方法,其特征在于,所述对所述第一排序数据集合中的数据进行去异常处理及缺失值填充处理,得到标准数据集合,包括:利用双边测试剔除方法对所述第一排序数据集合中的数据进行异常值剔除,得到去异常数据序列;利用预设的缺失值检测函数对所述去异常数据序列中的数据进行缺失值检测,并利用所述去异常数据序列中的平均值或中位值对缺失值进行填充,得到所述标准数据集合。5.如权利要求3所述的数据分箱及可视化展示方法,其特征在于,所述利用所述目标组件对所述标准数据集合进行数据分箱处理,得到所述第一分箱数据,包括:利用所述目标组件中封装的分箱算法计算所述标准数据集合的分箱区间;利用所述分箱区间对所述标准数据集合进行数据分组,对数据分组...

【专利技术属性】
技术研发人员:林瑜
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1