System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,更具体的,涉及一种基于系统的统计业务数据分类方法、系统和存储介质。
技术介绍
1、随着计算机技术的发展,各行各业均往自动化方向进行发展,大量的电子业务数据伴随着产生,其中传统的统计业务数据分类均是先设定分类类别,再进行数据的分类,这种数据分类方法不能保证数据准确的划分到该数据的类别,因为,对应数据的类别可能在设定分类类别中找不到。
2、因此,现有技术存在缺陷,亟待改进。
技术实现思路
1、鉴于上述问题,本专利技术的目的是提供一种基于系统的统计业务数据分类方法、系统和存储介质,能够更有效的提高数据分类的精准度。
2、本专利技术第一方面提供了一种基于系统的统计业务数据分类方法,包括:
3、获取统计业务数据信息;
4、根据统计业务数据信息,得到对应统计业务数据信息中的特征以及特征数量;
5、当统计业务数据信息中的特征数量大于预设分类类别数量时,生成特征合并信息;
6、当统计业务数据信息中的特征数量小于预设分类类别数量时,生成特征拆分信息;
7、根据特征合并信息或特征拆分信息对特征数量进行修正,使特征数量和预设分类类别数量相同;
8、将统计业务数据按特征进行划分,得到不同特征的统计业务分类数据并进行分别存储。
9、本方案中,所述根据统计业务数据信息,得到对应统计业务数据信息中的特征以及特征数量的步骤,具体包括:
10、将统计业务数据信息按照独立个体
11、提取统计业务子数据中的子特征,当统计业务子数据中的子特征大于或等于2个时,设为复合特征且记录特征数量一个;
12、复合特征根据其包含的子特征进行区分,当复合特征中的子特征不相同时设为不同的复合特征,不同的复合特征分别记录特征数量。
13、本方案中,还包括:
14、获取统计业务子数据中的子特征值;
15、将所述统计业务子数据中的子特征值进行归一化处理,得到对应子特征的第一数据;
16、将所述子特征的第一数据乘以预设子特征影响系数,得到该子特征对所述统计业务子数据的影响值;
17、当子特征对所述统计业务子数据的影响值小于预设影响阈值时,将对应子特征进行删除;
18、将不同子特征对所述统计业务子数据的影响值进行对比分析,其中将最大影响值对应的子特征设为该统计业务子数据的主要子特征,所述统计业务子数据中的其他子特征为次要子特征。
19、本方案中,所述根据特征合并信息对特征数量进行修正的步骤,具体包括:
20、当统计业务数据信息中的特征存在复合特征时,获取对应复合特征的主要子特征,将具有相同主要子特征的复合特征设为第一合并对象;
21、当统计业务数据信息中的特征存在复合特征时,获取对应复合特征的次要子特征,将具有相同次要子特征的复合特征设为第二合并对象;
22、当统计业务数据信息中的特征不是复合特征时,将统计业务子数据信息中的特征进行对比分析,得到关联度;
23、将关联度按照从大到小的顺序进行排列,并将关联度高的特征设为第三合并对象;
24、根据第一合并对象、第二合并对象和第三合并对象依次对特征数量进行合并直至特征数量和预设分类类别数量相同。
25、本方案中,所述根据特征拆分信息对特征数量进行修正的步骤,具体包括:
26、获取不同特征的统计业务分类数据的数量信息;
27、当统计业务分类数据的数量大于预设第一数量阈值时,将对应统计业务分类数据的特征设为第一拆分对象;
28、当统计业务分类数据的数量小于或等于预设第一数量阈值时,将对应统计业务分类数据的非复合特征设为第二拆分对象;
29、将对应统计业务分类数据的复合特征设为第三拆分对象;
30、根据第一拆分对象、第二拆分对象和第三拆分对象依次对统计业务分类数据对应的特征进行拆分,直至特征数量和预设分类类别数量相同。
31、本方案中,所述根据特征合并信息或特征拆分信息对特征数量进行修正之前,还包括:
32、将统计业务数据信息中的特征数量减去预设分类类别数量,得到特征合并的数量;
33、将特征合并的数量发送至特征合并信息以进行存储;
34、将预设分类类别数量减去统计业务数据信息中的特征数量,得到特征拆分的数量;
35、将特征拆分的数量发送至特征拆分信息以进行存储。
36、本专利技术第二方面提供了一种基于系统的统计业务数据分类系统,包括存储器和处理器,所述存储器中存储有一种基于系统的统计业务数据分类方法程序,所述一种基于系统的统计业务数据分类方法程序被所述处理器执行时实现如下步骤:
37、获取统计业务数据信息;
38、根据统计业务数据信息,得到对应统计业务数据信息中的特征以及特征数量;
39、当统计业务数据信息中的特征数量大于预设分类类别数量时,生成特征合并信息;
40、当统计业务数据信息中的特征数量小于预设分类类别数量时,生成特征拆分信息;
41、根据特征合并信息或特征拆分信息对特征数量进行修正,使特征数量和预设分类类别数量相同;
42、将统计业务数据按特征进行划分,得到不同特征的统计业务分类数据并进行分别存储。
43、本方案中,所述根据统计业务数据信息,得到对应统计业务数据信息中的特征以及特征数量的步骤,具体包括:
44、将统计业务数据信息按照独立个体进行划分,得到多个独立的统计业务子数据;
45、提取统计业务子数据中的子特征,当统计业务子数据中的子特征大于或等于2个时,设为复合特征且记录特征数量一个;
46、复合特征根据其包含的子特征进行区分,当复合特征中的子特征不相同时设为不同的复合特征,不同的复合特征分别记录特征数量。
47、本方案中,还包括:
48、获取统计业务子数据中的子特征值;
49、将所述统计业务子数据中的子特征值进行归一化处理,得到对应子特征的第一数据;
50、将所述子特征的第一数据乘以预设子特征影响系数,得到该子特征对所述统计业务子数据的影响值;
51、当子特征对所述统计业务子数据的影响值小于预设影响阈值时,将对应子特征进行删除;
52、将不同子特征对所述统计业务子数据的影响值进行对比分析,其中将最大影响值对应的子特征设为该统计业务子数据的主要子特征,所述统计业务子数据中的其他子特征为次要子特征。
53、本方案中,所述根据特征合并信息对特征数量进行修正的步骤,具体包括:
54、当统计业务数据信息中的特征存在复合特征时,获取对应复合特征的主要子特征,将具有相同主要子特征的复合特征设为第一合并对象;
55、当统计业务数据信息本文档来自技高网...
【技术保护点】
1.一种基于系统的统计业务数据分类方法,其特征在于,包括:
2.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据统计业务数据信息,得到对应统计业务数据信息中的特征以及特征数量的步骤,具体包括:
3.根据权利要求2所述的一种基于系统的统计业务数据分类方法,其特征在于,还包括:
4.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据特征合并信息对特征数量进行修正的步骤,具体包括:
5.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据特征拆分信息对特征数量进行修正的步骤,具体包括:
6.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据特征合并信息或特征拆分信息对特征数量进行修正之前,还包括:
7.一种基于系统的统计业务数据分类系统,其特征在于,包括存储器和处理器,所述存储器中存储有一种基于系统的统计业务数据分类方法程序,所述一种基于系统的统计业务数据分类方法程序被所述处理器执行时实现如下步骤:
9.根据权利要求8所述的一种基于系统的统计业务数据分类系统,其特征在于,还包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有一种基于系统的统计业务数据分类方法程序,所述一种基于系统的统计业务数据分类方法程序被处理器执行时,实现如权利要求1至6中任一项所述的一种基于系统的统计业务数据分类方法的步骤。
...【技术特征摘要】
1.一种基于系统的统计业务数据分类方法,其特征在于,包括:
2.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据统计业务数据信息,得到对应统计业务数据信息中的特征以及特征数量的步骤,具体包括:
3.根据权利要求2所述的一种基于系统的统计业务数据分类方法,其特征在于,还包括:
4.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据特征合并信息对特征数量进行修正的步骤,具体包括:
5.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据特征拆分信息对特征数量进行修正的步骤,具体包括:
6.根据权利要求1所述的一种基于系统的统计业务数据分类方法,其特征在于,所述根据特征合并信息或特征拆分信息对特征数量进行修正之前,...
【专利技术属性】
技术研发人员:马杰,罗清,武峰波,刘美霞,彭霄,刘招英,
申请(专利权)人:南方电网数字平台科技广东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。