System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,具体而言,涉及一种电子会计档案数据的解析方法、装置、电子设备及介质。
技术介绍
1、传统的电子会计档案数据的采集方式是:每次采集数据的时候都需要先把对方的数据读取进行,再进行解析。这种解析数据的方法效率低下,如果数据很大,解析所有数据的时间会很长,严重影响数据处理的速度。
2、同时对于大量数据的解析,现有的解析方法往往是进行各个电子会计档案数据的单独解析,大量时间浪费每次的数据解析,极大的降低了数据解析效率。
技术实现思路
1、本申请实施例的目的在于提供一种电子会计档案数据的解析方法、装置、电子设备及介质,通过多解析线程对多个电子会计档案数据的并行数据解析,提高了数据解析效率。
2、第一方面,提供了一种电子会计档案数据的解析方法,应用于解析系统中,所述解析系统包括多个解析线程以及与各解析线程一一对应的容量可调的解析启动池,该方法可以包括:
3、获取当前待解析的多个电子会计档案数据和相应的数据特征信息;不同电子会计档案数据的数据量不同;
4、基于训练好的决策树模型,对所述数据特征信息进行处理,得到针对多个电子会计档案数据的容量调整决策;所述决策树模型用于基于待解析的多个电子会计档案数据的数据特征信息确定各空闲的解析启动池对应的容量调整决策;
5、基于所述容量调整决策,对所述各空闲的解析启动池的容量进行调整;
6、按照所述各空闲的解析启动池调整后的容量,对所述多个电子会计档案数据进行分配;
>7、针对任一解析启动池,若检测到所述解析启动池中分配的电子会计档案数据达到预设容量,则控制该解析启动池对应的解析线程对已分配的电子会计档案数据进行解析。
8、在一个可能的实现中,获取当前待解析的多个电子会计档案数据和相应的数据特征信息之后,所述方法还包括:
9、将当前待解析的多个电子会计档案数据存储在待解析池中。
10、在一个可能的实现中,所述数据特征信息包括单位时间内的数据传输数量、单位时间内的数据传输大小、单位时间内的数据传输速率和各电子会计档案数据中的数据量中的一种或多种。
11、在一个可能的实现中,所述决策树模型的训练过程包括:
12、获取训练数据集,所述训练数据集包括获取不同电子会计档案数据的数据特征信息和相应的联动参数相关的容量调整决策;
13、基于配置的决策树算法和所述训练数据集,构建决策树模型。
14、在一个可能的实现中,所述决策树算法为id3算法、c4.5算法或cart算法。
15、在一个可能的实现中,控制该解析启动池对应的解析线程对已分配的电子会计档案数据进行解析之后,所述方法还包括:
16、在该解析启动池中对已解析的电子会计档案数据进行删除。
17、在一个可能的实现中,所述方法还包括:
18、若该解析启动池中任一电子会计档案数据解析失败,则控制相应解析线程对解析失败的电子会计档案数据的下一个电子会计档案数据进行解析,并生成数据解析失败的日志信息,所述日志信息包括解析失败的电子会计档案数据。
19、第二方面,提供了一种电子会计档案数据的解析装置,应用于解析系统中,所述解析系统包括多个解析线程以及与各解析线程一一对应的容量可调的解析启动池,该装置可以包括:
20、获取单元,用于获取当前待解析的多个电子会计档案数据和相应的数据特征信息;不同电子会计档案数据的数据量不同;
21、处理单元,用于基于训练好的决策树模型,对所述数据特征信息进行处理,得到针对多个电子会计档案数据的容量调整决策;所述决策树模型用于基于待解析的多个电子会计档案数据的数据特征信息确定各空闲的解析启动池对应的容量调整决策;
22、调整单元,用于基于所述容量调整决策,对所述各空闲的解析启动池的容量进行调整;
23、分配单元,用于按照所述各空闲的解析启动池的目标容量,对所述多个电子会计档案数据进行分配;
24、控制单元,用于针对任一解析启动池,若检测到所述解析启动池中分配的电子会计档案数据达到预设容量,则控制该解析启动池对应的解析线程对已分配的电子会计档案数据进行解析。
25、第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
26、存储器,用于存放计算机程序;
27、处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤。
28、第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。
29、本申请实施例提供的一种电子会计档案数据的解析方法在获取当前待解析的多个电子会计档案数据和相应的数据特征信息后,不同电子会计档案数据的数据量不同;基于训练好的决策树模型,对数据特征信息进行处理,得到针对多个电子会计档案数据的容量调整决策;决策树模型用于基于待解析的多个电子会计档案数据的数据特征信息确定各空闲的解析启动池对应的容量调整决策;基于容量调整决策,对各空闲的解析启动池的容量进行调整;按照各空闲的解析启动池调整后的容量,对多个电子会计档案数据进行分配;针对任一解析启动池,若检测到解析启动池中分配的电子会计档案数据达到预设容量,则控制该解析启动池对应的解析线程对已分配的电子会计档案数据进行解析。该方法通过多解析线程同时解析多个电子会计档案数据,提高了解析效率。
本文档来自技高网...【技术保护点】
1.一种电子会计档案数据的解析方法,其特征在于,应用于解析系统中,所述解析系统包括多个解析线程以及与各解析线程一一对应的容量可调的解析启动池,所述方法包括:
2.如权利要求1所述的方法,其特征在于,获取当前待解析的多个电子会计档案数据和相应的数据特征信息之后,所述方法还包括:
3.如权利要求1所述的方法,其特征在于,所述数据特征信息包括单位时间内的数据传输数量、单位时间内的数据传输大小、单位时间内的数据传输速率和各电子会计档案数据中的数据量中的一种或多种。
4.如权利要求1所述的方法,其特征在于,所述决策树模型的训练过程包括:
5.如权利要求4所述的方法,其特征在于,所述决策树算法为ID3算法、C4.5算法或CART算法。
6.如权利要求1所述的方法,其特征在于,控制该解析启动池对应的解析线程对已分配的电子会计档案数据进行解析之后,所述方法还包括:
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种电子会计档案数据的解析装置,其特征在于,应用于解析系统中,所述解析系统包括多个解析线
9.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法。
...【技术特征摘要】
1.一种电子会计档案数据的解析方法,其特征在于,应用于解析系统中,所述解析系统包括多个解析线程以及与各解析线程一一对应的容量可调的解析启动池,所述方法包括:
2.如权利要求1所述的方法,其特征在于,获取当前待解析的多个电子会计档案数据和相应的数据特征信息之后,所述方法还包括:
3.如权利要求1所述的方法,其特征在于,所述数据特征信息包括单位时间内的数据传输数量、单位时间内的数据传输大小、单位时间内的数据传输速率和各电子会计档案数据中的数据量中的一种或多种。
4.如权利要求1所述的方法,其特征在于,所述决策树模型的训练过程包括:
5.如权利要求4所述的方法,其特征在于,所述决策树算法为id3算法、c4.5算法或cart算法。
<...【专利技术属性】
技术研发人员:肖建伟,甘友冰,王伟东,龚恒,
申请(专利权)人:北京合思信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。