The invention discloses a method for batch automatic statistics of XML files, which comprises the following steps: step S101: standardizing the naming of XML files and the placement of directories; step S102: importing the XML files into a database in batch, creating a corresponding data table according to the classification of the XML file names; step S103: executing a python import program to automatically import the XML files into data in batch Table corresponding to the library. The method for batch automatic statistical data of XML file provided by the invention, in which each step is automatically operated by program script at different times, reduces human operation and statistical time, and greatly improves work efficiency.
【技术实现步骤摘要】
一种xml文件批量自动统计数据的方法
本专利技术涉及一种统计数据的方法,尤其涉及一种xml文件批量自动统计数据的方法。
技术介绍
xml是一种标记数据、定义数据类型,允许用户对自己的标记语言进行定义的源语言,适合互联网的传输。在大数据传输与保存处理,传输的xml文件个数都是成千上万,数据量可达到单个文件上GB级别。管理员时常会对xml文件进行读取与稽查统计,再写出报告结果来得出业务运营问题。通常会用以下两个办法:(1)人工方式来读取和分析,把单个xml文件转成电子表格,再通过电子表格的函数来时行分析。(2)通过传统程序来解决,先把XML数据导到内存中,然后再统计、导出统计结果,再继续读取下一个xml分析,直到处理完所有的xml文件。现有的大规模的xml数据文件传统处理方式会存在以下缺点:(1)效率低下:首先是人工通过转换xml格式,遇到数据量多的,转换过成时间久且会出错。如果遇到成百上千个xml文件,那将会消耗大量的时间来统计,浪费人力成本。(2)通过传统程序来处理方式,适用于少量的x ...
【技术保护点】
1.一种xml文件批量自动统计数据的方法,其特征在于,包括以下步骤:/n步骤S101:规范xml文件的命名和目录的放置;/n步骤S102:将所述xml文件批量导入数据库,根据所述XML的文件名称分类,创建对应的数据表;/n步骤S103:执行python导入程序,批量自动把所述xml文件导入数据库对应的表。/n
【技术特征摘要】 【专利技术属性】
1.一种xml文件批量自动统计数据的方法,其特征在于,包括以下步骤:
步骤S101:规范xml文件的命名和目录的放置;
步骤S102:将所述xml文件批量导入数据库,根据所述XML的文件名称分类,创建对应的数据表;
步骤S103:执行python导入程序,批量自动把所述xml文件导入数据库对应的表。
2.如权利要求1所述的xml文件批量自动统计数据的方法,其特征在于,在所述步骤S103之后还包括步骤S104:按要求统计所述导入数据库的xml文件,生成统计结果后导出电子表格,进行归档保存。
3.如权利要求1所述的xml文件批量自动统计数据的方法,其特征在于,在所述步骤S101之前还包括建立负责统计的服务器和xml生成文件服务器之间的信任关系,将所述负责统计的服务器和所述xml生成文件服务器的帐号和密码写到脚本中的变量。
技术研发人员:程永新,林小勇,段文香,
申请(专利权)人:上海新炬网络技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。