流式分类统计方法技术

技术编号：2868564 阅读：222 留言：0更新日期：2012-04-11 18:40

流式分类统计方法，其特征在于：（１）在数据输入时，数据文件以文本文件形式存放，数据文件由若干组数据组成；（２）在统计时，统计程序会顺序扫描文件的每一行；遇到标题行时，首先看是否有上组已统计的数据，如果有则输出该组数据的统计结果并将该结果汇总到总结果中；对随后的参数行和数据行进行统计处理，直到遇到下一个标题行；程序不断重复以上过程，直到文件结束；最后输出各组数据的汇总结果。信息和数据的存放采用文本格式，不依赖于特定的软件就可以编辑和阅读，格式自由，可读性好，而且节省存储空间。信息记录原始性强。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机信息处理的方法，具体地说是一种。
技术介绍
现在的信息时代，获得信息已不是什么难事，重要的是如何处理信息、统计信息和使用信息。IE浏览器等网络软件解决的是信息的获取问题。WORD、WPS等办公软件，解决的是编辑、排版等信息表达的形式问题。FOX、EXCEL、ORACLE等数据库软件，解决的是信息的组织、管理问题，采用的是“库”的思想，侧重的是状态管理，“库”有固定的格式，数据的录入也有固定的格式，数据录入后，数据即写入库结构的字段中，除字段记录的信息外，其他的历史性或个性化的痕迹就没有了。这里所称痕迹是指那些隐含的特征或属性，它与历史的阶段性或个人的习惯有关，这些痕迹的存在，会使人觉得有亲和力和可靠的感觉。比如，一篇报道，只凭内容你就能看出它是解放前的或文革时期的或是改革开放以后的；你自己的日记本，你打开以后，你就能确定这是自己写的日记，一般情况下你不怀疑你看到的这些内容是别人记的，你对它肯定是充满了亲切和信任。如果没有这些痕迹的存在，你可能会觉得不安全。库软件，采用的是“锅烩式”的“库”方法，“库”总是有满的时候，在一次统计中，处理的记录数目也必定是有限的。如DOS下的FOXBASE能处理的库的记录最大数只有几千个。如果某字段的数据出错，系统可能无法运行。库方法是一种集中式的方法，而日常工作和生活中的信息有往往是海量的、随机的、分散的、变化的、发展的、流水式的，用库方法来处理日常信息虽然可以使用，但肯定是蹩脚的。现在所用的办公信息管理系统、财务管理软件，也都是采用“库”的思想，注重的是状态管理，没有记载历史的痕迹，更谈不上有什么个...

【技术保护点】
流式分类统计方法，其特征在于：（１）、在数据输入时：数据文件以文本文件形式存放，数据文件由若干组数据组成，每一组数据可以包含标题行、参数行或数据行；标题行是本组数据的起始标志，也是上组数据的结束标志，它还包含着以后检索会用到的关键字或关键变量；参数行是对统计程序进行设置，以满足不同的统计需要；数据行是记录各种类型属性的符号描述；每一种类型有一个名称，同时具备两种属性：数值和数量；（２）、在对上述数据文件统计时：统计程序会顺序扫描文件的每一行；遇到标题行时，首先看是否有上组已统计的数据，如果有则输出该组数据的统计结果并将该结果汇总到总结果中；然后判断该标题行是否满足指定的检索条件，如果没有指定检索条件则意味着统计所有数据，如果满足条件，就对随后的参数行和数据行进行统计处理，直到遇到下一个标题行；如果标题行不满足指定条件，则跳过随后扫描到的参数行和数据行，直到遇到下一个标题行；程序不断重复以上过程，直到文件结束；最后输出各组数据的汇总结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：徐砚星，
申请(专利权)人：徐砚星，
类型：发明
国别省市：44[中国|广东]

全部详细技术资料下载我是这个专利的主人