【技术实现步骤摘要】
一种Excel表格数据匹配方法
[0001]本专利技术涉及数据匹配
,尤其涉及一种Excel表格数据匹配方法。
技术介绍
[0002]镇街、村社基层统计是统计的基础,是政府数据采集的源头。现行的统计报表制度主要有各专业的定期报表制度,其中部分专业还细分了规模以上的全面报表制度和规模以下的抽样调查制度,这些都要求基层统计工作人员每月或定期完成。同时,我国现行还有三大普查:五年一次的经济普查、十年一次的农业普查和人口普查。普查年年有,中间还穿插人口抽样调查、住户抽样调查、劳力动抽样调查等各式各样的调查,给基层统计部门造成了沉重的压力。
[0003]目前,很多政府部门要采集报表数据,首先通过召集镇街工作人员进行开会培训。其次,委办局工作人员制作Excel模板并下发给各个镇街填写;镇街接收到数据采集模板后,发现很多数据需要最基层的村社通过实际的入户走访才能获取,于是镇街相关部门又召集各个村社的工作人员进行培训并下发采集模板。最后,村社工作人员填报好数据后提交给镇街部门汇总,镇街道部门再提交给委办局汇总。整个过程不但周期 ...
【技术保护点】
【技术特征摘要】
1.一种Excel表格数据匹配方法,其特征在于,包括以下步骤:步骤一:数据处理,数据中台将已有的基础信息表根据业务领域进行分类,并根据业务规则建立关联关系映射表;步骤二:工作人员按预设报表采集格式要求编制表头模板,导入报表系统;步骤三:数据匹配,解析Excel表头模板,获取表头信息,并通过改进Aho
‑
Corasick算法将解析出的表头信息与数据中台建立的关联关系映射表表头进行匹配,根据匹配的结果返回相应的报表数据。2.根据权利要求1所述的一种Excel表格数据匹配方法,其特征在于,所述步骤三中的数据匹配过程包括:首先,按以下条件建立匹配树:条件一:存在一个根节点,不代表任何字符,匹配树中其余每个节点保存关键词中的一个字符,并以字符值代指该节点;条件二:若存在一个关键词,字符A是关键词中的一个字符,字符B是字符A的后继字符,则称字符B是字符A的子节点,所有关键词的第一个字符都是根节点的子节点,其中相同的字符用同一个子节点表示;条件三:如果从根节点到节点M经过的所有节点组成一条关键词,则把该条关键词的结束标志0也加入到节点M的子节点中,这个0节点称为叶子节点;条件四:在节点M中记录子节点个数n,对节点M的任一子节点N,将其节点值对n取模,所有模相同的子节点相连组成一个链表;条件五:所有的链表组成一个数组,节点M通过child指针指向该数组;条件六:所有从根节点开始通过child指针到达某个结点的路径是唯一的,从根到任一叶子节点可以得到一条关键词;反之,每条关键词都在匹配树中存在一条唯一的从根节点到叶子节点的路径;条件七:将从根节点到节点M经过的节点相连得到一个字符串,设长度为m,则获得m
‑
1个以节点M结尾的真子串,如果存在最长的真子串S,假设真子串S是某个关键词的起始部份,则在匹配树中存在一条从根节点到达节点F的路径,代表该真子串;节点M通过next指针与节点F相连;节点F就是匹配到节点M匹配失败状态后需要继续进行匹配的下一个节点;其次,根据匹配条件查询出关键词对应的业务数据。3.根据权利要求1所述的一种Excel表格数据匹配方法,其特征在于,所述步骤三中的通过改进Aho
‑
Corasick算法将解析出的表头信息与数据中台建立的关联...
【专利技术属性】
技术研发人员:钟凯,覃进千,王震,王勇,王苹,元子婴,
申请(专利权)人:创意信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。