【技术实现步骤摘要】
基于组织机构代码的信息获取方法和装置
[0001]本专利技术涉及基于信息获取
,具体涉及一种基于组织机构代码的信息获取方法和装置。
技术介绍
[0002]现有技术中,获取企事业单位的相关信息(例如,成立时间、人员、以及变更信息等)时,需要确定企事业单元的名称或者名称关键词,才能在网络中获取需要的信息,在一般的需求中,通过手动或关键词去检索,则可以应对。但是在一些其他的需求中,比如对广州市,成立时间超过5年,人员规模大于100人的企事业进行信息推送,则上述方法无法满足需求。
技术实现思路
[0003]针对所述缺陷,本专利技术实施例公开了一种基于组织机构代码的信息获取方法和装置,其通过自动生成组织机构代码信息的方式来搜索得到机构主体以及目标信息,可以用于各种信息推送中。
[0004]本专利技术实施例第一方面公开一种基于组织机构代码的信息获取方法,其包括:
[0005]随机生成组织机构代码信息,形成组织机构代码数据库;
[0006]利用所述组织机构代码数据库中各个组织机构代码信息在互联网中检索,确定唯一机构主体,以及所述唯一机构主体对应的目标信息,构建所述组织机构代码信息对应的机构主体信息数据库;
[0007]标记未检索到唯一机构主体的组织机构代码信息,形成标记数据库;在预设周期内利用所述标记数据库中的组织机构代码信息进行遍历搜索,搜索完成后,对所述标记数据库进行更新。
[0008]作为较佳的实施例,在本专利技术实施例的第一方面中,随机生成组织机构代码信息,形成 ...
【技术保护点】
【技术特征摘要】
1.一种基于组织机构代码的信息获取方法,其特征在于,包括:随机生成组织机构代码信息,形成组织机构代码数据库;利用所述组织机构代码数据库中各个组织机构代码信息在互联网中检索,确定唯一机构主体,以及所述唯一机构主体对应的目标信息,构建所述组织机构代码信息对应的机构主体信息数据库;标记未检索到唯一机构主体的组织机构代码信息,形成标记数据库;在预设周期内利用所述标记数据库中的组织机构代码信息进行遍历搜索,搜索完成后,对所述标记数据库进行更新。2.根据权利要求1所述的基于组织机构代码的信息获取方法,其特征在于,随机生成组织机构代码信息,形成组织机构代码数据库,包括:随机生成8位包括数字或/和大写拉丁字母的组合,得到所述组织机构代码信息的本体信息;基于以下公式确定第9位信息,得到所述组织机构代码信息的校验码;其中,C9为校验码的值,C
i
为第i位本体信息的值,1≤i≤8,W
i
为第i位本体信息对应的加权因子,MOD为取余操作;当C9=10时,则校验码为X,当C9=11时,则校验码为0,当所述C9=j时,校验码也为j,j为0
‑
9中的任意数字;将所述本体信息和所述校验码信息合并,形成所述组织机构代码信息,构建所述组织机构代码信息的集合,形成组织机构代码数据库。3.根据权利要求1所述的基于组织机构代码的信息获取方法,其特征在于,所述利用所述组织机构代码数据库中各个组织机构代码信息在互联网中检索,确定唯一机构主体,以及所述唯一机构主体对应的目标信息,构建所述组织机构代码信息对应的机构主体信息数据库,包括:确定以组织机构代码信息为关键词的互联网中的网站;在所述网站中遍历所述所述组织机构代码数据库中各个组织机构代码信息进行搜索;确定搜索到唯一机构主体的组织机构代码信息,并将所述唯一机构主体以及其对应的目标信息与所述组织机构代码信息相关联,形成机构主体信息数据库,所述机构主体信息数据库的每个机构主体信息以对应的组织机构代码信息作为标签。4.根据权利要求3所述的基于组织机构代码的信息获取方法,其特征在于,当所述网站为多个时,比较每个网站利用同一组织机构代码信息搜索到的唯一机构主体是否一致,如果不一致,则将所述同一组织机构代码信息记为异常信息。5.根据权利要求1
‑
4任一项所述的基于组织机构代码的信息获取方法,其特征在于,标记未检索到唯一机构主体的组织机构代码信息,形成标记数据库;在预设周期内利用所述标记数据库中的组织机构代码信息进行遍历搜索,搜索完成后,对所述标记数据库进行更新,包括:将未检索到唯一机构主体的组织机构代码信息汇总,形成标记数据库;在预设周期内定时利用所述标记数据库中的组织机构代码信息在互联网中遍历搜索;
如果所述标记数据库中的目标组织机构代码信息搜索到唯一机构主体,则将所述目标组织机构代码信息从所述标记数据库中剔除,并将所述目标组织机构代码信息、搜索...
【专利技术属性】
技术研发人员:赵穗杰,万友先,陈孔璋,何一鸣,陈帅,
申请(专利权)人:广州市易工品科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。