一种实现区域企业软件著作权公告摸底与管理的系统技术方案

技术编号:12520535 阅读:75 留言:0更新日期:2015-12-17 11:21
一种实现区域企业软件著作权公告摸底与管理的系统。本发明专利技术公开了一种基于软件著作权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的软件著作权状态监控、详细情况等监控与管理的系统,本系统无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。

【技术实现步骤摘要】

本专利技术主要涉及一种实现区域企业软件著作权公告摸底与管理的系统,尤其是通过软件著作权公布网站的页面信息抓取、分析、整理、建档和运用以实现待查的区域的企业的软件著作权拥有情况摸底及运用的系统。
技术介绍
目前,一个地区,或者说一定区域的企业,想查询所有企业各自的软件著作权拥有情况,尤其是广谱式的全民式查底,目前的方法相对难以实现,其不但需要到每个部门将软件著作权等数据归库,并且需要对每个地区数以百万计的企业与数以百万计的数据进行比对,这样不但成本高,而且数据源相对敏感而难以实现。然而,一个地区的企业的知识产权状况,对于地方知识产权政策的制定与实施,以及地方政府对企业知识产权的管理等具有极强的基础性需求。
技术实现思路
为了解决上述问题,本专利技术提出了一种基于软件著作权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的软件著作权情况等监控与管理的系统,此系统无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。一种实现区域企业软件著作权公告摸底与管理的系统,其主要包含以下结构: 企业信息库、第一软件著作权信息采集模块、第一比对信息库、第二比对信息库、第二软件著作权信息采集模块、第一企业知识产权信息库和第二企业知识产权信息库;其中企业信息库包含企业名称字段,第一比对信息库含企业名称字段;第一软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给第一软件著作权信息采集模块进行getHTTPPage方式访问生成的URL生成HTML代码后进行标记识别获取各信息码,各信息码根据对应的值判断,对应写入第一比对信息库和第二比对信息库;其中,第二比对信息库是汇总的比对信息库,写入第二比对信息库的数据同步写入第一企业知识产权信息库;第一比对信息库是通过参数对比成功的信息,即拥有软件著作权的企业数据,进行数据合并后存入第一比对信息库,然后对应地通过第二软件著作权信息采集模块进行第二次详细软件著作权信息的采集,第二软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块,与第一软件著作权信息采集模块不同的是,第二软件著作权信息采集模块的采集程序中的标记信息及生成的URL的不同,其中第二知识产权信息采集模块生成URL时,同时采用所采集到的页码信息码作为参数,通过FOR循环生成URL集;经第二软件著作权信息采集模块采集到具体的知识产权信息集合后存入第二企业知识产权信息库。所述的第一软件著作权信息采集模块均包含第一信息码:通过以“〈title〉”标记开始和“〈/title〉”标记结束生成;通过截取如下标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2” ;获取第三信息码,其开始标记为“中国”,结束标记为“<tdclass=” ;第四信息码通过开始标记为“”获取生成。所述的SQL语句管理模块,包括企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。所述的第一比对信息库包含第一信息码、第二信息码、第三信息码、第四信息码、第五信息码、第六信息码、第七信息码、第八信息码和第九信息码,其截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码对应的起止标记分别如下: 软件著作权:开始标记:“页/共”,结束标记页”。所述的编码管理模块,当官方机构公布的数据对应的编码发生变更时,将根据实际所发生的变化变更编码方式;所述的URL中,当官方机构公布时采用的URL进行加密发布时,本方法将根据实际情况进行数据加密编码;所述的URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密。所述的第一比对信息库,还包含第八信息码和第十三信息码,当第八信息码的值大于I时,通过获取软件著作权的条数的统计数据第十三信息码与现有的第二企业知识产权信息库中的数据对比,当第十三信息码不大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,不必进行第二页及后面的读取;当第十三信息码大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,根据超出的数量进行增量更新。【附图说明】图1一种实现区域企业软件著作权公告摸底与管理的系统的总体流程图。图2—种实现区域企业软件著作权公告摸底与管理的系统第一组步骤集合的流程图。 图3 —种实现区域企业软件著作权公告摸底与管理的方法的实现流程图。【具体实施方式】一种实现区域企业软件著作权公告摸底与管理的系统,其主要包含以下步骤: 企业信息库、第一软件著作权信息采集模块、第一比对信息库、第二比对信息库、第二软件著作权信息采集模块、第一企业知识产权信息库和第二企业知识产权信息库;其中企业信息库包含企业名称字段,第一比对信息库含企业名称字段;第一软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给第一软件著作权信息采集模块进行getHTTPPage方式访问生成的URL生成HTML代码后进行标记识别获取各信息码,各信息码根据对应的值判断,对应写入第一比对信息库和第二比对信息库;其中,第二比对信息库是汇总的比对信息库,写入第二比对信息库的数据同步写入第一企业知识产权信息库;第一比对信息库是通过参数对比成功的信息,即拥有软件著作权的企业数据,进行数据合并后存入第一比对信息库,然后对应地通过第二软件著作权信息采集模块进行第二次详细软件著作权信息的采集,第二软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块,与第一软件著作权信息采集模块不同的是,第二软件著作权信息采集模块的采集程序中的标记信息及生成的URL的不同,其中第二知识产权信息采集模块生成URL时,同时采用所采集到的页码信息码作为参数,通过FOR循环生成URL集;经第二软件著作权信息采集模块采集到具体的知识产权信息集合后存入第二企业知识产权信息库。所述的第一软件著作权信息采集模块均包含第一信息码:通过以“〈title〉”标记开始和“〈/title〉”标记结束生成;通过截取如下标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2” ;获取第三信息码,其开始标记为“中国”,结束标记为“<tdclass=” ;第四信息码通过开始标记为“”获取生成。...

【技术保护点】
一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,其主要包含以下结构:企业信息库、第一软件著作权信息采集模块、第一比对信息库、第二比对信息库、第二软件著作权信息采集模块、第一企业知识产权信息库和第二企业知识产权信息库;其中企业信息库包含企业名称字段,第一比对信息库含企业名称字段;第一软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给第一软件著作权信息采集模块进行getHTTPPage方式访问生成的URL生成HTML代码后进行标记识别获取各信息码,各信息码根据对应的值判断,对应写入第一比对信息库和第二比对信息库;其中,第二比对信息库是汇总的比对信息库,写入第二比对信息库的数据同步写入第一企业知识产权信息库;第一比对信息库是通过参数对比成功的信息,即拥有软件著作权的企业数据,进行数据合并后存入第一比对信息库,然后对应地通过第二软件著作权信息采集模块进行第二次详细软件著作权信息的采集,第二软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块,与第一软件著作权信息采集模块不同的是,第二软件著作权信息采集模块的采集程序中的标记信息及生成的URL的不同,其中第二知识产权信息采集模块生成URL时,同时采用所采集到的页码信息码作为参数,通过FOR循环生成URL集;经第二软件著作权信息采集模块采集到具体的知识产权信息集合后存入第二企业知识产权信息库。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄庆梅郑俊杰其他发明人请求不公开姓名
申请(专利权)人:佛山市恒南微科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1