An enterprise software copyright announcement information grabbing method discloses a method for grabbing the page level of publicly registered or changed announcement data based on software copyright by the getHTTPPage method, and then obtains the first information code, the second information code and the third information code by combining the markup analysis method, and then through the above-mentioned method. Comparing the information codes, the fourth information code is generated under the corresponding procedure, and then written into the first intellectual property information database and the second intellectual property information database according to the corresponding method, so as to be used in different occasions for the capture and management of enterprise intellectual property information.
【技术实现步骤摘要】
一种企业软件著作权公告信息抓取方法
本专利技术主要涉及一种企业软件著作权公告信息抓取方法,尤其是通过软件著作权公布网站的页面信息抓取、分析、整理和建档的系统。
技术介绍
目前,软件著作权的信息获取大多基于通过相关部门所公开的数据接口来实现软件著作权信息的同步,或者通过复杂的运算与抓取而获得信息量较少的信息。此方法对于经常性的、大数据的企业软件著作权的信息获取显得难以胜任,并且应用成本高,风险大,不利于中小中介服务机构推广应用。软件著作权的信息,尤其是建立企业研发信用体系,更显得非常重要,同时也是中介服务机构提高自身服务质量的有力支持。
技术实现思路
为了解决上述问题,本专利技术提出了一种基于软件著作权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合标记分析方法获得第一信息码、第二信息码和第三信息码,再通过上述信息码之间的对比,在相应程序下生成第四信息码,然后依对应的方法写入第一软件著作权信息库和第二软件著作权信息库,以备不同的场合使用的一种企业软件著作权公告信息抓取与管理的系统。一种企业软件著作权公告信息抓取方法,其主要包含以 ...
【技术保护点】
1.一种企业软件著作权公告信息抓取方法,其特征包括,其主要包含以下结构:企业信息库、编码管理程序、软件著作权公布数据采集管理模块、信息码管理模块、第一比对信息库、第二比对信息库、企业软件著作权公告信息库和接口管理模块 ;其中信息码管理模块由第一信息码、第二信息码、第三信息码和第四信息码组成 ;企业信息库包含企业信息数据和 SQL 语句管理模块,其通过 SQL 语句条件检索后返回值给编码管理程序确定编码方式,然后输出对应编码方式编码后的企业名称,同时发送到软件著作权公布数据采集管理模块生成相应的以上述编码后的企业名称为变量的 URL,信息码管理模块通过getHTTPPage ...
【技术特征摘要】
1.一种企业软件著作权公告信息抓取方法,其特征包括,其主要包含以下结构:企业信息库、编码管理程序、软件著作权公布数据采集管理模块、信息码管理模块、第一比对信息库、第二比对信息库、企业软件著作权公告信息库和接口管理模块;其中信息码管理模块由第一信息码、第二信息码、第三信息码和第四信息码组成;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给编码管理程序确定编码方式,然后输出对应编码方式编码后的企业名称,同时发送到软件著作权公布数据采集管理模块生成相应的以上述编码后的企业名称为变量的URL,信息码管理模块通过getHTTPPage方式访问生成的URL,并将获得的页面HTML静态化,同时执行信息码管理模块中的标记识别截取页面信息以对应生成第一信息码、第二信息码、第三信息码和第四信息码;当第一信息码为空时,系统将返回重新执行企业信息库的SQL语句操作,并检查网络、数据可靠性以及各模块运作是否正常;当第一信息码不为空,第二信息码为空时,将第三信息码和第四信息码设置为“0”,然后写入第一比对信息库,同时写入企业软件著作权公告信息库;当第二信息码不为空,通过信息码管理模块标记识别截取页面信息,去杂后生成第三信息码,当第三信息码也为空时,设置第四信息码为“1”,当第三信息码不为空时,设置第四信息码的值与第三信息码的值相同,与辅助信息一并写入第二比对信息库,同时写入企业软件著作权公告信息库;企业软件著作权公告信息库通过SQL语句与存贮过程共同组成接口,通过接口管理模块供第三方系统调用。2.根据权利要求1所述的一种企业软件著作权公告信息抓取方法,其特征包括,所述的企业信息库所包含的SQL...
【专利技术属性】
技术研发人员:周宜星,
申请(专利权)人:苏州市铜钱草科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。