内容管理系统识别方法及装置制造方法及图纸

技术编号:30140965 阅读:17 留言:0更新日期:2021-09-23 15:03
本公开提供一种内容管理系统识别方法、装置、电子设备及介质。该方法包括:获取多种CMS识别方式;按照每种CMS识别方式的优先级顺序以及每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果;当获取到的匹配结果为匹配成功,确定所述CMS的类型。实现了利用多种识别方式识别内容管理系统,提升了内容管理系统的可识别范围以及准确率。理系统的可识别范围以及准确率。理系统的可识别范围以及准确率。

【技术实现步骤摘要】
内容管理系统识别方法及装置


[0001]本公开涉及计算机技术和通信
,尤其是涉及一种内容管理系统识别方法、装置、电子设备及介质。

技术介绍

[0002]随着网络应用的丰富和发展,很多网站往往不能迅速跟进大量信息衍生及业务模式变革的脚步,常常需要花费许多时间、人力和物力来处理信息更新和维护工作。遇到网站扩充的时候,整合内外网及分支网站的工作就变得更加复杂,甚至还需重新建设网站,如此下去,用户始终在一个高成本、低效率的循环中升级、整合。于是,产生了很多负反馈:页面制作无序,网站风格不统一,大量信息堆积,发布显得异常沉重,内容繁杂,手工管理效率低下,手工链接视音频信息经常无法实现,应用难度较高,许多工作需要技术人员配合才能完成,角色分工不明确,改版工作量大,系统扩展能力差,集成其它应用时更是降低了灵活性,对于网站建设和信息发布人员来说,他们最关注的系统的易用性和的功能的完善性,因此,内容管理系统(Content Management System,CMS)就应运而生。
[0003]CMS是一种位于网络前端(Web服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统。内容的创作人员、编辑人员、发布人员使用内容管理系统来提交、修改、审批、发布内容。CMS具有许多基于模板的优秀设计,可以加快网站开发的速度和减少开发的成本。网站内容管理系统的功能并不只限于文本处理,它也可以处理图片、Flash动画、声像流、图像甚至电子邮件档案。CMS其实是一个很广泛的称呼,从一般的博客程序,新闻发布程序,到综合性的网站管理程序都可以被称为内容管理系统。
[0004]随着CMS的广泛应用,暴露出来的问题也日趋严重。网站的建设趋于模板化,许多网站都是基于同一个CMS的模板衍生而来,一旦使用的模板本身存在漏洞,生成的网站也会带有漏洞,会直接导致使用统一模板的一大批网站存在被入侵的风险,所以关于CMS的模板类型判断极为重要。只有准确获取到了网站使用的CMS类型,才能借此判断网站可能存在的CMS漏洞。
[0005]在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]有鉴于此,本专利技术提供一种内容管理系统识别方法、装置、电子设备及介质,实现了利用多种识别方式识别内容管理系统,提升了内容管理系统的可识别范围以及准确率。
[0007]本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。
[0008]根据本专利技术实施例的一方面,提供一种内容管理系统识别方法,所述方法包括:获取多种CMS识别方式;按照每种CMS识别方式的优先级顺序以及每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结
果;当获取到的匹配结果为匹配成功,确定所述CMS的类型。
[0009]在本专利技术的一些实施例中,基于前述方案,所述多种CMS识别方式包括:版权信息识别方式、预设路径识别方式、根目录文本识别方式以及源代码识别方式中的至少两种。
[0010]在本专利技术的一些实施例中,基于前述方案,按照每种CMS识别方式的优先级顺序以及每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果,包括:获取每种CMS识别方式的优先级顺序;按照每种CMS识别方式的优先级由高到低的顺序,依次获取每种CMS识别方式对应的待识别信息;根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果。
[0011]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括版权信息识别方式,获取版权信息识别方式对应的待识别信息,包括:将从所述CMS的爬虫脚本中获取的所述CMS的版权信息作为所述版权信息识别方式的待识别信息。
[0012]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括预设路径识别方式,获取预设路径识别方式对应的待识别信息,包括:获取所述CMS的预设路径文件的消息摘要算法MD5值,将所述MD5值作为所述预设路径识别方式的待识别信息。
[0013]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括根目录文本识别方式,获取根目录文本识别方式对应的待识别信息,包括:通过查看所述CMS的根目录协议来获取根目录名称信息,将所述根目录名称信息作为所述根目录文本识别方式的待识别信息。
[0014]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括源代码识别方式,获取源代码识别方式对应的待识别信息,包括:获取所述CMS的报头信息,将所述报头信息作为所述源代码识别方式的待识别信息。
[0015]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括版权信息识别方式,根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果,包括:将所述版权信息识别方式的待识别信息与所述版权信息识别方式对应的记录有关键词与CMS类型的对应关系的字典进行匹配,获取所述版权信息识别方式的匹配结果。
[0016]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括预设路径识别方式,根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果,包括:将所述预设路径识别方式的待识别信息与所述预设路径识别方式对应的记录有MD5值与CMS类型的对应关系的字典进行匹配,获取所述预设路径识别方式的匹配结果。
[0017]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括根目录文本识别方式,根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果,包括:将所述根目录文本识别方式的待识别信息与所述根目录文本识别方式对应的记录有关键词与CMS类型的对应关系的字典进行匹配,获取所述根目录文本识别方式的匹配结果。
[0018]在本专利技术的一些实施例中,基于前述方案,若所述多种CMS识别方式包括源代码识别方式,根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹
配,依次获取每种CMS识别方式的匹配结果,包括:将所述源代码识别方式的待识别信息与所述源代码识别方式对应的记录有关键词与CMS类型的对应关系的字典进行匹配,获取所述源代码识别方式的匹配结果。
[0019]在本专利技术的一些实施例中,基于前述方案,当获取到的匹配结果为匹配成功,确定所述CMS的类型,包括:当获取到匹配结果为匹配成功,确定所述CMS的类型,停止按照每种CMS识别方式的优先级顺序以及每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容管理系统识别方法,其特征在于,所述方法包括:获取多种CMS识别方式;按照每种CMS识别方式的优先级顺序以及每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果;当获取到的匹配结果为匹配成功,确定所述CMS的类型。2.如权利要求1所述的内容管理系统识别方法,其特征在于,所述多种CMS识别方式包括:版权信息识别方式、预设路径识别方式、根目录文本识别方式以及源代码识别方式中的至少两种。3.如权利要求2所述的内容管理系统识别方法,其特征在于,按照每种CMS识别方式的优先级顺序以及每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果,包括:获取每种CMS识别方式的优先级顺序;按照每种CMS识别方式的优先级由高到低的顺序,依次获取每种CMS识别方式对应的待识别信息;根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果。4.如权利要求3所述的内容管理系统识别方法,其特征在于,若所述多种CMS识别方式包括版权信息识别方式,获取版权信息识别方式对应的待识别信息,包括:将从所述CMS的爬虫脚本中获取的所述CMS的版权信息作为所述版权信息识别方式的待识别信息。5.如权利要求3所述的内容管理系统识别方法,其特征在于,若所述多种CMS识别方式包括预设路径识别方式,获取预设路径识别方式对应的待识别信息,包括:获取所述CMS的预设路径文件的消息摘要算法MD5值,将所述MD5值作为所述预设路径识别方式的待识别信息。6.如权利要求3所述的内容管理系统识别方法,其特征在于,若所述多种CMS识别方式包括根目录文本识别方式,获取根目录文本识别方式对应的待识别信息,包括:通过查看所述CMS的根目录协议来获取根目录名称信息,将所述根目录名称信息作为所述根目录文本识别方式的待识别信息。7.如权利要求3所述的内容管理系统识别方法,其特征在于,若所述多种CMS识别方式包括源代码识别方式,获取源代码识别方式对应的待识别信息,包括:获取所述CMS的报头信息,将所述报头信息作为所述源代码识别方式的待识别信息。8.如权利要求3所述的内容管理系统识别方法,其特征在于,若所述多种CMS识别方式包括版权信息识别方式,根据每种CMS识别方式对应的字典对每种CMS识别方式对应的待识别信息进行匹配,依次获取每种CMS识别方式的匹配结果,包括:将所述版权信息识别方式的待识别信息与所述版权信息识别方式对应的记录有关键词与CMS类型的对应关系的字典进行匹配,获取所...

【专利技术属性】
技术研发人员:何杰挺
申请(专利权)人:杭州迪普科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1