System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于物联网防数据爬虫的信息浏览系统技术方案_技高网

一种基于物联网防数据爬虫的信息浏览系统技术方案

技术编号:40354974 阅读:5 留言:0更新日期:2024-02-09 14:40
本发明专利技术公开了一种基于物联网防数据爬虫的信息浏览系统,涉及物联网技术领域,包括爬虫识别模块、防爬虫模块和秘钥输入模块,所述爬虫识别模块连接有判断模块,所述爬虫记录模块连接有防爬虫模块,且防爬虫模块连接有发送模块,所述发送模块连接有接收端,且接收端连接有秘钥输入模块。该基于物联网防数据爬虫的信息浏览系统,将各段文字排序加以随机打乱,随后将打乱排序后的文字信息转换为图片,由此防止爬虫直接获取到正确的网页内容,防止网页内容发生泄漏,同时通过将图片加以压缩发送可降低网络资源占用,加快传输速度,而正常用户在接收到压缩文件后只需点击随机位置和样式的确认按钮即可获取正确内容,无需输入验证码,以保障用户体验。

【技术实现步骤摘要】

本专利技术涉及物联网,具体为一种基于物联网防数据爬虫的信息浏览系统


技术介绍

1、物联网是一个基于互联网、传统电信网等的信息承载体,它让所有能够被独立寻址的普通物理对象形成互联互通的网络,物联网中往往储存有非常多的重要信息并能够通过访问的方式对信息加以浏览。

2、当前,为了保护物联网中的信息资源不被程序批量抓取,通常会将文字信息转换为图片信息,由此防止爬虫程序爬取文字,但随着技术的发展,目前爬虫程序能够对图片中的文字加以识别并提取,导致防爬虫技术被破解。

3、于是,有鉴于此,针对现有的结构及缺失予以研究改良,提出一种基于物联网防数据爬虫的信息浏览系统。


技术实现思路

1、针对现有技术的不足,本专利技术提供了一种基于物联网防数据爬虫的信息浏览系统,解决了上述
技术介绍
中提出的问题。

2、为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于物联网防数据爬虫的信息浏览系统,包括爬虫识别模块、防爬虫模块和秘钥输入模块,所述爬虫识别模块连接有判断模块,且判断模块连接有爬虫记录模块,所述爬虫记录模块连接有防爬虫模块,且防爬虫模块连接有发送模块,所述发送模块连接有接收端,且接收端连接有秘钥输入模块;

3、所述防爬虫模块包括文字分段单元、段落打乱单元、文字转换图片单元、压缩单元和打乱秘钥单元,所述文字分段单元连接有段落打乱单元,且段落打乱单元连接有文字转换图片单元,所述文字转换图片单元连接有压缩单元,所述段落打乱单元还连接有打乱秘钥单元;p>

4、所述秘钥输入模块包括秘钥接收单元、自动输入单元、确认键随机样式单元、确认键随机分布单元、图片分割单元和重组单元,所述秘钥接收单元连接有自动输入单元,且自动输入单元连接有确认键随机样式单元,所述确认键随机样式单元连接有确认键随机分布单元,所述确认键随机分布单元连接有图片分割单元,且图片分割单元连接有重组单元。

5、进一步的,所述文字分段单元用于对浏览网页中的文字信息进行分段,所述段落打乱单元用于将各段文字排序加以随机打乱。

6、进一步的,所述文字转换图片单元用于将打乱排序后的文字信息转换为图片,所述打乱秘钥单元用于记录各段文字的打乱顺序及各段文字的内容,并生成秘钥。

7、进一步的,所述自动输入单元用于在接收到秘钥后自动输入秘钥,所述确认键随机样式单元用于显示随机样式的确认键按钮,所述确认键随机分布单元用于将确认键按钮随机分布在网页任意位置。

8、进一步的,所述图片分割单元用于根据秘钥中的各段文字的打乱顺序及各段文字的内容对含有文字信息的图片加以分割,分割出的每个图片包含一段文字内容,所述重组单元用于根据各段文字的打乱顺序对分割出的图片加以重新排序。

9、进一步的,所述爬虫识别模块包括访问频次检索单元、数据流量检索单元、浏览习惯分析单元和诱虫单元,所述访问频次检索单元、数据流量检索单元、浏览习惯分析单元和诱虫单元均与判断模块相连接。

10、进一步的,所述访问频次检索单元用于记录同一ip在一段时间内对网页的访问次数,所述数据流量检索单元用于记录同一ip的在访问时的数据流量大小。

11、进一步的,所述浏览习惯分析单元用于记录同一ip在网页的访问时间,所述诱虫单元用于将链接放于css或js里,链接采用普通用户不会加以访问的。

12、进一步的,所述爬虫记录模块包括权重单元、类型记录单元、分级单元和反馈单元,所述权重单元连接有类型记录单元,且类型记录单元连接有分级单元,所述分级单元连接有反馈单元。

13、进一步的,所述权重单元用于对访问频次检索单元、数据流量检索单元、浏览习惯分析单元和诱虫单元设置权重,所述类型记录单元用于对记录疑似爬虫的ip进行分类标注,即标注该ip是被访问频次检索单元、数据流量检索单元、浏览习惯分析单元和诱虫单元中的一个或多个检索出来的,所述分级单元根据疑似爬虫的ip的分类批注及权重加以分级,所述反馈单元用于反馈分级结果。

14、本专利技术提供了一种基于物联网防数据爬虫的信息浏览系统,具备以下有益效果:

15、1.该基于物联网防数据爬虫的信息浏览系统,文字分段单元先对浏览网页中的文字信息进行分段,再由段落打乱单元将各段文字排序加以随机打乱,随后文字转换图片单元将打乱排序后的文字信息转换为图片,由此防止爬虫直接获取到正确的网页内容,以防止网页内容发生泄漏,同时通过将图片加以压缩发送可降低网络资源占用,加快传输速度,而正常用户在接收到压缩文件后只需点击随机位置和样式的确认按钮即可获取正确内容,无需输入验证码,以保障用户体验。

16、2.该基于物联网防数据爬虫的信息浏览系统,通过访问频次检索单元、数据流量检索单元、浏览习惯分析单元和诱虫单元从各方面对各用户ip的行为加以监测记录,并交由判断模块进行判断,以快速识别出疑似带有爬虫的访问用户,并对疑似带有爬虫的访问用户加以分级和反馈,以便清晰排列出各ip的嫌疑度高低,以便为识别爬虫ip提供充足的基础信息,以提高识别出爬虫的准确性,以防止单一识别方式有爬虫识别遗漏的情况产生,以便物联网平台对高级别的用户ip加以封禁。

本文档来自技高网...

【技术保护点】

1.一种基于物联网防数据爬虫的信息浏览系统,包括爬虫识别模块(1)、防爬虫模块(4)和秘钥输入模块(7),其特征在于:所述爬虫识别模块(1)连接有判断模块(2),且判断模块(2)连接有爬虫记录模块(3),所述爬虫记录模块(3)连接有防爬虫模块(4),且防爬虫模块(4)连接有发送模块(5),所述发送模块(5)连接有接收端(6),且接收端(6)连接有秘钥输入模块(7);

2.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字分段单元(401)用于对浏览网页中的文字信息进行分段,所述段落打乱单元(402)用于将各段文字排序加以随机打乱。

3.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字转换图片单元(403)用于将打乱排序后的文字信息转换为图片,所述打乱秘钥单元(405)用于记录各段文字的打乱顺序及各段文字的内容,并生成秘钥。

4.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述自动输入单元(702)用于在接收到秘钥后自动输入秘钥,所述确认键随机样式单元(703)用于显示随机样式的确认键按钮,所述确认键随机分布单元(704)用于将确认键按钮随机分布在网页任意位置。

5.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述图片分割单元(705)用于根据秘钥中的各段文字的打乱顺序及各段文字的内容对含有文字信息的图片加以分割,分割出的每个图片包含一段文字内容,所述重组单元(706)用于根据各段文字的打乱顺序对分割出的图片加以重新排序。

6.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述爬虫识别模块(1)包括访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104),所述访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104)均与判断模块(2)相连接。

7.根据权利要求6所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述访问频次检索单元(101)用于记录同一IP在一段时间内对网页的访问次数,所述数据流量检索单元(102)用于记录同一IP的在访问时的数据流量大小。

8.根据权利要求6所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述浏览习惯分析单元(103)用于记录同一IP在网页的访问时间,所述诱虫单元(104)用于将链接放于CSS或JS里,链接采用普通用户不会加以访问的。

9.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述爬虫记录模块(3)包括权重单元(301)、类型记录单元(302)、分级单元(303)和反馈单元(304),所述权重单元(301)连接有类型记录单元(302),且类型记录单元(302)连接有分级单元(303),所述分级单元(303)连接有反馈单元(304)。

10.根据权利要求9所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述权重单元(301)用于对访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104)设置权重,所述类型记录单元(302)用于对记录疑似爬虫的IP进行分类标注,即标注该IP是被访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104)中的一个或多个检索出来的,所述分级单元(303)根据疑似爬虫的IP的分类批注及权重加以分级,所述反馈单元(304)用于反馈分级结果。

...

【技术特征摘要】

1.一种基于物联网防数据爬虫的信息浏览系统,包括爬虫识别模块(1)、防爬虫模块(4)和秘钥输入模块(7),其特征在于:所述爬虫识别模块(1)连接有判断模块(2),且判断模块(2)连接有爬虫记录模块(3),所述爬虫记录模块(3)连接有防爬虫模块(4),且防爬虫模块(4)连接有发送模块(5),所述发送模块(5)连接有接收端(6),且接收端(6)连接有秘钥输入模块(7);

2.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字分段单元(401)用于对浏览网页中的文字信息进行分段,所述段落打乱单元(402)用于将各段文字排序加以随机打乱。

3.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字转换图片单元(403)用于将打乱排序后的文字信息转换为图片,所述打乱秘钥单元(405)用于记录各段文字的打乱顺序及各段文字的内容,并生成秘钥。

4.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述自动输入单元(702)用于在接收到秘钥后自动输入秘钥,所述确认键随机样式单元(703)用于显示随机样式的确认键按钮,所述确认键随机分布单元(704)用于将确认键按钮随机分布在网页任意位置。

5.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述图片分割单元(705)用于根据秘钥中的各段文字的打乱顺序及各段文字的内容对含有文字信息的图片加以分割,分割出的每个图片包含一段文字内容,所述重组单元(706)用于根据各段文字的打乱顺序对分割出的图片加以重新排序。

6.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述爬虫识别模块(1)包括访问频次检索单元(101)、数据流量检索单元...

【专利技术属性】
技术研发人员:李海罗远雄陈全辉
申请(专利权)人:深圳市双银科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1