System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及物联网,具体为一种基于物联网防数据爬虫的信息浏览系统。
技术介绍
1、物联网是一个基于互联网、传统电信网等的信息承载体,它让所有能够被独立寻址的普通物理对象形成互联互通的网络,物联网中往往储存有非常多的重要信息并能够通过访问的方式对信息加以浏览。
2、当前,为了保护物联网中的信息资源不被程序批量抓取,通常会将文字信息转换为图片信息,由此防止爬虫程序爬取文字,但随着技术的发展,目前爬虫程序能够对图片中的文字加以识别并提取,导致防爬虫技术被破解。
3、于是,有鉴于此,针对现有的结构及缺失予以研究改良,提出一种基于物联网防数据爬虫的信息浏览系统。
技术实现思路
1、针对现有技术的不足,本专利技术提供了一种基于物联网防数据爬虫的信息浏览系统,解决了上述
技术介绍
中提出的问题。
2、为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于物联网防数据爬虫的信息浏览系统,包括爬虫识别模块、防爬虫模块和秘钥输入模块,所述爬虫识别模块连接有判断模块,且判断模块连接有爬虫记录模块,所述爬虫记录模块连接有防爬虫模块,且防爬虫模块连接有发送模块,所述发送模块连接有接收端,且接收端连接有秘钥输入模块;
3、所述防爬虫模块包括文字分段单元、段落打乱单元、文字转换图片单元、压缩单元和打乱秘钥单元,所述文字分段单元连接有段落打乱单元,且段落打乱单元连接有文字转换图片单元,所述文字转换图片单元连接有压缩单元,所述段落打乱单元还连接有打乱秘钥单元;
...【技术保护点】
1.一种基于物联网防数据爬虫的信息浏览系统,包括爬虫识别模块(1)、防爬虫模块(4)和秘钥输入模块(7),其特征在于:所述爬虫识别模块(1)连接有判断模块(2),且判断模块(2)连接有爬虫记录模块(3),所述爬虫记录模块(3)连接有防爬虫模块(4),且防爬虫模块(4)连接有发送模块(5),所述发送模块(5)连接有接收端(6),且接收端(6)连接有秘钥输入模块(7);
2.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字分段单元(401)用于对浏览网页中的文字信息进行分段,所述段落打乱单元(402)用于将各段文字排序加以随机打乱。
3.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字转换图片单元(403)用于将打乱排序后的文字信息转换为图片,所述打乱秘钥单元(405)用于记录各段文字的打乱顺序及各段文字的内容,并生成秘钥。
4.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述自动输入单元(702)用于在接收到秘钥后自动输入秘钥,所述确认键随机样式单元(70
5.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述图片分割单元(705)用于根据秘钥中的各段文字的打乱顺序及各段文字的内容对含有文字信息的图片加以分割,分割出的每个图片包含一段文字内容,所述重组单元(706)用于根据各段文字的打乱顺序对分割出的图片加以重新排序。
6.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述爬虫识别模块(1)包括访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104),所述访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104)均与判断模块(2)相连接。
7.根据权利要求6所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述访问频次检索单元(101)用于记录同一IP在一段时间内对网页的访问次数,所述数据流量检索单元(102)用于记录同一IP的在访问时的数据流量大小。
8.根据权利要求6所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述浏览习惯分析单元(103)用于记录同一IP在网页的访问时间,所述诱虫单元(104)用于将链接放于CSS或JS里,链接采用普通用户不会加以访问的。
9.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述爬虫记录模块(3)包括权重单元(301)、类型记录单元(302)、分级单元(303)和反馈单元(304),所述权重单元(301)连接有类型记录单元(302),且类型记录单元(302)连接有分级单元(303),所述分级单元(303)连接有反馈单元(304)。
10.根据权利要求9所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述权重单元(301)用于对访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104)设置权重,所述类型记录单元(302)用于对记录疑似爬虫的IP进行分类标注,即标注该IP是被访问频次检索单元(101)、数据流量检索单元(102)、浏览习惯分析单元(103)和诱虫单元(104)中的一个或多个检索出来的,所述分级单元(303)根据疑似爬虫的IP的分类批注及权重加以分级,所述反馈单元(304)用于反馈分级结果。
...【技术特征摘要】
1.一种基于物联网防数据爬虫的信息浏览系统,包括爬虫识别模块(1)、防爬虫模块(4)和秘钥输入模块(7),其特征在于:所述爬虫识别模块(1)连接有判断模块(2),且判断模块(2)连接有爬虫记录模块(3),所述爬虫记录模块(3)连接有防爬虫模块(4),且防爬虫模块(4)连接有发送模块(5),所述发送模块(5)连接有接收端(6),且接收端(6)连接有秘钥输入模块(7);
2.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字分段单元(401)用于对浏览网页中的文字信息进行分段,所述段落打乱单元(402)用于将各段文字排序加以随机打乱。
3.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述文字转换图片单元(403)用于将打乱排序后的文字信息转换为图片,所述打乱秘钥单元(405)用于记录各段文字的打乱顺序及各段文字的内容,并生成秘钥。
4.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述自动输入单元(702)用于在接收到秘钥后自动输入秘钥,所述确认键随机样式单元(703)用于显示随机样式的确认键按钮,所述确认键随机分布单元(704)用于将确认键按钮随机分布在网页任意位置。
5.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述图片分割单元(705)用于根据秘钥中的各段文字的打乱顺序及各段文字的内容对含有文字信息的图片加以分割,分割出的每个图片包含一段文字内容,所述重组单元(706)用于根据各段文字的打乱顺序对分割出的图片加以重新排序。
6.根据权利要求1所述的一种基于物联网防数据爬虫的信息浏览系统,其特征在于:所述爬虫识别模块(1)包括访问频次检索单元(101)、数据流量检索单元...
【专利技术属性】
技术研发人员:李海,罗远雄,陈全辉,
申请(专利权)人:深圳市双银科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。