信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24331354 阅读:19 留言:0更新日期:2020-05-29 19:43
本发明专利技术实施例涉及网页技术领域,公开了一种信息处理方法,包括:获取待检测网址以及获取所述待检测网址的链接网址;爬取所述待检测网址和所述链接网址,得到爬虫结果;识别所述爬虫结果中是否存在特征信息;若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。本发明专利技术还提出一种信息处理装置、电子设备以及一种计算机可读存储介质。本发明专利技术提供的信息处理方法、信息处理装置、电子设备以及计算机可读存储介质可以快速检测到网页中存在的特征信息,提高网页特征信息检测结果的可靠性。

Information processing methods, devices, electronic equipment and storage media

【技术实现步骤摘要】
信息处理方法、装置、电子设备及存储介质
本专利技术实施例涉及网页
,特别涉及一种信息处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,网页的数量呈现爆发式增长,网页内的信息也越来越丰富。目前很多网页都添加了合作伙伴等第三方的站点链接,专利技术人发现,这些站点链接上的信息存在不可控性,当用户访问网页时若跳转至存在非法信息的站点,将极大的降低用户体验,甚至可能带来用户信息的泄露。但目前,通常通过人工审核的方式对网页及网页添加的第三方的站点链接是否存在不恰当的信息进行审核,由于通常第三方的站点链接会跟随热点更改,因此,通常需要在短时间内对大量信息进行审核,这种人工审核的方式效率不高,并且由于效率不高也会带来审核结果误差率高的问题,从而导致对网页内容检测结果的可靠性不高。
技术实现思路
本专利技术实施方式的目的在于提供一种信息处理方法、装置、电子设备及计算机可读存储介质,可以快速检测到网页中存在的特征信息,提高网页特征信息检测结果的可靠性。为解决上述技术问题,本专利技术的实施方式提供了一种本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,所述方法包括:/n获取待检测网址以及获取所述待检测网址的链接网址;/n爬取所述待检测网址和所述链接网址,得到爬虫结果;/n识别所述爬虫结果中是否存在特征信息;/n若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。/n

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:
获取待检测网址以及获取所述待检测网址的链接网址;
爬取所述待检测网址和所述链接网址,得到爬虫结果;
识别所述爬虫结果中是否存在特征信息;
若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。


2.如权利要求1所述的信息处理方法,其特征在于,所述获取所述待检测网址的链接网址包括:
递归爬取所述待检测网址,得到所述待检测链接网址的链接网址。


3.如权利要求1或2所述的信息处理方法,其特征在于,所述爬虫结果包含多条爬取记录,每条爬取记录包含爬取内容,所述识别所述爬虫结果中是否存在特征信息包括:
通过爬取内容判断所述多条爬取记录中是否存在与预设特征信息匹配策略相匹配的目标爬取记录;
若存在与所述预设特征信息匹配策略相匹配的目标爬取记录,确定所述目标爬取记录中存在特征信息。


4.如权利要求3所述的信息处理方法,其特征在于,所述将所述爬虫结果中的特征信息保存至区块链中包括:
将存在特征信息的目标爬取记录的爬取信息和/或所述预设特征信息匹配策略进行内容拼接,得到包含所述爬虫结果中的特征信息的特征信息识别记录;
将所述特征信息识别记录保存在区块链的区块体中。


5.如权利要求4所述的信息处理方法,其特征在于,所述方法还包括:
获取所述区块体对应的交易号,通过所述交易号回溯查找所述特征信息识别记录。


6.如权利要求4所述的信...

【专利技术属性】
技术研发人员:侯姗姗秦俊锋杨梦茹张云蕾周一枫
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1