一种信息检测方法、设备及机器可读存储介质技术

技术编号:23604875 阅读:34 留言:0更新日期:2020-03-28 05:55
本申请提供一种信息检测方法、设备及机器可读存储介质,该方法包括:客户端从服务器获取待检测网站的检测信息;其中,所述待检测网站是所述服务器根据网站的属性信息和所述客户端的特征信息,从网站集合中选择的;所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息;如果存在非法信息,则所述客户端获取所述待检测网站存在非法信息的证据,并将携带所述证据的举报消息发送给所述服务器。通过本申请的技术方案,可以节约服务器资源,可以在用户浏览网页时进行自动检测,提升了检测效率。

An information detection method, equipment and machine readable storage medium

【技术实现步骤摘要】
一种信息检测方法、设备及机器可读存储介质
本申请涉及互联网
,尤其涉及一种信息检测方法、设备及机器可读存储介质。
技术介绍
随着互联网业务的快速发展,互联网上的非法信息越来越多,对于互联网提供商来说,需要对网站内容进行监管,以履行监管责任,打击互联网非法信息,为社会营造一个良好的互联网环境。目前,为了检测互联网上的非法信息,可以搭建爬虫系统,并通过爬虫来爬取网页内容,继而进行非法信息的检测。但是,在上述方式中,针对需要登录才能够访问的网站,将无法进行非法信息的检测。而且,面对海量网站,上述方式需要消耗大量的服务器资源。
技术实现思路
本申请提供一种信息检测方法,所述方法包括:客户端从服务器获取待检测网站的检测信息;其中,所述待检测网站是所述服务器根据网站的属性信息和所述客户端的特征信息,从网站集合中选择的;所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息;如果存在非法信息,则所述客户端获取所述待检测网站存在非法信息的证据,并将携带所述证据的举报消息发送给所述服务器。本本文档来自技高网...

【技术保护点】
1.一种信息检测方法,其特征在于,所述方法包括:/n客户端从服务器获取待检测网站的检测信息;其中,所述待检测网站是所述服务器根据网站的属性信息和所述客户端的特征信息,从网站集合中选择的;/n所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息;/n如果存在非法信息,则所述客户端获取所述待检测网站存在非法信息的证据,并将携带所述证据的举报消息发送给所述服务器。/n

【技术特征摘要】
1.一种信息检测方法,其特征在于,所述方法包括:
客户端从服务器获取待检测网站的检测信息;其中,所述待检测网站是所述服务器根据网站的属性信息和所述客户端的特征信息,从网站集合中选择的;
所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息;
如果存在非法信息,则所述客户端获取所述待检测网站存在非法信息的证据,并将携带所述证据的举报消息发送给所述服务器。


2.根据权利要求1所述的方法,其特征在于,
所述检测信息包括统一资源定位符URL信息和检测关键词;所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息,包括:
所述客户端从所述URL信息对应的所述待检测网站获取页面内容;
所述客户端对所述页面内容进行分词处理,得到多个词语;
所述客户端确定所述词语与所述检测关键词的相似度;
所述客户端根据所述相似度检测所述待检测网站是否存在非法信息。


3.根据权利要求2所述的方法,其特征在于,
所述客户端从所述URL信息对应的所述待检测网站获取页面内容,包括:
若所述URL信息对应的待检测网站是需要登录授权才能够访问的网站,则所述客户端登录到所述待检测网站,并从所述待检测网站获取页面内容;
其中,所述客户端登录到所述待检测网站,包括:获取用户在所述客户端输入的身份信息,利用所述身份信息登录到所述待检测网站;或者,获取预先配置的身份信息,利用所述预先配置的身份信息登录到所述待检测网站。


4.根据权利要求2所述的方法,其特征在于,
所述检测信息还包括分词策略和相似度比较策略;
所述客户端对所述页面内容进行分词处理,得到多个词语,包括:所述客户端根据所述分词策略对所述页面内容进行分词处理,得到多个词语;
所述客户端确定所述词语与所述检测关键词的相似度,包括:所述客户端根据所述相似度比较策略确定所述词语与所述检测关键词的相似度。


5.根据权利要求2所述的方法,其特征在于,
所述客户端根据所述相似度检测所述待检测网站是否存在非法信息,包括:
基于所述词语与所述检测关键词的相似度,所述客户端统计出相似度大于预设第一阈值的相似度数量;若所述相似度数量大于预设第二阈值,则所述客户端确定所述待检测网站存在非法信息。


6.根据权利要求1所述的方法,其特征在于,所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息,具体包括:基于限制条件,所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息。


7.根据权利要求6所述的方法,其特征在于,基于限制条件,所述客户端根据所述检测信息检测所述待检测网站是否存在非法信息,包括:
若所述限制条件包括时间限制条件,所述客户端根据所述时间限制条件确定检测时间段;所述客户端判断当前时间是否位于所述检测时间段内,如果是,则根据所述检测信息检测所述待检测网站是否存在非法信息;或者,
若所述限制条件包括并发数限制条件,所述客户端根据所述并发数限制条件确定最大并发数;所述客户端判断当前并发数是否已经达到所述最大并发数,如果否,则根据所述检测信息检测所述待检测网站是否存在非法信息;或者,
若所述限制条件包括带宽限制条件,所述客户端根据所述带宽限制条件确定最大带宽;所述客户端判断当前...

【专利技术属性】
技术研发人员:何伟
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1