System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,具体而言,涉及一种网站内容监测方法、装置、电子设备及可读存储介质。
技术介绍
1、随着互联网的发展,网络平台内容大爆发的同时,也产生了大量不良有害信息,内容安全已经成为互联网生态治理的重要内容。同时伴随内容监管持续升级,不少网站因为内容安全问题受到不同程度的处罚,而传统的网站内容安全监测方法监测不全面,导致监测结果不够准确。
技术实现思路
1、本专利技术的目的在于提供一种网站内容监测方法、装置、电子设备及可读存储介质,能够提高对网站监测准确性。
2、为了实现上述目的,本申请实施例采用的技术方案如下:
3、第一方面,本申请实施例提供了一种网站内容监测方法,所述方法包括:
4、对待检测网站和与所述待检测网站关联的网站进行爬取,得到所述待检测网站的网站目录树;
5、获取各访客对所述待检测网站的各访问日志;
6、针对各所述访问日志,确定所述访问日志对应的第一路径;
7、将各所述第一路径与所述网站目录树中的各第二路径进行比较;
8、在各所述第一路径与各所述第二路径均不匹配时,对所述第一路径对应的网站进行内容监控。
9、在可选的实施方式中,所述对待检测网站和与所述待检测网站关联的网站进行爬取,得到所述待检测网站的网站目录树的步骤,包括:
10、对所述待检测网站的各第一页面内容进行提取;
11、对所述待检测网站关联的网站的各第二页面内容进行提取;
...【技术保护点】
1.一种网站内容监测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对待检测网站和与所述待检测网站关联的网站进行爬取,得到所述待检测网站的网站目录树的步骤,包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
7.一种网站内容监测装置,其特征在于,所述装置包括:
8.根据权利要求7所述的装置,其特征在于,所述爬取模块具体用于:
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6任一项所述方法的步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
【技术特征摘要】
1.一种网站内容监测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对待检测网站和与所述待检测网站关联的网站进行爬取,得到所述待检测网站的网站目录树的步骤,包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
6.根据权利要求4所述的方法,其特征在于...
【专利技术属性】
技术研发人员:雷佳才,罗立,徐开红,曹孟霏,李静,胡锐,黄杨,
申请(专利权)人:成都知道创宇信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。