一种带有初次筛选功能的数据过滤挖掘方法技术

技术编号：21399213 阅读：27 留言：0更新日期：2019-06-19 07:03

本发明专利技术公开了一种带有初次筛选功能的数据过滤挖掘方法，涉及数据安全技术领域，其包括以下步骤：先建立敏感字词数据库特征码；然后计算出该用户访问网页时的数据特征码；然后将用户访问的网页数据特征码与敏感字词数据库特征码进行对比，然后当步骤三中获取与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量达到设定的阈值时，可以判定所述用户访问的数据为敏感数据；最后当判定所述用户访问的网页数据特征码是敏感数据时，则将所述用户访问的网页数据特征码内的敏感字词进行过滤并打码。本发明专利技术通过建立敏感字词数据库特征码，并对用户的上网行为进行实时监控，解决了色情网站无法过滤的缺陷，达到绿色上网的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种带有初次筛选功能的数据过滤挖掘方法
本专利技术涉及数据安全
，具体为一种带有初次筛选功能的数据过滤挖掘方法。
技术介绍
国际标准化组织(ISO)对计算机系统安全的定义是：为数据处理系统建立和采用的技术和管理的安全保护，保护计算机硬件、软件和数据不因偶然和恶意的原因遭到破坏、更改和泄露。由此计算机网络的安全可以理解为：通过采用各种技术和管理措施，使网络系统正常运行，从而确保网络数据的可用性、完整性和保密性。所以，建立网络安全保护措施的目的是确保经过网络传输和交换的数据不会发生增加、修改、丢失和泄露等。随着计算机的普及，人们做到了足不出户了知天下事，这体现了网络带给我的便利性，但是，网络是把双刃剑，有利也有弊，网络造就了许多的成功人士，同样也毁害了许多人，特别是青少年，在浏览网络时难免因为好奇心浏览一些色情网站，从而一发不可收拾，沉迷在色情网络内，为了营造一个良好的网络环境，现如今急需一种带有初次筛选功能的数据过滤挖掘方法。
技术实现思路
针对现有技术的不足，本专利技术提供了一种带有初次筛选功能的数据过滤挖掘方法，以解决色情网站无法过滤的缺陷。为达到以上目的，本专利技术采取的技术方案是：一种带有初次筛选功能的数据过滤挖掘方法，包括以下步骤：步骤一：从字词数据库中计算敏感字词数据库特征码，并建立敏感字词数据库特征码；步骤二：监控用户访问网页的行为，当监控到用户访问网页时的行为后，按照步骤一所述的计算用户访问网页数据的特征码的方法，计算出该用户访问网页时的数据特征码；步骤三：将用户访问的网页数据特征码与敏感字词数据库特征码进行对比，并获取用户访问网页数据特征...

【技术保护点】
1.一种带有初次筛选功能的数据过滤挖掘方法，其特征在于：包括以下步骤：步骤一：从字词数据库中计算敏感字词数据库特征码，并建立敏感字词数据库特征码；步骤二：监控用户访问网页的行为，当监控到用户访问网页时的行为后，按照步骤一所述的计算用户访问网页数据的特征码的方法，计算出该用户访问网页时的数据特征码；步骤三：将用户访问的网页数据特征码与敏感字词数据库特征码进行对比，并获取用户访问网页数据特征码与敏感字词数据库特征码相同的特征码的数量，并将与敏感字词相同的数据特征码进行存储；步骤四：当步骤三中获取与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量达到设定的阈值时，可以判定所述用户访问的数据为敏感数据；当与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量未达到系统设定的阈值时，重复步骤二到四，直到用户访问网页的行为结束为止；步骤五：当判定所述用户访问的网页数据特征码是敏感数据时，则将所述用户访问的网页数据特征码内的敏感字词进行过滤并打码。

【技术特征摘要】
1.一种带有初次筛选功能的数据过滤挖掘方法，其特征在于：包括以下步骤：步骤一：从字词数据库中计算敏感字词数据库特征码，并建立敏感字词数据库特征码；步骤二：监控用户访问网页的行为，当监控到用户访问网页时的行为后，按照步骤一所述的计算用户访问网页数据的特征码的方法，计算出该用户访问网页时的数据特征码；步骤三：将用户访问的网页数据特征码与敏感字词数据库特征码进行对比，并获取用户访问网页数据特征码与敏感字词数据库特征码相同的特征码的数量，并将与敏感字词相同的数据特征码进行存储；步骤四：当步骤三中获取与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量达到设定的阈值时，可以判定所述用户访问的数据为敏感数据；当与所述敏感字词数据库特征码相同的所述用户访问的网页数据特征码的数量未达到系统设定的阈值时，重复步骤二到四，直到用户访问网页的行为结束为止；步骤五：当判定所述用户访问的网页数据特征码是敏感数据时，则将所述用户访问的网页数据特征码内的敏感字词进行过滤并打码。2.根据权利要求1所述的一种带有初次筛选功能的数据过滤挖掘方法，其特征在于：所述步骤五将敏感字词进行打码过滤的同...

【专利技术属性】
技术研发人员：倪向东，柯金霞，
申请(专利权)人：广州博士信息技术研究院有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人