【技术实现步骤摘要】
本专利技术涉及计算机网络中的信息监控
,尤其涉及敏感信息的检测方法及装置。
技术介绍
随着计算机技术的普及和网络技术的快速发展,丰富的网络信息资源为人们的生 活提供了很大的便利,然而与此同时,计算机网络也成为了垃圾信息和不良信息的传播渠 道之一,引起了一定的社会问题。因此网络信息的监控、管理和检测已经成为目前关注的热 点问题。 早期的网络信息检测技术是基于单模式的快速匹配检测方法,即通过判断所监控的网络信息中是否出现了预定义的关键词来确定网络信息中是否包含敏感信息。后期在此基础上,进一步产生了基于多模式的匹配检测方法,基于多模式匹配的检测方法的基本原理是有多个预定的关键词,当待检测网络信息中出现了其中一个关键词时,即判定待检测网络信息中出现了敏感信息,如BM(Boyer2Moore)方法、QS(quick search)方法和AC(Ah2Corasick)方法等。由于上述检测方法都是基于精确匹配的方法,即只有当所监控的网络信息中出现了与预定义的关键词完全相同的字符时,才能够检测得到该网络信息包含敏感信息,因此当网络信息中出现按照如下的任何一种方式得到的预 ...
【技术保护点】
一种敏感信息的检测方法,其特征在于,包括:获得关键词库,所述关键词库中包含对关键词进行变异处理得到的关键词变异形式信息;在检查出待检测信息中包含所述关键词库中的关键词变异形式信息时,确定待检测信息中包含敏感信息。
【技术特征摘要】
一种敏感信息的检测方法,其特征在于,包括获得关键词库,所述关键词库中包含对关键词进行变异处理得到的关键词变异形式信息;在检查出待检测信息中包含所述关键词库中的关键词变异形式信息时,确定待检测信息中包含敏感信息。2. 如权利要求1所述的方法,其特征在于,所述对关键词进行变异处理指对关键词进 行字形拆分处理,得到的关键词变异形式信息为关键词字形变异形式信息。3. 如权利要求1所述的方法,其特征在于,所述对关键词进行变异处理指对关键词进 行拼音转换处理,得到的关键词变异形式信息为关键词拼音信息。4. 如权利要求1所述的方法,其特征在于,所述对关键词进行变异处理指 对关键词进行字形拆分处理,得到关键词字形变异形式信息;对所述关键词字形变异形式信息进行拼音转换处理,得到关键词字形变异形式信息的 拼音信息。5. 如权利要求3或4所述的方法,其特征在于,检查待检测信息中包含所述关键词库中 的关键词变异信息,具体包括 对待检测信息中包含的字符进行拼音转换处理;判断拼音转换处理得到的待检测信息中是否包含关键词库中的拼音信息,以及在包含 关键词库中的拼音信息时,判定检查出待检测信息中包含所述关键词库中的关键词变异信 息。6. —种敏感信息的检测装置,其特征在于,包括关键词库获取单元,用于获取...
【专利技术属性】
技术研发人员:王晨峰,宗良,黄小江,万小军,杨建武,吴於茜,肖建国,
申请(专利权)人:北京大学,北大方正集团有限公司,北京方正电子政务信息科技有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。