一种基于信息交换场景中敏感话题过滤的解决方法技术

技术编号:16546987 阅读:64 留言:0更新日期:2017-11-11 11:46
本发明专利技术公开了一种基于信息交换场景中敏感话题过滤的解决方法,包括敏感词过滤和相邻文本对比两个阶段,敏感词过滤阶段先将敏感词首字组成集合,然后将敏感词每个字拆分,后一个字作为前一个字的子节点,每一个节点都有一个字段isend来标志是否到此为敏感词,相邻文本阶段系统会记录下本条信息,并与相邻几条信息组装再次进行步骤一的敏感词判断。本发明专利技术的基于信息交换场景中敏感话题过滤的解决方法,由于特定的数据结构,对敏感词的判断效率很高,有效拦截过滤各种形式组装的带有敏感话题的信息,并且能识别相邻几条信息是否可组装为带有敏感词的信息,高效且可以有效屏蔽多种敏感话题信息,净化软件环境。

A solution of sensitive topic filtering based on information exchange scene

The invention discloses a method for solving the exchange of information filtering based on scene sensitive topics, including sensitive word filtering and adjacent text comparison in two stages, the first stage of the sensitive word filtering sensitive word word composition set, then the sensitive words every word split after a word as a word of the nodes. Each node has a Isend field to mark whether this sensitive word, the adjacent text stage of the system will record this information, and again a step sensitive word judgment and several adjacent information assembly. The solution of information exchange in the scene of sensitive topic based filtering, due to the specific structure of the data, to judge the efficiency of sensitive words is very high, with effective interception of sensitive topic information filtering assembly in various forms, and can identify several adjacent information can be assembled with sensitive word information, and can be efficient a variety of effective shielding sensitive information, purify the environment of software.

【技术实现步骤摘要】
一种基于信息交换场景中敏感话题过滤的解决方法
本专利技术涉及网络信息
,具体为一种基于信息交换场景中敏感话题过滤的解决方法。
技术介绍
在社交,论坛,新闻评论等存在用户信息交换的场景中,常会出现一些不适宜在公众场合展示的信息。一些软件或者网站的开发者试图屏蔽此类消息,但还是有一些此类用户会通过分隔符,分条发送等形式来躲避开发者的屏蔽。为了提高数据处理的效率,系统初始化时会将敏感词及分隔符等存于内存之中,如果敏感词库过于庞大,会对操作系统内存有很大的消耗。
技术实现思路
本专利技术的目的在于提供一种基于信息交换场景中敏感话题过滤的解决方法,具有高效,可以有效屏蔽多种敏感话题信息,净化软件环境的优点,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于信息交换场景中敏感话题过滤的解决方法,包括敏感词过滤和相邻文本对比两个阶段,敏感词过滤阶段包括以下过滤步骤:第一步、字母集合,先将敏感词首字组成集合;第二步、敏感词拆分,将敏感词每个字拆分,后一个字作为前一个字的子节点,每一个节点都有一个字段isend来标志是否到此为敏感词;第三步、系统判断以是否为特殊扰乱本文档来自技高网...
一种基于信息交换场景中敏感话题过滤的解决方法

【技术保护点】
一种基于信息交换场景中敏感话题过滤的解决方法,其特征在于,包括敏感词过滤和相邻文本对比两个阶段,敏感词过滤阶段包括以下过滤步骤:第一步、字母集合,先将敏感词首字组成集合;第二步、敏感词拆分,将敏感词每个字拆分,后一个字作为前一个字的子节点,每一个节点都有一个字段isend来标志是否到此为敏感词;第三步、系统判断,系统判断以是否为特殊扰乱字符作为判断首要判断条件。

【技术特征摘要】
1.一种基于信息交换场景中敏感话题过滤的解决方法,其特征在于,包括敏感词过滤和相邻文本对比两个阶段,敏感词过滤阶段包括以下过滤步骤:第一步、字母集合,先将敏感词首字组成集合;第二步、敏感词拆分,将敏感词每个字拆分,后一个字作为前一个字的子节点,每一个节点都有一个字段isend来标志是否到此为敏感词;第三步、系统判...

【专利技术属性】
技术研发人员:周聪伟
申请(专利权)人:深圳市乐唯科技开发有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1