【技术实现步骤摘要】
敏感词检测方法、装置、终端设备和计算机可读存储介质
本申请属于文本检测
,尤其涉及一种敏感词检测方法、装置、终端设备和计算机可读存储介质。
技术介绍
目前,一些敏感的信息与词汇是不允许出现在文案中的,故需要对文本进行敏感词检测,以过滤或筛选出文本中的敏感词信息。现有技术中,敏感词检测有基于规则的检测方法,也有基于有限状态机的方法,亦或者是基于机器学习的检测方法,这些方法的检测效率十分有限。
技术实现思路
本申请实施例提供一种敏感词检测方法、装置、终端设备和计算机可读存储介质,以解决现有敏感词检测效率较低的问题。第一方面,本申请实施例提供一种敏感词检测方法,包括:获取待检测文本;对所述待检测文本中的每一个待匹配字符执行字符匹配步骤,得到匹配结果;根据所述匹配结果得到所述待检测文本的敏感词检测结果;所述字符匹配步骤用于:将所述待匹配字符与敏感词容器的根节点的字符进行比对,确定是否一致;如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位为预设数值,返回匹配成功结果;如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位不为预设数值,k=1,进入循环步骤:将所述待匹配字符后的第k个字符与所述根节点的第k个叶子节点的字符进行匹配,确定是否一致;如果所述第k个字符与所述第k个叶子节点的字符一致,当敏感词结束标志位不为预设数值,k=k+1后返回所述循环步骤;当敏感词结束标志位为预设数值,返回匹配成功结果 ...
【技术保护点】
1.一种敏感词检测方法,其特征在于,包括:/n获取待检测文本;/n对所述待检测文本中的每一个待匹配字符执行字符匹配步骤,得到匹配结果;/n根据所述匹配结果得到所述待检测文本的敏感词检测结果;/n所述字符匹配步骤用于:/n将所述待匹配字符与敏感词容器的根节点的字符进行比对,确定是否一致;/n如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位为预设数值,返回匹配成功结果;/n如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位不为预设数值,k=1,进入循环步骤:将所述待匹配字符后的第k个字符与所述根节点的第k个叶子节点的字符进行匹配,确定是否一致;/n如果所述第k个字符与所述第k个叶子节点的字符一致,当敏感词结束标志位不为预设数值,k=k+1后返回所述循环步骤;当敏感词结束标志位为预设数值,返回匹配成功结果;/n如果所述第k个字符与所述第k个叶子节点的字符不一致,返回匹配失败结果。/n
【技术特征摘要】
1.一种敏感词检测方法,其特征在于,包括:
获取待检测文本;
对所述待检测文本中的每一个待匹配字符执行字符匹配步骤,得到匹配结果;
根据所述匹配结果得到所述待检测文本的敏感词检测结果;
所述字符匹配步骤用于:
将所述待匹配字符与敏感词容器的根节点的字符进行比对,确定是否一致;
如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位为预设数值,返回匹配成功结果;
如果所述待匹配字符与所述根节点的字符一致,且敏感词结束标志位不为预设数值,k=1,进入循环步骤:将所述待匹配字符后的第k个字符与所述根节点的第k个叶子节点的字符进行匹配,确定是否一致;
如果所述第k个字符与所述第k个叶子节点的字符一致,当敏感词结束标志位不为预设数值,k=k+1后返回所述循环步骤;当敏感词结束标志位为预设数值,返回匹配成功结果;
如果所述第k个字符与所述第k个叶子节点的字符不一致,返回匹配失败结果。
2.如权利要求1所述的方法,其特征在于,所述敏感词容器包括至少一条存储分支,一条所述存储分支用于存储一个敏感词;所述存储分支包括至少一个节点,所述存储分支中的第一个节点为根节点,非第一个节点为叶子节点;一个节点对应一个存储对象;
所述存储对象的数据结构为键值对数据结构,所述存储对象包括key值和value值;在一条所述存储分支中,第m个节点的存储对象的value值存放有作为第m+1个节点的存储对象,所述存储分支对应的敏感词的各个字符依次存放各个存储对象的key值,m为大于或等于1的正整数;
若两个敏感词的前j个字符相同,第j+1个字符不相同,则对应的两条存储分支的前j个节点相同,第j+1个节点及其往后的节点均不相同,j大于或等于0。
3.如权利要求2所述的方法,其特征在于,所述存储对象为Map对象;
敏感词的存放方式如下:
所述敏感词的第m个字符存放在对应存储分支的第m个节点的Map对象的key值;第m个节点的Map对象的value值存放作为第m+1个节点的Map对象,m大于或等于1,且小于或等于所述敏感词的字符数量;
若新添加的敏感词的前j个字符与所述敏感词容器中已存放敏感词的前j个字符相同,第j+1个字符不同,则新建i个节点,将所述新添加的敏感词的第j+...
【专利技术属性】
技术研发人员:方曦,熊友军,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。