敏感词过滤方法、装置、计算机设备和可读存储介质制造方法及图纸

技术编号:27199114 阅读:12 留言:0更新日期:2021-01-31 12:02
本申请涉及一种敏感词过滤方法、装置、计算机设备和可读存储介质,其中,该敏感词过滤方法包括:获取用户的输入内容;将所述输入内容与本地词库中的词进行匹配;若不匹配,将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对,并将所述比对的比对信息存入所述本地词库。通过本申请,解决了在保证敏感词更新的及时性的情况下,游戏项目中敏感词过滤检测的成本较高的问题,实现了在保证敏感词更新的及时性的情况下,降低游戏项目中敏感词过滤检测成本的效果。过滤检测成本的效果。过滤检测成本的效果。

【技术实现步骤摘要】
敏感词过滤方法、装置、计算机设备和可读存储介质


[0001]本申请涉及自然语言处理
,特别是涉及一种敏感词过滤方法、装置、计算机设备和可读存储介质。

技术介绍

[0002]通常游戏中的取名、聊天、都需要进行敏感词过滤检测,对用户的输入内容进行敏感词过滤检测,能够防止恶意用户发表不当言论。目前市面敏感词过滤方法包括本地词库匹配算法和实时联网的互联网过滤接口方法。
[0003]在相关技术中,本地词库匹配算法由于是在本地进行检测,检测效果依赖本地词库的丰富程度,无法及时拦截最新的敏感词,需要额外进行本地词库维护工作,并且只有当发现新的敏感词之后才会添加到本地词库,因此本地词库的更新维护天然的具有滞后性;实时联网的互联网过滤接口方法能够及时拦截各种敏感词以及变异敏感词,但是所述方法按照检测次数计费,对于高度活跃的游戏项目而言这是一笔不小的额外开支。
[0004]目前,针对相关技术中,在保证敏感词更新的及时性的情况下,游戏项目中敏感词过滤检测的成本较高的问题,尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种敏感词过滤方法、装置、计算机设备和可读存储介质,以至少解决相关技术中,在保证敏感词更新的及时性的情况下,游戏项目中敏感词过滤检测的成本较高的问题。
[0006]第一方面,本申请实施例提供了一种敏感词过滤方法,所述方法包括:
[0007]获取用户的输入内容;
[0008]将所述输入内容与本地词库中的词进行匹配;
[0009]若不匹配,将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对,并将所述比对的比对信息存入所述本地词库。
[0010]在其中一些实施例中,在所述输入内容与所述本地词库中的词不匹配之后,在将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对之前,所述方法包括:在预设时间段内,将多条所述输入内容合并为一条输入内容。
[0011]在其中一些实施例中,所述本地词库包括白词库和黑词库,所述将所述输入内容与本地词库进行匹配包括:
[0012]将所述输入内容与所述白词库中的白词进行匹配;
[0013]若所述输入内容与所述白词匹配,所述输入内容过滤通过;
[0014]若所述输入内容与所述白词不匹配,将所述输入内容与所述黑词库中的黑词进行匹配,若所述输入内容与所述黑词匹配,拦截所述输入内容,若所述输入内容与所述黑词不匹配,则代表所述输入内容与所述本地词库中的词不匹配。
[0015]在其中一些实施例中,所述本地词库中的词设置有有效期,所述将所述输入内容
与所述本地词库中的词进行匹配包括:将所述输入内容与所述本地词库中的处于所述有效期内的词进行匹配。
[0016]第二方面,本申请实施例提供了一种敏感词过滤装置,所述装置包括:
[0017]获取模块,用于获取用户的输入内容;
[0018]匹配模块,用于将所述输入内容与本地词库中的词进行匹配;
[0019]过滤模块,用于在所述输入内容与所述本地词库中的词不匹配的情况下,将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对,并将所述比对的比对信息存入所述本地词库。
[0020]在其中一些实施例中,所述过滤模块还包括:
[0021]合并单元,用于在所述输入内容与所述本地词库中的词不匹配之后,在将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对之前,在预设时间段内,将多条所述输入内容合并为一条输入内容。
[0022]在其中一些实施例中,所述本地词库包括白词库和黑词库,所述匹配模块还用于将所述输入内容与所述白词库中的白词进行匹配,若所述输入内容与所述白词匹配,所述输入内容过滤通过;若所述输入内容与所述白词不匹配,将所述输入内容与所述黑词库中的黑词进行匹配,若所述输入内容与所述黑词匹配,拦截所述输入内容,若所述输入内容与所述黑词不匹配,则代表所述输入内容与所述本地词库中的词不匹配。
[0023]在其中一些实施例中,所述本地词库中的词设置有有效期,所述匹配模块还用于将所述输入内容与所述本地词库中的处于所述有效期内的词进行匹配。
[0024]第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的敏感词过滤方法。
[0025]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述第一方面所述的敏感词过滤方法。
[0026]相比于相关技术,本申请实施例提供的敏感词过滤方法,通过获取用户的输入内容,将该输入内容与本地词库中的词进行匹配,若不匹配,将该输入内容通过互联网过滤接口与后台数据库中的词进行比对,并将该比对的比对信息存入该本地词库,解决了在保证敏感词更新的及时性的情况下,游戏项目中敏感词过滤检测的成本较高的问题,实现了在保证敏感词更新的及时性的情况下,降低游戏项目中敏感词过滤检测成本的效果。
附图说明
[0027]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0028]图1是根据本申请实施例的敏感词过滤的方法的应用环境示意图;
[0029]图2是根据本申请实施例的敏感词过滤方法的流程图;
[0030]图3是根据本申请实施例的将输入内容与本地词库进行匹配的流程图;
[0031]图4是根据本申请实施例的敏感词过滤装置的结构框图;
[0032]图5是根据本申请实施例的另一种敏感词过滤装置的结构框图;
[0033]图6是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
[0034]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0035]显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的
技术实现思路
的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
[0036]在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种敏感词过滤方法,其特征在于,包括:获取用户的输入内容;将所述输入内容与本地词库中的词进行匹配;若不匹配,将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对,并将所述比对的比对信息存入所述本地词库。2.根据权利要求1所述的方法,其特征在于,在所述输入内容与所述本地词库中的词不匹配之后,在将所述输入内容通过互联网过滤接口与后台数据库中的词进行比对之前,所述方法包括:在预设时间段内,将多条所述输入内容合并为一条输入内容。3.根据权利要求1所述的方法,其特征在于,所述本地词库包括白词库和黑词库,所述将所述输入内容与本地词库进行匹配包括:将所述输入内容与所述白词库中的白词进行匹配;若所述输入内容与所述白词匹配,所述输入内容过滤通过;若所述输入内容与所述白词不匹配,将所述输入内容与所述黑词库中的黑词进行匹配,若所述输入内容与所述黑词匹配,拦截所述输入内容,若所述输入内容与所述黑词不匹配,则代表所述输入内容与所述本地词库中的词不匹配。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述本地词库中的词设置有有效期,所述将所述输入内容与所述本地词库中的词进行匹配包括:将所述输入内容与所述本地词库中的处于所述有效期内的词进行匹配。5.一种敏感词过滤装置,其特征在于,所述装置包括:获取模块,用于获取用户的输入内容;匹配模块,用于将所述输入内容与本地词库中的词进行匹配;过滤模块,用于在所述输入内容与所述本地词库中的词不匹配的情况下,...

【专利技术属性】
技术研发人员:林波
申请(专利权)人:杭州电魂网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1