本发明专利技术实施例提供一种敏感词过滤方法和装置,该方法包括:若接收到待发送数据,则从第一内存空间中读取第一预设词库,第一预设词库被预加载至第一内存空间中长久存储;使用第一预设词库对待发送数据进行敏感词过滤处理;若过滤结果表示待发送数据中含有敏感词,则删除待发送数据。由于第一预设词库常驻在内存空间中,可以快速地获取到该第一预设词库完成敏感词过滤处理,尤其当需要对大量的待发送数据进行高并发的敏感词过滤处理时,能够更加显著地提高过滤效率。
【技术实现步骤摘要】
敏感词过滤方法和装置
本专利技术涉及互联网
,尤其涉及一种敏感词过滤方法和装置。
技术介绍
随着互联网技术的发展,近年来,人们通过手机终端等智能终端设备观看网络视频、使用各种社交软件等已经成为人们的一种常见娱乐休闲方式。为了提高在观看视频同时的参与度,提高用户体验,目前,诸如发弹幕、聊天室等交互方式已经较为普遍地被使用。以网络视频直播场景为例,由于观看某直播的直播视频的用户众多,一个用户发表的言论是主播和其他观看用户都可见的。为了保证网络直播应用的健康性,往往需要对每个用户发表的言论进行敏感词过滤,以滤出低俗的、政治敏感的等言论。但是,随着使用某网络应用比如网络视频直播的用户数量的不断增加以及用户通过发表言论参与互动的程度的不断增长,应用服务器进行高并发大量言论的敏感词过滤的处理压力将会很大,处理效率很可能会很低。
技术实现思路
有鉴于此,本专利技术实施例提供一种敏感词过滤方法和装置,用以提高敏感词过滤的处理效率。本专利技术实施例提供一种敏感词过滤方法,包括:若接收到待发送数据,则从第一内存空间中读取第一预设词库,所述第一预设词库被预加载至所述第一内存空间中长久存储;使用所述第一预设词库对所述待发送数据进行敏感词过滤处理;若过滤结果表示所述待发送数据中含有敏感词,则删除所述待发送数据。本专利技术实施例提供一种敏感词过滤装置,包括:读取模块,用于若接收到待发送数据,则从第一内存空间中读取第一预设词库,所述第一预设词库被预加载至所述第一内存空间中长久存储;过滤模块,用于使用所述第一预设词库对所述待发送数据进行敏感词过滤处理;删除模块,用于若过滤结果表示所述待发送数据中含有敏感词,则删除所述待发送数据。本专利技术实施例提供的敏感词过滤方法和装置,将第一预设词库被预加载至第一内存空间中长久存储,当接收到待发送数据时,可以直接从第一内存空间中读取第一预设词库来对待发送数据进行敏感词过滤处理,由于第一预设词库常驻在内存空间中,可以快速地获取到该第一预设词库完成敏感词过滤处理,尤其当需要对大量的待发送数据进行高并发的敏感词过滤处理时,能够更加显著地提高过滤效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的敏感词过滤方法实施例一的流程图;图2为本专利技术实施例提供的敏感词过滤方法实施例二的流程图;图3为本专利技术实施例提供的敏感词过滤装置实施例一的结构示意图;图4为本专利技术实施例提供的敏感词过滤装置实施例二的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。应当理解,尽管在本专利技术实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本专利技术实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。图1为本专利技术实施例提供的敏感词过滤方法实施例一的流程图,本实施例提供的该敏感词过滤方法可以由一敏感词过滤装置来执行,该敏感词过滤装置可以实现为软件,或者实现为软件和硬件的组合,该敏感词过滤装置可以集成设置在服务器中。如图1所示,该方法包括如下步骤:步骤101、若接收到待发送数据,则从第一内存空间中读取第一预设词库,第一预设词库被预加载至第一内存空间中长久存储。步骤102、使用第一预设词库对待发送数据进行敏感词过滤处理。步骤103、若过滤结果表示待发送数据中含有敏感词,则删除待发送数据。本实施例中,上述待发送数据可以是客户端发送给服务器,经由服务器发送至其他客户端侧显示的数据。以视频直播场景为例,观看用户在观看某主播的直播视频的时候,可能会以弹幕的形式与主播进行互动,而该观看用户发送的弹幕,服务器需要发送至主播客户端以及其他观看用户的观看客户端进行同步显示,此时,观看用户发送的弹幕即为上述的待发送数据。本实施例中,用于进行敏感词过滤的预设词库被预先加载到内存空间中常驻,即本实施例中的上述第一预设词库被预加载至第一内存空间中长久存储,当服务器接收到待发送数据时,从对应的内存空间中读取该第一预设词库,以利用该第一预设词库对待发送数据进行敏感词过滤。由于第一预设词库被预加载到内存中常驻,使得服务器仅需在需要使用该第一预设词库时从内存中读取获得即可,从内存中读取的速度将远远高于从其他存储位置读取获得的速度。其中,对待发送数据进行敏感词过滤,主要是看该待发送数据中是否包含了第一预设词库中包含的词汇,若包含,则确定该待发送数据不应该被发送出去,删除该待发送数据,反之,如果该待发送数据中并不包含敏感词,则将该待发送数据发送至目的接收方。本实施例中,将第一预设词库被预加载至第一内存空间中长久存储,当接收到待发送数据时,可以直接从第一内存空间中读取第一预设词库来对待发送数据进行敏感词过滤处理,由于第一预设词库常驻在内存空间中,可以快速地获取到该第一预设词库完成敏感词过滤处理,尤其当需要对大量的待发送数据进行高并发的敏感词过滤处理时,能够更加显著地提高过滤效率。图2为本专利技术实施例提供的敏感词过滤方法实施例二的流程图,如图2所示,该方法包括如下步骤:步骤201、若接收到第一预设词库,则通过swoole服务启动预设脚本,以使预设脚本将第一预设词库存入第一内存空间中,其中,swoole服务预先为预设脚本申请第三内存空间,以供预设脚本持续运行本文档来自技高网...

【技术保护点】
一种敏感词过滤方法,其特征在于,包括:若接收到待发送数据,则从第一内存空间中读取第一预设词库,所述第一预设词库被预加载至所述第一内存空间中长久存储;使用所述第一预设词库对所述待发送数据进行敏感词过滤处理;若过滤结果表示所述待发送数据中含有敏感词,则删除所述待发送数据。
【技术特征摘要】
1.一种敏感词过滤方法,其特征在于,包括:若接收到待发送数据,则从第一内存空间中读取第一预设词库,所述第一预设词库被预加载至所述第一内存空间中长久存储;使用所述第一预设词库对所述待发送数据进行敏感词过滤处理;若过滤结果表示所述待发送数据中含有敏感词,则删除所述待发送数据。2.根据权利要求1所述的方法,其特征在于,所述从第一内存空间中读取第一预设词库,包括:若根据所述第一预设词库的更新时间判断所述第一预设词库有效,则从所述第一内存空间中读取所述第一预设词库。3.根据权利要求1所述的方法,其特征在于,所述从第一内存空间中读取第一预设词库,包括:若根据所述第一预设词库的更新时间判断所述第一预设词库无效,则获取更新版本的第二预设词库;将所述第一预设词库从所述第一内存空间中删除,将所述第二预设词库加载至第二内存空间中长久存储,所述第一内存空间与所述第二内存空间相同或不同;从所述第二内存空间中读取所述第二预设词库。4.根据权利要求1所述的方法,其特征在于,所述从第一内存空间中读取第一预设词库,包括:通过swoole服务将所述待发送数据传输至一预设脚本,以使所述预设脚本从所述第一内存空间中读取所述第一预设词库,其中,所述预设脚本是提供敏感词过滤功能的脚本。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:若接收到所述第一预设词库,则通过swoole服务启动预设脚本,以使所述预设脚本将所述第一预设词库存入所述第一内存空间中;其中,所述swoole服务预先为所述预设脚本申请第三内存空间,以供所述预设脚本持续运行使用;所述预设脚本预先申请所述第一内存空间,以用于存储所述第一预设词库。6.一种敏感词过...
【专利技术属性】
技术研发人员:王鹏跃,张鹏翼,张菊元,
申请(专利权)人:北京潘达互娱科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。