一种违规数据的审核方法及装置制造方法及图纸

技术编号:27613929 阅读:22 留言:0更新日期:2021-03-10 10:41
本发明专利技术公开了一种违规数据的审核方法及装置,所述方法包括:当接收到对内容数据的审核请求时,获取所述内容数据的数据类型;选取与所述数据类型匹配的目标审核方法;基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据。上述的审核过程中,在接收到对内容数据的审核请求时,首先确定内容数据的数据类型,基于不同的数据类型选取对应的目标审核方法进行审核,对内容数据进行了进一步细分,提高了审核的准确性,避免出现违规数据漏审的情况。出现违规数据漏审的情况。出现违规数据漏审的情况。

【技术实现步骤摘要】
一种违规数据的审核方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种违规数据的审核方法及装置。

技术介绍

[0002]如今伴随着互联网技术的飞速发展,各种网站或者品平台都可以实现用户端的内容数据的上传,因此,如何保障线上内容数据的合法合规,越来越重要,
[0003]现有的违规数据的审核主要基于机器审核,采用相同的审核模型进行审核,审核的准确率低,经常出现漏审违规数据的情况。

技术实现思路

[0004]有鉴于此,本专利技术提供一种违规数据的审核方法及装置,用以解决现有的违规数据的审核主要基于机器审核,采用相同的审核模型进行审核,审核的准确率低,经常出现漏审违规数据的情况的问题,具体方案如下:
[0005]一种违规数据的审核方法,包括:
[0006]当接收到对内容数据的审核请求时,获取所述内容数据的数据类型;
[0007]选取与所述数据类型匹配的目标审核方法;
[0008]基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据。
[0009]上述的方法,可选的,还包括:
[0010]在基于所述目标审核方法审核失败的情况下,将所述内容数据转入人工审核。
[0011]上述的方法,可选的,在所述数据类型为图片时,基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据,包括:
[0012]提取所述图片的各个第一特征;
[0013]基于目标审核模型对所述各个第一特征进行审核,得到第一审核结果,其中,所述目标审核模型基于faster R-cnn算法进行构建;
[0014]基于所述第一审核结果,判断所述图片中是否存在违规数据。
[0015]上述的方法,可选的,在所述数据类型为视频时,基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据,包括:
[0016]提取所述视频中的各个图片;
[0017]提取所述各个图片的各个第二特征;
[0018]基于目标审核模型对所述各个第二特征进行审核,得到第二审核结果;
[0019]基于所述第二审核结果,判断所述视频中是否存在违规数据。
[0020]上述的方法,可选的,在所述数据类型为文本时,预先构建违规关键词库,基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据,包括:
[0021]对所述文本进行分词,得到各个关键词;
[0022]将所述各个关键词与所述违规关键词库中的各个违规关键词进行比较,得到第三
比较结果;
[0023]基于所述第三比较结果,判断所述文本中是否存在违规数据。
[0024]一种违规数据的审核装置,包括:
[0025]获取模块,用于当接收到对内容数据的审核请求时,获取所述内容数据的数据类型;
[0026]选取模块,用于选取与所述数据类型匹配的目标审核方法;
[0027]审核模块,用于基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据。
[0028]上述的装置,可选的,还包括:
[0029]转入模块,用于在基于所述目标审核方法审核失败的情况下,将所述内容数据转入人工审核。
[0030]上述的装置,可选的,在所述数据类型为图片时,所述审核模块包括:
[0031]第一提取单元,用于提取所述图片的各个第一特征;
[0032]第一审核单元,用于基于目标审核模型对所述各个第一特征进行审核,得到第一审核结果,其中,所述目标审核模型基于faster R-cnn算法进行构建;
[0033]第一判断单元,用于基于所述第一审核结果,判断所述图片中是否存在违规数据。
[0034]上述的装置,可选的,在所述数据类型为视频时,所述审核模块包括:
[0035]第二提取单元,用于提取所述视频中的各个图片;
[0036]第三提取单元,用于提取所述各个图片的各个第二特征;
[0037]第二审核单元,用于基于目标审核模型对所述各个第二特征进行审核,得到第二审核结果;
[0038]第二判断单元,用于基于所述第二审核结果,判断所述视频中是否存在违规数据。
[0039]上述的装置,可选的,在所述数据类型为文本时,预先构建违规关键词库,所述审核模块包括:
[0040]分词单元,用于对所述文本进行分词,得到各个关键词;
[0041]比较单元,用于将所述各个关键词与所述违规关键词库中的各个违规关键词进行比较,得到第三比较结果;
[0042]第三判断单元,用于基于所述第三比较结果,判断所述文本中是否存在违规数据。
[0043]与现有技术相比,本专利技术包括以下优点:
[0044]本专利技术公开了一种违规数据的审核方法及装置,所述方法包括:当接收到对内容数据的审核请求时,获取所述内容数据的数据类型;选取与所述数据类型匹配的目标审核方法;基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据。上述的审核过程中,在接收到对内容数据的审核请求时,首先确定内容数据的数据类型,基于不同的数据类型选取对应的目标审核方法进行审核,对内容数据进行了进一步细分,提高了审核的准确性,避免出现违规数据漏审的情况。
[0045]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0046]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]图1为本申请实施例公开的一种违规数据收集方法流程图;
[0048]图2为本申请实施例公开的一种违规数据收集方法又一方法流程图;
[0049]图3为本申请实施例公开的一种违规数据的审核方法流程图;
[0050]图4为本申请实施例公开的一种违规数据的审核装置结构框图。
具体实施方式
[0051]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0052]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本专利技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本专利技术的精神或范围的情况下,在其它实施例中实现。因此,本专利技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
[0053]本专利技术公开了一种违规数据的审核方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种违规数据的审核方法,其特征在于,包括:当接收到对内容数据的审核请求时,获取所述内容数据的数据类型;选取与所述数据类型匹配的目标审核方法;基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据。2.根据权利要求1所述的方法,其特征在于,还包括:在基于所述目标审核方法审核失败的情况下,将所述内容数据转入人工审核。3.根据权利要求1所述的方法,其特征在于,在所述数据类型为图片时,基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据,包括:提取所述图片的各个第一特征;基于目标审核模型对所述各个第一特征进行审核,得到第一审核结果,其中,所述目标审核模型基于faster R-cnn算法进行构建;基于所述第一审核结果,判断所述图片中是否存在违规数据。4.根据权利要求3所述的方法,其特征在于,在所述数据类型为视频时,基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据,包括:提取所述视频中的各个图片;提取所述各个图片的各个第二特征;基于目标审核模型对所述各个第二特征进行审核,得到第二审核结果;基于所述第二审核结果,判断所述视频中是否存在违规数据。5.根据权利要求1所述的方法,其特征在于,在所述数据类型为文本时,预先构建违规关键词库,基于所述目标审核方法对所述内容数据进行审核,确定所述内容数据中是否存在违规数据,包括:对所述文本进行分词,得到各个关键词;将所述各个关键词与所述违规关键词库中的各个违规关键词进行比较,得到第三比较结果;基于所述第三比较结果,判断所述文本中是否存在违规数据。6.一种违规数据的审核装置...

【专利技术属性】
技术研发人员:彭春晓
申请(专利权)人:行吟信息科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1