违规图片的数据拦截方法及装置制造方法及图纸

技术编号:31800271 阅读:18 留言:0更新日期:2022-01-08 11:00
本发明专利技术是关于一种违规图片的数据拦截方法及装置,方法包括:获取疑似敏感图片,并对所述疑似敏感图片进行二次确认;当所述疑似敏感图片被确认为违规图片时,创建一个回扫任务,并记录所述违规图片的MD5值;根据所述回扫任务,提取所述违规图片的图片特征值;将所述图片特征值与已存储的历史数据进行相似度计算,以得到相似度计算结果;将所述违规图片的MD5值与已存储的MD5值进行校验,确定两者是否一致,得到校验结果;根据相似度计算结果和校验结果对所述违规图片进行拦截处理。通过该技术方案,可以对未来产生的数据进行拦截,减少人工参与。工参与。工参与。

【技术实现步骤摘要】
违规图片的数据拦截方法及装置


[0001]本专利技术涉及图片处理
,尤其涉及一种违规图片的数据拦截方法及装置。

技术介绍

[0002]随着互联网技术的快速发展,图片因具备直观、真实、信息承载量大等优势,在社交平台、商业广告等各类信息承载媒体上的占比越来越大,导致网络上每天都会生成海量的图片。
[0003]为了获得网络热度,不法分子会生成或者传播包含色情、暴力、恐怖等违规元素的图片。现有技术中,需要人工主动收集被确定为违规的数据,并将这些数据与存储的数据进行比对,将相似度100%的图片传回人工进行操作处理。
[0004]目前的历史数据召回系统存在以下缺陷:排序按时间顺序,其中内容排列混乱,面对匹配量较大的素材时,无法高效地查找出最佳目标;回溯结果必须100%匹配,无法对具有较高相似度且同样违规的数据进行处理;处理历史信息的同时无法对未来产生的信息进行拦截。

技术实现思路

[0005]为克服相关技术中存在的问题,本专利技术提供一种违规图片的数据拦截方法及装置,解决相似图片筛选的效率问题,支持多个相似度范围的筛选,寻找真正违规的内容,并批量处理,同时解决拦截与回扫不联通的问题,通过对敏感图进行记录,可以对未来产生的数据进行拦截,减少人工参与。
[0006]根据本专利技术实施例的第一方面,提供一种违规图片的数据拦截方法,所述方法包括:
[0007]获取疑似敏感图片,并对所述疑似敏感图片进行二次确认;
[0008]当所述疑似敏感图片被确认为违规图片时,创建一个回扫任务,并记录所述违规图片的MD5值;
[0009]根据所述回扫任务,提取所述违规图片的图片特征值;
[0010]将所述图片特征值与已存储的历史数据进行相似度计算,以得到相似度计算结果;
[0011]将所述违规图片的MD5值与已存储的MD5值进行校验,确定两者是否一致,得到校验结果;
[0012]根据相似度计算结果和校验结果对所述违规图片进行拦截处理。
[0013]在一个实施例中,优选地,所述疑似敏感图片的数据来源包括以下至少一个:
[0014]用户发布时初级审核系统判定为违规的图片数据;
[0015]搜集小组从开放网络搜集到的违规的图片数据;
[0016]被其他用户举报的图片数据。
[0017]在一个实施例中,优选地,根据相似度计算结果和校验结果对所述违规图片进行
拦截处理,包括:
[0018]根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片;和/或
[0019]拦截校验结果为两者一致的违规图片。
[0020]在一个实施例中,优选地,根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片,包括:
[0021]将相似度计算结果按照相似度进行降序排序;
[0022]按照预设的相似度筛选范围筛选出所有相似度在所述预设的相似度筛选范围内的目标违规图片;
[0023]根据接收到的拦截指令,拦截筛选出的目标违规图片。
[0024]在一个实施例中,优选地,所述方法包括:
[0025]接收用户输入的相似度筛选范围设置指令,根据所述设置指令,设置所述预设的相似度筛选范围。
[0026]根据本专利技术实施例的第二方面,提供一种违规图片的数据拦截装置,所述装置包括:
[0027]获取模块,用于获取疑似敏感图片,并对所述疑似敏感图片进行二次确认;
[0028]处理模块,用于当所述疑似敏感图片被确认为违规图片时,创建一个回扫任务,并记录所述违规图片的MD5值;
[0029]提取模块,用于根据所述回扫任务,提取所述违规图片的图片特征值;
[0030]计算模块,用于将所述图片特征值与已存储的历史数据进行相似度计算,以得到相似度计算结果;
[0031]确定模块,用于将所述违规图片的MD5值与已存储的MD5值进行校验,确定两者是否一致,得到校验结果;
[0032]拦截模块,用于根据相似度计算结果和校验结果对所述违规图片进行拦截处理。
[0033]在一个实施例中,优选地,所述疑似敏感图片的数据来源包括以下至少一个:
[0034]用户发布时初级审核系统判定为违规的图片数据;
[0035]搜集小组从开放网络搜集到的违规的图片数据;
[0036]被其他用户举报的图片数据。
[0037]在一个实施例中,优选地,所述拦截模块用于:
[0038]根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片;和/或
[0039]拦截校验结果为两者一致的违规图片。
[0040]在一个实施例中,优选地,所述拦截模块包括:
[0041]排序单元,用于将相似度计算结果按照相似度进行降序排序;
[0042]筛选单元,用于按照预设的相似度筛选范围筛选出所有相似度在所述预设的相似度筛选范围内的目标违规图片;
[0043]拦截单元,用于根据接收到的拦截指令,拦截筛选出的目标违规图片。
[0044]在一个实施例中,优选地,所述装置包括:
[0045]设置模块,用于接收用户输入的相似度筛选范围设置指令,根据所述设置指令,设置所述预设的相似度筛选范围。
[0046]根据本专利技术实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算
机指令,所述指令被处理器执行时实现如第二方面的实施例中任一项所述方法的步骤。
[0047]本专利技术的实施例提供的技术方案可以包括以下有益效果:
[0048]本专利技术实施例中,加入敏感图待确认流程,对数据来源做二次筛查,从而对于真正危害产品社会、产品安全和用户体验的内容保证能够清理。同时,对于相似图的回溯,要通过人工多个取值范围内进行筛查,以防止造成误伤、漏放等。并且,可以同时对历史图片和新增的图片均进行处理。
[0049]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0050]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0051]图1是根据一示例性实施例示出的一种违规图片的数据拦截方法的流程图。
[0052]图2是根据一示例性实施例示出的另一种违规图片的数据拦截方法的流程图。
[0053]图3是根据一示例性实施例示出的又一种违规图片的数据拦截方法的流程图。
[0054]图4是根据一示例性实施例示出的一种违规图片的数据拦截装置的框图。
[0055]图5是根据一示例性实施例示出的一种违规图片的数据拦截装置中拦截模块的框图。
[0056]图6是根据一示例性实施例示出的又一种违规图片的数据拦截装置的框图。
具体实施方式
[0057]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种违规图片的数据拦截方法,其特征在于,所述方法包括:获取疑似敏感图片,并对所述疑似敏感图片进行二次确认;当所述疑似敏感图片被确认为违规图片时,创建一个回扫任务,并记录所述违规图片的MD5值;根据所述回扫任务,提取所述违规图片的图片特征值;将所述图片特征值与已存储的历史数据进行相似度计算,以得到相似度计算结果;将所述违规图片的MD5值与已存储的MD5值进行校验,确定两者是否一致,得到校验结果;根据相似度计算结果和校验结果对所述违规图片进行拦截处理。2.根据权利要求1所述的方法,其特征在于,所述疑似敏感图片的数据来源包括以下至少一个:用户发布时初级审核系统判定为违规的图片数据;搜集小组从开放网络搜集到的违规的图片数据;被其他用户举报的图片数据。3.根据权利要求1所述的方法,其特征在于,根据相似度计算结果和校验结果对所述违规图片进行拦截处理,包括:根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片;和/或拦截校验结果为两者一致的违规图片。4.根据权利要求3所述的方法,其特征在于,根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片,包括:将相似度计算结果按照相似度进行降序排序;按照预设的相似度筛选范围筛选出所有相似度在所述预设的相似度筛选范围内的目标违规图片;根据接收到的拦截指令,拦截筛选出的目标违规图片。5.根据权利要求1所述的方法,其特征在于,所述方法包括:接收用户输入的相似度筛选范围设置指令,根据所述设置指令,设置所述预设的相似度筛选范围。6.一种违规图片的数据拦截装置,其特征...

【专利技术属性】
技术研发人员:胡伟林王彩霞李浩李雪垠
申请(专利权)人:北京小川在线网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1