违规图片的数据拦截方法及装置制造方法及图纸

技术编号：31800271 阅读：18 留言：0更新日期：2022-01-08 11:00

本发明专利技术是关于一种违规图片的数据拦截方法及装置，方法包括：获取疑似敏感图片，并对所述疑似敏感图片进行二次确认；当所述疑似敏感图片被确认为违规图片时，创建一个回扫任务，并记录所述违规图片的MD5值；根据所述回扫任务，提取所述违规图片的图片特征值；将所述图片特征值与已存储的历史数据进行相似度计算，以得到相似度计算结果；将所述违规图片的MD5值与已存储的MD5值进行校验，确定两者是否一致，得到校验结果；根据相似度计算结果和校验结果对所述违规图片进行拦截处理。通过该技术方案，可以对未来产生的数据进行拦截，减少人工参与。工参与。工参与。

全部详细技术资料下载

【技术实现步骤摘要】
违规图片的数据拦截方法及装置

[0001]本专利技术涉及图片处理
，尤其涉及一种违规图片的数据拦截方法及装置。

技术介绍

[0002]随着互联网技术的快速发展，图片因具备直观、真实、信息承载量大等优势，在社交平台、商业广告等各类信息承载媒体上的占比越来越大，导致网络上每天都会生成海量的图片。
[0003]为了获得网络热度，不法分子会生成或者传播包含色情、暴力、恐怖等违规元素的图片。现有技术中，需要人工主动收集被确定为违规的数据，并将这些数据与存储的数据进行比对，将相似度100％的图片传回人工进行操作处理。
[0004]目前的历史数据召回系统存在以下缺陷：排序按时间顺序，其中内容排列混乱，面对匹配量较大的素材时，无法高效地查找出最佳目标；回溯结果必须100％匹配，无法对具有较高相似度且同样违规的数据进行处理；处理历史信息的同时无法对未来产生的信息进行拦截。

技术实现思路

[0005]为克服相关技术中存在的问题，本专利技术提供一种违规图片的数据拦截方法及装置，解决相似图片筛选的效率问题，支持多个相似度范围的筛选，寻找真正违规的内容，并批量处理，同时解决拦截与回扫不联通的问题，通过对敏感图进行记录，可以对未来产生的数据进行拦截，减少人工参与。
[0006]根据本专利技术实施例的第一方面，提供一种违规图片的数据拦截方法，所述方法包括：
[0007]获取疑似敏感图片，并对所述疑似敏感图片进行二次确认；
[0008]当所述疑似敏感图片被确认为违规图片时，创建一个回扫任...

【技术保护点】

【技术特征摘要】
1.一种违规图片的数据拦截方法，其特征在于，所述方法包括：获取疑似敏感图片，并对所述疑似敏感图片进行二次确认；当所述疑似敏感图片被确认为违规图片时，创建一个回扫任务，并记录所述违规图片的MD5值；根据所述回扫任务，提取所述违规图片的图片特征值；将所述图片特征值与已存储的历史数据进行相似度计算，以得到相似度计算结果；将所述违规图片的MD5值与已存储的MD5值进行校验，确定两者是否一致，得到校验结果；根据相似度计算结果和校验结果对所述违规图片进行拦截处理。2.根据权利要求1所述的方法，其特征在于，所述疑似敏感图片的数据来源包括以下至少一个：用户发布时初级审核系统判定为违规的图片数据；搜集小组从开放网络搜集到的违规的图片数据；被其他用户举报的图片数据。3.根据权利要求1所述的方法，其特征在于，根据相似度计算结果和校验结果对所述违规图片进行拦截处理，包括：根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片；和/或拦截校验结果为两者一致的违规图片。4.根据权利要求3所述的方法，其特征在于，根据预设的相似度筛选范围和相似度计算结果批量筛选出违规图片，包括：将相似度计算结果按照相似度进行降序排序；按照预设的相似度筛选范围筛选出所有相似度在所述预设的相似度筛选范围内的目标违规图片；根据接收到的拦截指令，拦截筛选出的目标违规图片。5.根据权利要求1所述的方法，其特征在于，所述方法包括：接收用户输入的相似度筛选范围设置指令，根据所述设置指令，设置所述预设的相似度筛选范围。6.一种违规图片的数据拦截装置，其特征...

【专利技术属性】
技术研发人员：胡伟林，王彩霞，李浩，李雪垠，
申请(专利权)人：北京小川在线网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人