一种用于违规图片检测的方法及图片检测引擎技术

技术编号:33669424 阅读:69 留言:0更新日期:2022-06-02 20:52
本发明专利技术提供了一种用于违规图片检测的方法及图片检测引擎;所述图片检测引擎包括数据接口模块、黑白名单过滤模块、图片预处理模块、文本识别检测模块、主题检测模块、违规决策模块、用户检测模块、引擎数据库、引擎管理模块;违规图片检测的方法借助上述图片检测引擎的各模块实现针对违规图片的识别检测。各模块实现针对违规图片的识别检测。各模块实现针对违规图片的识别检测。

【技术实现步骤摘要】
一种用于违规图片检测的方法及图片检测引擎


[0001]本专利技术涉及计算机
,具体涉及一种用于违规图片检测的方法及图片检测引擎。

技术介绍

[0002]随着网络用户的日益增长,互联网平台的用户发布内容的审核治理问题日益严峻,针对有违法违规或违反互联网平台规定的信息或内容需要及时发现和治理,以避免用户发布信息造成恶劣的社会影响或对互联网平台的正常运行带来负面影响。因此,互联网平台需要依赖高效、准确的用户生成内容检验方法来实现上述需求。
[0003]近年来,图片成为互联网平台用户发布信息的主要形式之一,针对图片的违规检测需求日益增多。当前针对用户生成图片内容的检验方法包括人工审核、深度学习、图片聚类、图片文字识别等。
[0004]但由于图片包含主题丰富、内容庞杂,因此图片违规存在较多类型;传统的违规图片检测方法针对单一图片主题或违规类型检测效果较好,但对于复杂的图片主题与内容往往会出现漏检或误检的问题,需要耗费大量人工成本进行人工检验,且往往由于人工检测不及时造成不良的社会影响。

技术实现思路

[0005]针对上述存在的技术局限性,本专利技术提出了一种用于违规图片检测的方法及图片检测引擎;为实现上述目的,本专利技术采用以下技术方案:本专利技术实施例提供了一种用于违规图片检测的方法及图片检测引擎。
[0006]所述图片检测引擎包括数据接口模块、黑白名单过滤模块、图片预处理模块、文本识别检测模块、主题检测模块、违规决策模块、用户检测模块、引擎数据库、引擎管理模块。
[0007]所述数据接口模块用于获取用户发布图片请求数据、从外部数据库获取用户信息数据、输出图片合规检验结果。所述黑白名单过滤模块用于用户、ip、图片的黑白名单过滤;所述图片预处理模块用于读取用户发布图片数据、进行图片格式转换、进行图片裁剪旋转变换、将图片根据内容分类。所述文本识别检测模块用于提取含文本类图片的文本内容并进行文本违规检测。所述主题检测模块用于根据用户发布图片请求数据中的关联主题类型对图片进行违规检测。所述用户检测模块用于根据用户行为数据计算用户风险概率。
[0008]所述引擎数据库用于存储图片检测引擎所依赖的数据,包括违规文本数据库、关联主题图片数据库、黑白名单数据库。其中,违规文本数据库存储违规文本关键词,关联主题图片数据库存储关联主题的违规图片及主题标签,黑白名单数据库用于存储用户id黑白名单、ip黑白名单及图片黑白名单。
[0009]所述违规决策模块用于根据黑白名单过滤模块、文本识别检测模块、主题检测模块、用户检测模块的结果判断图片是否违规。所述引擎管理模块用于图片检测引擎的关键
参数及引擎数据库优化。
[0010]违规图片检测方法包括以下步骤:步骤S1、数据接口模块获得用户发布图片数据,包括用户数据、图片数据、关联主题数据;步骤S2、黑白名单过滤模块对用户发布图片数据进行黑白名单过滤,将对应结果输入违规决策模块执行第一违规判断操作,得到第一违规判断结果;若第一违规判断结果表征命中黑白名单,则通过数据接口模块输出第一违规判断结果;步骤S3、若第一违规判断结果表征未命中黑白名单,则将用户发布图片数据输入图片预处理模块进行图片预处理操作,得到图片预处理结果;同时,将用户发布图片数据中的用户数据输入用户检测模块进行用户检测操作,得到用户检测结果;所述图片预处理结果包括处理后的图片数据、图片分类结果;所述用户检测结果包括用户风险概率数值;步骤S4、根据所述图片预处理结果中的图片分类结果进行操作:若图片分类结果为含文本类图片,则将图片预处理结果输入文本识别检测模块进行文本检测得到文本违规检测结果;若图片分类结果为非文本图片,则将图片预处理结果输入主题检测模块进行主题违规检测得到主题违规检测结果;步骤S5、违规决策模块根据用户检测结果、文本违规检测结果、主题违规检测结果进行违规决策得到违规判定结果,并由数据接口模块输出。
[0011]本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术提供的一种用于违规图片检测的方法及图片检测引擎达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:通过图片预处理的图片滤波与图片增强,优化了图片信噪比,有利于提升图片违规检测的效率和准确度;通过图片分类检测,对图片内容进行检测,并针对不同主题内容采用不同检测模型,提高了图片违规检测的精准度。
[0012]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0013]图1为本专利技术实施例提供的一种用于违规图片检测的图片检测引擎结构图。
具体实施方式
[0014]为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种用于违规图片检测的方法及图片检测引擎,详细说明如后。
[0015]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方
法、函数、规程、子例程、子程序等等。
[0016]如下为本专利技术实施例中涉及名词属于的解释:图片滤波:即在尽可能保留图片细节的前提下抑制图片噪声。
[0017]图片增强:即增强图像中的有用信息,从而加强图片判读和识别效果。
[0018]OCR:即光学字符识别,指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
[0019]下面结合前述名词术语具体介绍本专利技术的实现方式:本专利技术实施例提供了一种用于违规图片检测的方法及图片检测引擎。
[0020]参照图1所示,图片检测引擎包括数据接口模块、黑白名单过滤模块、图片预处理模块、文本识别检测模块、主题检测模块、违规决策模块、用户检测模块、引擎数据库、引擎管理模块。
[0021]所述数据接口模块用于获取用户发布图片请求数据、从外部数据库获取用户信息数据、输出图片合规检验结果。所述黑白名单过滤模块用于用户、ip、图片的黑白名单过滤;所述图片预处理模块用于读取用户发布图片数据、进行图片格式转换、进行图片裁剪旋转变换、将图片根据内容分类。所述文本识别检测模块用于提取含文本类图片的文本内容并进行文本违规检测。所述主题检测模块用于根据用户发布图片请求数据中的关联主题类型对图片进行违规检测。所述用户检测模块用于根据用户行为数据计算用户风险概率。
[0022]所述引擎数据库用于存储图片检测引擎所依赖的数据,包括违规文本数据库、关联主题图片数据库、黑白名单数据库。其中,违规文本数据库本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于违规图片检测的方法,其特征在于,违规图片检测的方法包括以下步骤:步骤S1、数据接口模块获得用户发布图片数据,包括用户数据、图片数据、关联主题数据;步骤S2、黑白名单过滤模块对用户发布图片数据进行黑白名单过滤,将对应结果输入违规决策模块执行第一违规判断操作,得到第一违规判断结果;若第一违规判断结果表征命中黑白名单,则通过数据接口模块输出第一违规判断结果;步骤S3、若第一违规判断结果表征未命中黑白名单,则将用户发布图片数据输入图片预处理模块进行图片预处理操作,得到图片预处理结果;同时,将用户发布图片数据中的用户数据输入用户检测模块进行用户检测操作,得到用户检测结果;图片预处理结果包括处理后的图片数据、图片分类结果;用户检测结果包括用户风险概率数值;步骤S4、根据所述图片预处理结果中的图片分类结果进行操作:若图片分类结果为含文本类图片,则将图片预处理结果输入文本识别检测模块进行文本检测得到文本违规检测结果;若图片分类结果为非文本图片,则将图片预处理结果输入主题检测模块进行主题违规检测得到主题违规检测结果;步骤S5、违规决策模块根据用户检测结果、文本违规检测结果、主题违规检测结果进行违规决策得到违规判定结果,并由数据接口模块输出;其中,步骤S2中所述黑白名单过滤包括用户id黑白名单过滤、用户ip黑白名单过滤、图片黑白名单过滤。2.根据权利要求1所述的方法,其特征在于,所述文本检测依靠违规文本数据库实现,所述违规文本数据库存储违规文本关键词;所述主题违规检测依靠关联主题图片数据库实现,所述关联主题图片数据库存储关联主题的违规图片及主题标签;所述黑白名单过滤依靠黑白名单数据库,所述黑白名单数据库用于存储用户id黑白名单、ip黑白名单及图片黑白名单。3.根据权利要求1所述的方法,其特征在于,所述用户id黑白名单过滤通过以下方式实现:将用户id作为关键字在黑白名单数据库中的用户id黑白名单列表中进行查询,并输出对应的查询结果,结果包含“0”、“1”、“2”,“0”表示用户id为白名单id,“1”表示用户id为黑名单id,“2”表示无查询结果;所述用户ip黑白名单过滤通过以下方式实现:将用户ip作为关键字在黑白名单数据库中的ip黑白名单列表中进行查询,并输出对应的查询结果,结果包含“0”、“1”、“2”,“0”表示用户ip为白名单ip,“1”表示用户ip为黑名单ip,“2”表示无查询结果;所述图片黑白名单过滤通过以下方式实现:将图片转化为灰度图并进行hash运算,得到图片关键编码,并以图片关键编码为关键字在黑白名单数据库中的图片黑白名单列表中进行查询,并输出对应的查询结果,结果包含“0”、“1”、“2”,“0”表示图片为白名单图片,“1”表示图片为黑名单图片,“2”表示无查询结果;其中hash运算采用MD5算法;所述图片黑白名单列表中存储有黑白名单图片关键编码及黑白名单标识,黑白名单图片关键编码同样通过灰度转化后进行hash运算得到。
4.根据权利要求1所述的方法,其特征在于,步骤S3中所述图片预处理操作包括:图片滤波、图片增强、图像分类检测,具体步骤为:对输入图片按照图片编码方式进行读取并将色彩空间转化为RGB空间得到第一图片数据;对第一图片数据进行图片滤波及图片增强处理,得到第二图片数据;对第二图片数据执行图片分类检测,得到图片分类数据。5.根据权利要求4所述的方法,其特征在于,所述图片滤波通过以下算法实现:对于输入图片转化为灰度图并按照预设的映射方式得到增维的三维矩阵;对三维矩阵按照预设变换方式...

【专利技术属性】
技术研发人员:邓小明
申请(专利权)人:深圳尚米网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1