色情图片的识别方法及其设备技术

技术编号:8215635 阅读:234 留言:0更新日期:2013-01-17 13:16
本发明专利技术实施例公开了一种色情图片的识别方法及其设备,该方法包括:根据图片相关统一资源定位符URL信息确定图片相关URL信息色情度得分,和/或根据图片相关文字信息确定图片相关文字信息色情度得分;根据所述图片相关URL信息色情度得分、和/或图片相关文字信息色情度得分与对应色情度得分阈值的关系,判断图片是否为色情图片。本发明专利技术实施例中,根据图片相关URL信息、和/或图片相关文字信息识别图片是否为色情图片,提高色情图片识别的准确性。

【技术实现步骤摘要】

本专利技术涉及通信领域,尤其涉及一种色情图片的识别方法及其设备
技术介绍
在搜索引擎业务中,当用户通过搜索引擎浏览一个网页时,如果网页中有色情图片,需要对色情图片进行屏蔽处理。同时,为了不影响用户的正常图片浏览速度,必须要预先识别图片是否为色情图片。现有技术中,搜索引擎系统中部署色情图片扫描功能模块,色情图片扫描功能模块不断的扫描系统网页中的图片,识别网页中的色情图片。现有的色情图片识别方法,是通过对图片中的色情特征点(判断一张图片是否是色情图片的图像特征,最典型的就是图片中的露点、性器官等)进行打分来判断。例如,设置满分为100分,阈值为80分,如果一个图片的得分超过80分的判定为色情图片,反之则为·非色情图片。但是,根据图片本身的色情特征点的打分进行色情图片识别的误差很大,有时候会将一张风景、一张桌子等非色情图片打很高的分数,准确性差。
技术实现思路
本专利技术实施例提供了一种色情图片的识别方法及其设备,提高色情图片识别的准确性。本专利技术实施例提供了一种色情图片的识别方法,包括 根据图片相关统一资源定位符URL信息确定图片相关URL信息色情度评价信息,和/或根据图片相关文字信息确定图片相关文字信息色情度评价信息; 根据所述图片相关URL信息色情度评价信息和/或图片相关文字信息色情度评价信息与对应色情度评价阈值的关系,判断图片是否为色情图片。本专利技术实施例提供了一种色情图片的识别方法,包括 根据图片相关统一资源定位符URL信息,确定图片相关URL信息色情度评价信息,和/或根据图片相关文字信息确定图片相关文字信息色情度评价信息; 查找与所述图片相关URL信息色情度评价信息和/或图片相关文字信息色情度评价信息对应的色情图片概率; 根据查找到的各色情图片概率以及概率阈值,判断图片是否为色情图片。本专利技术实施例提供了一种色情图片的识别设备,包括 评价信息确定单元,用于根据图片相关统一资源定位符URL信息确定图片相关URL信息色情度评价信息,和/或根据图片相关文字信息确定图片相关文字信息色情度评价信息; 判断单元,用于根据所述图片相关URL信息色情度评价信息和/或图片相关文字信息色情度评价信息与对应色情度评价阈值的关系,判断图片是否为色情图片。本专利技术实施例提供了一种色情图片的识别设备,包括评价信息确定单元,用于根据图片相关统一资源定位符URL信息,确定图片相关URL信息色情度评价信息,和/或根据图片相关文字信息确定图片相关文字信息色情度评价信息; 查找单元,用于查找与所述图片相关URL信息色情度评价信息和/或图片相关文字信息色情度评价信息对应的色情图片概率; 判断单元,用于根据所述查找单元查找到的各色情图片概率以及概率阈值,判断图片是否为色情图片。与现有技术相比,本专利技术实施例至少具有以下优点 本专利技术实施例中,根据图片相关URL信息、和/或图片相关文字信息识别图片是否为色情图片,提高色情图片识别的准确性。 附图说明图I是本专利技术实施例一提供的色情图片的识别方法的流程示意 图2是本专利技术实施例二提供的色情图片的识别方法的流程示意 图3是本专利技术实施例三提供的色情图片的识别方法的流程示意 图4是本专利技术实施例四提供的色情图片的识别设备的结构示意 图5和图6是本专利技术实施例五提供的色情图片的识别设备的结构示意图。具体实施例方式实施例一 本专利技术实施例一提供一种色情图片的识别方法,色情图片扫描功能模块根据图片相关URL (Universal Resource Locator,统一资源定位符)信息色情度打分和/或图片相关文字信息色情度打分识别色情图片。其中,图片相关URL信息包括但不限于图片本身的URL和/或图片所在网页的URL。图片相关文字信息包括但不限于以下信息之一或任意组合图片所在网页的文字、图片说明文字、图片所在网页的标题。下面结合附图对本专利技术实施例进行详细描述。参见图1,为本专利技术实施例一提供的色情图片的识别方法的流程示意图。该流程以以下场景为例描述根据图片相关URL信息色情度打分和图片相关文字信息色情度打分识别色情图片,其中,图片相关URL信息包括图片本身的URL和/或图片所在网页的URL,图片相关文字信息包括图片所在网页的文字、图片说明文字和/或图片所在网页的标题。如图I所示,该方法包括以下步骤 步骤101,色情图片扫描功能模块扫描图片,分别确定图片本身的URL色情度得分、图片所在网页的URL色情度得分、图片所在网页的文字色情度得分、图片说明文字色情度得分和/或图片所在网页的标题色情度得分。其中,图片所在网页的URL信息的色情度得分,可根据该网页URL中的敏感词汇进行计算,该敏感词汇例如sexy、girls、tenns等;同理,图片本身的URL信息的色情度得分,可根据该图片的URL中的敏感词汇进行计算。图片所在网页的文字信息的色情度得分,可根据文字中的敏感词汇进行计算,该敏感词汇例如“骚妇”、“性感”、“自拍”、“科学技术”等;同理,图片说明文字和图片所在网页的标题的色情度得分。优选的,可根据图片本身的URL中所有敏感词汇的得分之和或加权后的得分之和,或进一步求平均值得到图片本身的URL色情度得分,同理可根据图片所在网页文字的所有敏感词汇的得分之和或加权后的得分之和,或进一步求平均值得到图片所在网页文字的色情度得分。类似的,可根据敏感词汇的得分之和或加权后的得分,或进一步求平均值得到图片所在网页的URL色情度得分、图片说明文字色情度得分以及图片所在网页的标题色情度得分。每一个敏感词汇的得分为预先设定。色情图片扫描功能模块执行图片扫描功能时,从预先加载的配置文件中获取每一敏感词汇的得分,进而根据扫描得到的敏感词汇计算色情度得分。每一个敏感词汇的得分的预先设定方式包括但不限于机器训练方式通过计算机程序对一定规模的数据集合进行分析和计算得出相应结果。该数据集合可以为预先设置的样本数据。步骤102,色情图片扫描功能模块根据图片相关的色情度得分与阈值的关系判断图片是否为色情图片。例如,色情图片扫描功能模块将图片本身的URL色情度得分、图片所在网页的URL 色情度得分、图片所在网页的文字色情度得分、图片说明文字色情度得分和图片所在网页的标题色情度得分求和得到色情度总得分,如果色情度总得分满足预设的阈值条件,则判断为色情图片,否则判断图片为非色情图片。或者,色情图片扫描功能模块将图片本身的URL色情度得分、图片所在网页的URL色情度得分、图片所在网页的文字色情度得分、图片说明文字色情度得分和图片所在网页的标题色情度得分求平均得到色情度平均得分,根据色情度平均得分与阈值的关系判断图片是否为色情图片。需要说明,上述实施例是以色情图片扫描功能模块根据图片本身的URL和图片所在网页的URL色情度得分,以及图片所在网页的文字、图片说明文字和图片所在网页的标题色情度得分为例进行描述的,事实上,色情图片扫描功能模块也可以仅以上述信息之一或任意组合的色情度得分识别色情图片另外,还可以在上述信息的色情度得分基础上结合图片本身的色情特征点得分来识别色情图片。例如,在步骤101中计算图片本身的色情特征点得分,在步骤102中根据图片相关URL信息色情度得分、图片相关文字信息色情度得分和图片本身的色情特征点得分与预设阈值的关系,本文档来自技高网...

【技术保护点】
一种色情图片的识别方法,其特征在于,包括:根据图片相关统一资源定位符URL信息确定图片相关URL信息色情度评价信息,和/或根据图片相关文字信息确定图片相关文字信息色情度评价信息;根据所述图片相关URL信息色情度评价信息和/或图片相关文字信息色情度评价信息与对应色情度评价阈值的关系,判断图片是否为色情图片。

【技术特征摘要】

【专利技术属性】
技术研发人员:王涛伟张立明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1