图片内容审核方法和装置制造方法及图纸

技术编号:8271400 阅读:176 留言:0更新日期:2013-01-31 03:37
本发明专利技术实施例公开了一种图片内容审核方法和装置,通过应用本发明专利技术实施例的技术方案,可以根据待审核图片的反向链接确定相应的锚文本,并根据锚文本的内容确定该待审核图片是否通过审核,这样的审核标准利用了图片与锚文本之间内容的关联性,从而,实现了图片审核的自动化操作,降低了图片审核流程中的人力成本投入,提高了图片审核的处理效率。

【技术实现步骤摘要】
本专利技术涉及通信
,特别涉及一种图片内容审核方法和装置
技术介绍
随着HTML(Hyper Text Mark-up Language,超文本标记语言)技术的日益完善,网页不再仅仅是以文字和超链接的形式展现。现有的网页中,包含了许多的多媒体的元素(声音,文字,图片,动画,视频等)。使得用户在浏览网页的同时能得到高强互动的用户体验。其中,图片对于用户来说是接触面最广,最频繁的。网络中的图片都是通过引用图片的URL (Uniform Resoure Locator,统一资源定位符)地址(即上传图片到网页),来实现用户对图片的浏览的。但是,由于图片的抽象化,主观化,使得无法通过仅对图片本身的数据计算就得到图片本身的属性。由于法律法规的限制,存在许多非法的,敏感的图片被浏览器所引用。只有通过对上传图片审核,过滤或修改一些非法的、黄色的、与政治相关的图片,才能保持网页的正常运行。但是,现有技术的图片的审核流程都是基于人力进行的。即在图片上传至网页后,并不能立即被网页所引用,在此过程中需要通过一个审核系统,通过工作人员对图片进行浏览,判断并过滤敏感、非法的图片。在实现本专利技术实施例的过程中本文档来自技高网...
图片内容审核方法和装置

【技术保护点】
一种图片内容审核方法,其特征在于,包括:图片审核服务器根据待审核图片的反向链接确定相应的锚文本;所述图片审核服务器根据所述锚文本中所包含的敏感词的情况,确定所述待审核图片是否通过审核。

【技术特征摘要】
1.一种图片内容审核方法,其特征在于,包括 图片审核服务器根据待审核图片的反向链接确定相应的锚文本; 所述图片审核服务器根据所述锚文本中所包含的敏感词的情况,确定所述待审核图片是否通过审核。2.如权利要求I所述的方法,其特征在于,所述图片审核服务器根据待审核图片的反向链接确定相应的锚文本之前,还包括 所述图片审核服务器分别将待审核图片所对应的链接信息和/或内容信息与通过审核数据库和未通过审核数据库中的数据信息进行匹配; 如果所述待审核图片所对应的链接信息和/或内容信息与所述通过审核数据库中的数据信息匹配成功,则所述图片审核服务器确定所述待审核图片通过审核; 如果所述待审核图片所对应的链接信息和/或内容信息与所述未通过审核数据库中的数据信息匹配成功,则所述图片审核服务器确定所述待审核图片未通过审核; 如果所述待审核图片所对应的链接信息和/或内容信息与所述通过审核数据库和所述未通过审核数据库中的数据信息都没有匹配成功,则所述图片审核服务器触发根据所述待审核图片的反向链接确定相应的锚文本的操作。3.如权利要求2所述的方法,其特征在于, 所述待审核图片所对应的链接信息,具体为所述待审核图片所对应的URL信息;所述待审核图片所对应的内容信息,具体为将所述待审核图片通过MD5算法计算后得到的信息。4.如权利要求I所述的方法,其特征在于,所述图片审核服务器根据所述锚文本中所包含的敏感词的情况,确定所述待审核图片是否通过审核,具体包括 所述图片审核服务器分别将所述待审核图片所对应的各锚文本中的内容与预设的敏感词库进行匹配,得到相应的敏感词评分; 所述图片审核服务器根据所述待审核图片所对应的全部锚文本中的敏感词评分,确定所述待审核图片的敏感度评分; 所述图片审核服务器判断所述敏感度评分是否达到预设的门限值,如果达到,所述图片审核服务器确定所述待审核图片没有通过审核,如果没有达到,所述图片审核服务器确定所述待审核图片通过审核。5.如权利要求4所述的方法,其特征在于,所述图片审核服务器分别将所述待审核图片所对应的各锚文本中的内容与预设的敏感词库进行匹配,得到相应的敏感词评分,具体包括 所述图片审核服务器分别将各锚文本中所包含的词语分别与所述预设的敏感词库中所包含的词语进行匹配,所述敏感词库中所包含的词语分别对应不同的敏感分值; 当所述图片审核服务器确定一个词语与所述预设的敏感词库中所包含的词语匹配成功时,所述图片审核服务器将匹配成功的词语所对应的敏感分值记录到所述待审核图片所对应的分值记录中,当所述图片审核服务器确定一个词语与所述预设的敏感词库中所包含的所有词语均没有匹配成功时,所述图片审核服务器将预设的缺省分值记录到所述待审核图片所对应的分值记录中。6.如权利要求4所述的方法,其特征在于,所述图片审核服务器根据所述待审核图片所对应的全部锚文本中的敏感词评分,确定所述待审核图片的敏感度评分,具体包括当所述图片审核服务器确定所述待审核图片所对应的全部锚文本中所包含的所有词语都与所述预设的敏感词库中所包含的词语完成匹配时,所述图片审核服务器根据当前所述待审核图片所对应的全部分值记录和各分值所对应的权值,确定所述待审核图片所对应的全部分值记录的加权平均数,并将所述加权平均数的结果确定为所述待审核图片的敏感度评分;或, 当所述图片审核服务器确定所述待审核图片所对应的全部锚文本中所包含的所有词语都与所述预设的敏感词库中所包含的词语完成匹配时,所述图片审核服务器确定所述待审核图片所对应的全部分值记录的算术平均值,并将所述算术平均值的结果确定为所述待审核图片的敏感度评分。7.如权利要求I所述的方法,其特征...

【专利技术属性】
技术研发人员:刘致远
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1