【技术实现步骤摘要】
本专利技术属于计算机视觉
,更具体地,涉及。
技术介绍
微博是一种通过关注机制分享简短实时信息的广播式的社交网络平台,在这个信息时代里,无论是微博用户数量还是微博图片数量都增长到十分惊人的程度。然而,微博图片良莠不齐,对于印有敏感信息的微博图片,由于缺乏有效的检测技术,只能通过人力来进行肉眼判别筛选,这对于呈指数级增长的微博图片来说是不现实的。随着近年计算机视觉技术的飞速发展,利用计算机提取或挖掘出图像中包含信息的应用功能也越来越强大,在各个领域得到了广泛的使用。在计算机视觉领域中,文本检测是应用前景很广的一块,传统的文本检测方法,是基于检测式的思路,需要大量的训练集,对噪声抗性不佳,而且容易漏检错检,并且可扩展性较差,在转化成应用方面遇到了很大的困难,无法适用于微博图片敏感信息检测。
技术实现思路
针对现有技术的不足,本专利技术的目的在于提出,其能利用计算机自动匹配和识别出微博图片中的敏感文字信息,且可扩展性强,能抵抗噪声等干扰,并且检测准确率闻。为实现上述目的,本专利技术提供了,包括以下步骤( I)建立敏感词库、字体库和颜色库;(2)接收N张待检测微博图片;(3)创建一个空的敏感信息列表,用于存储所有微博图片所含敏感信息的检测结果;(4)设置微博图片计数器i = 1,即从第一张微博图片开始敏感信息检测。(5)判断条件i ( N是否满足,如果满足,则继续进行步骤(6),当不满足时跳到步骤(12);(6)以第i张微博图片大小为准,并根据敏感词库、字体库和颜色库生成对应于该微博图片的敏感信息图片库,敏感信息图片库包括M个敏感信息图片;(7)设置敏感信息图 ...
【技术保护点】
一种微博图片敏感信息检测方法,其特征在于,包括以下步骤:(1)建立敏感词库、字体库和颜色库;(2)接收N张待检测微博图片;(3)创建一个空的敏感信息列表,用于存储所有微博图片所含敏感信息的检测结果;(4)设置微博图片计数器i=1,即从第一张微博图片开始敏感信息检测。(5)判断条件i≤N是否满足,如果满足,则继续进行步骤(6),当不满足时跳到步骤(12);(6)以第i张微博图片大小为准,并根据敏感词库、字体库和颜色库生成对应于该微博图片的敏感信息图片库,敏感信息图片库包括M个敏感信息图片;(7)设置敏感信息图片计数器j为1;(8)判断条件j≤M是否满足,如果满足,则继续进行步骤(9),当不满足时跳到步骤(11);(9)从第i张微博图片的所有可能位置上提取出与第j个敏感信息图片等大小的多个图像块,遍历计算每个图像块与第j个敏感信息图片的匹配度,并根据计算得到的所有匹配度中的最大值确定与第j个敏感信息图片最相近的图像块匹配度,根据匹配度判定是否存在敏感信息,若存在则将相关匹配信息存入敏感信息列表中;(10)设置计数器j=j+1,返回步骤(8);(11)设置计数器i=i+1,返回步骤(5);( ...
【技术特征摘要】
1.一种微博图片敏感信息检测方法,其特征在于,包括以下步骤 (1)建立敏感词库、字体库和颜色库; (2)接收N张待检测微博图片; (3)创建一个空的敏感信息列表,用于存储所有微博图片所含敏感信息的检测结果; (4)设置微博图片计数器i= 1,即从第一张微博图片开始敏感信息检测。(5)判断条件i< N是否满足,如果满足,则继续进行步骤(6),当不满足时跳到步骤(12); (6)以第i张微博图片大小为准,并根据敏感词库、字体库和颜色库生成对应于该微博图片的敏感信息图片库,敏感信息图片库包括M个敏感信息图片; (7)设置敏感信息图片计数器j为I; (8)判断条件j( M是否满足,如果满足,则继续进行步骤(9),当不满足时跳到步骤(11); (9)从第i张微博图片的所有可能位置上提取出与第j个敏感信息图片等大小的多个图像块,遍历计算每个图像块与第j个敏感信息图片的匹配度,并根据计算得到的所有匹配度中的最大值确定与第j个敏感信息图片最相近的图像块匹配度,根据匹配度判定是否存在敏感信息,若存在则将相关匹配信息存入敏感信息列表中; (10)设置计数器j= j+1,返回步骤(8); (11)设置计数器i= i+1,返回步骤(5); (12)输出敏感信息列表。2.根据权利要求1所述的微博图片敏感信息检测方法,其特征在于,步骤(I)具体为根据用户的实际要求,建立敏感词库、字体库和颜色库,其中,敏感词库、字体库和颜色库由用户指定,均衡考虑检测的速度和准确率,字体库包括宋体、楷体、仿宋、黑体,颜色库包括白底黑、红、黄、绿、蓝字,黑底白、红、黄、绿、蓝字、红底黑、白字,黄底黑、白字,绿底黑、白字,蓝底黑、白字。3.根据权利要求1所述的微博图片敏感信息检测方法,其特征在于,步骤(6)具体为第i张微博图片的高为Hi个像素点,宽为Wi个像素点,对于敏感词库中的每一个敏感词、字体库中的每一种字体和颜色库中的每一种颜色这三者产生的所有组合而言...
【专利技术属性】
技术研发人员:白翔,姚聪,陈瑞军,申辰,刘文予,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。