基于最邻近标签传播算法的图像型垃圾邮件检测方法技术

技术编号:8801371 阅读:324 留言:0更新日期:2013-06-13 05:59
为了提高图像型垃圾邮件检测的精度和召回率,节省检测图像型垃圾邮件的时间,导致需要一个高效率的检测图像型垃圾邮件的方法。本发明专利技术的目的是提供一种利用基于最邻近的标签传播算法检测图像型垃圾邮件的方法。通过提取图片的加速鲁棒性特征描述符,确保了图片的旋转和尺度不变性;通过获取图片聚类中心点信息,再按照该信息均值聚类图片加速鲁棒性特征描述符,确保了所有图片聚类后的信息具有可比性;通过利用基于最邻近的标签传播,选择与每个图像相似度最接近的K(K=已知类别的图像数+测试的图像数/10,表示表示选取与图像相似度最相近的图像幅数)个图像的标签进行传播,提高了标签的传播速率,节省了检测图像型垃圾邮件的时间。

【技术实现步骤摘要】

本专利技术是利用基于最邻近标签传播算法检测图像型垃圾邮件。主要思想是:首先获取图片聚类中心点信息;然后提取所有图片的加速鲁棒性特征描述符信息,进行均值聚类;最后采用基于最邻近的标签传播算法检测图像型垃圾邮件。主要解决了当今的技术对图像型垃圾邮件的检测效率和召回率低等问题,属于数据挖掘和机器学习领域。
技术介绍
电子邮件是人们进行网络交流沟通的重要途径,因此随着电子邮件的流行,产生了垃圾邮件,并呈现了快速增长的趋势。虽然带来了巨大的商业、经济及政治利益,但是企业界和个人家庭的用户都花费了数百万美元来对抗垃圾邮件。由于垃圾邮件的增加,ISPs(互联网服务提供商)不得不花费更多的时间和精力处理日益增长的网络流量。因此,如果垃圾邮件继续增长,那么在不久的将来,ISPs可能会难以管理网络流量。Hrishikesh B.Aradhye等在2005年提出了一种采用基于对象与基于边缘的文本定位方法来挖掘图像中的文本以及颜色特征的思想来对Image Spam (图像型垃圾邮件)进行分类。Giorgio Fumerai等在2006年提出了一种OCR (光学字符识别)技术检测图像型垃圾邮件的文本信息。该本文档来自技高网...

【技术保护点】
一种利用基于最邻近标签传播算法检测图像型垃圾邮件的方法,其特征在于该方法包含的步骤为:步骤1)训练已知类别数据集,获取聚类中心点信息,其中类别分为正常图片和垃圾图片:步骤1.1)输入已知类别数据集中的正常图片和垃圾图片;步骤1.2)提取每幅图片的加速鲁棒性特征描述符信息:步骤1.2.1)获取输入的图片;步骤1.2.2)获取输入图片的积分图片;步骤1.2.3)获取积分图片的像素点;步骤1.2.4)输入图片的第一个像素点;步骤1.2.5)判断图片该像素点是否存在,如果存在,转步骤1.2.6),否则,转步骤1.2.14);步骤1.2.6)计算该像素点的海森矩阵及行列式值;步骤1.2.7)判断该点是否...

【技术特征摘要】
1.一种利用基于最邻近标签传播算法检测图像型垃圾邮件的方法,其特征在于该方法包含的步骤为: 步骤I)训练已知类别数据集,获取聚类中心点信息,其中类别分为正常图片和垃圾图片: 步骤1.1)输入已知类别数据集中的正常图片和垃圾图片; 步骤1.2)提取每幅图片的加速鲁棒性特征描述符信息: 步骤1.2.1)获取输入的图片; 步骤1.2.2)获取输入图片的积分图片; 步骤1.2.3)获取积分图片的像素点; 步骤1.2.4)输入图片的第一个像素点; 步骤1.2.5)判断图片该像素点是否存在,如果存在,转步骤1.2.6),否则,转步骤1.2.14); 步骤1.2.6)计算该像素点的海森矩阵及行列式值; 步骤1.2.7)判断该点是否是极值点,如果是,转步骤1.2.8),否则,转步骤1.2.13); 步骤1.2.8)确认该极值点为加速鲁棒性特征点; 步骤1.2.9)获取该特征点在原始图片中的位置、尺度信息; 步骤1.2.10)获取该特征点在原始图片中的主方向; 步骤1.2.11)根据该特征点的位置、尺度、主方向信息,计算该特征点的加速鲁棒性特征描述符;其中,加速鲁棒性特征描述符采用64维描述向量存储; 步骤1.2.12)输入图片下一个像素点,转步骤1.2.5); 步骤1.2.13)系统自动舍弃该点,转步骤1.2.12); 步骤1.2.14)输出图片的所有加速鲁棒性特征点描述符信息; 步骤1.3)随机初始化聚类中心点,根据均值聚类算法,同时聚类已知类别数据集中所有图片的加速鲁棒性特征描述符: 步骤1.3.1)获取需要聚类的所有加速鲁棒性特征点描述符信息; 步骤1.3.2)获取聚类中心点的个数; 步骤1.3.3)输入第一个加速鲁棒性特征点信息; 步骤1.3.4)判断该加速鲁棒性特征点是否存在,如果存在,转步骤1.3.5),否则,转步骤...

【专利技术属性】
技术研发人员:张卫丰钱小燕周国强张迎周王子元周国富许碧欢陆柳敏
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1