基于行为的隐写者检测方法技术

技术编号：19746373 阅读：14 留言：0更新日期：2018-12-12 04:56

本发明专利技术公开了一种基于行为的隐写者检测方法，包括：从社交平台选取一定数量的用户，每个用户爬取N张连续的图像，并将一部分用户的图像作为训练数据，其他作为测试数据；从训练数据中随机选取图像来模拟隐写者行为，生成隐写者数据；分别从训练数据与隐写者数据中提取行为特征，并利用所提取的特征来训练二分类器；利用测试数据对二分类器进行测试，并利用通过测试后的二分类器，对新输入图像进行检测，从而判定发送新输入图像的用户为正常用户或隐写者。基于该方法，可以准确检测出隐写者。

全部详细技术资料下载

【技术实现步骤摘要】
基于行为的隐写者检测方法
本专利技术涉及社交网络安全和隐写分析领域，尤其涉及一种基于行为的隐写者检测方法。
技术介绍
隐写分析的目的是检测图像是否被隐写术改动过。对于单张图像的隐写分析，通常看作是一个区分载体和载密的二分类问题，其中，设计能够反映消息嵌入对载体统计特性影响的有效特征是其关键问题之一。Fridrich等人提出的富模型隐写分析特征以及选择信道攻击模型使得单张图像的隐写分析性能得到很大的提升；近年来，随着深度学习的发展，CNN、RNN、Res-Net、GAN也逐渐被用于隐写分析。虽然隐写分析技术不断进步，但目前的研究都是基于实验室条件，即图像一般为自然图像，并且训练分类器时要求嵌入率及嵌入算法的匹配。但在现实中通常无法满足这种要求。首先对于图像的嵌入率和嵌入算法是未知的。此外，在真实的社交平台中，用户发送的图像内容及图像的噪声来源也是多样的，这就会使得这种有监督学习的方式面临各种失配的问题。即使隐写分析特征高达几万维，在真实的场景中也难以发挥其效用。针对这种情况，Ker提出隐写者检测的概念，以发送图像的用户为单位而不是以单张图像为单位进行检测。在隐写者检测中，一般使用非监督学习方法。Ker首先提出使用聚类的方法检测隐写者，在2014年又将异常检测中的局部异常因子(LocalOutlierFactor)用于隐写者检测。2016年Li等人提出层次聚类和集成聚类的方法。Zheng等人尝试使用深度神经网络提取隐写分析特征用于隐写者检测。虽然这些方法避免了有监督学习中的失配的问题，但其所采用的特征都是低维的传统的隐写分析特征，其本质依然是通过是否做过隐写修...

【技术保护点】
1.一种基于行为的隐写者检测方法，其特征在于，包括：从社交平台选取一定数量的用户，每个用户爬取N张连续的图像，并将一部分用户的图像作为训练数据，其他作为测试数据；选取部分用户的图像作为隐写者的数据库，并从中随机选取一定数量的图像来模拟隐写者行为，生成隐写者数据；分别从训练数据与隐写者数据中提取行为特征，并利用所提取的特征来训练二分类器；利用测试数据对二分类器进行测试，并利用通过测试后的二分类器，对新输入图像进行检测，从而判定发送新输入图像的用户为正常用户或隐写者。

【技术特征摘要】
1.一种基于行为的隐写者检测方法，其特征在于，包括：从社交平台选取一定数量的用户，每个用户爬取N张连续的图像，并将一部分用户的图像作为训练数据，其他作为测试数据；选取部分用户的图像作为隐写者的数据库，并从中随机选取一定数量的图像来模拟隐写者行为，生成隐写者数据；分别从训练数据与隐写者数据中提取行为特征，并利用所提取的特征来训练二分类器；利用测试数据对二分类器进行测试，并利用通过测试后的二分类器，对新输入图像进行检测，从而判定发送新输入图像的用户为正常用户或隐写者。2.根据权利要求1所述的一种基于行为的隐写者检测方法，其特征在于，爬取每个用户N张连续的图像后，使用matlab的resize函数，将每一图像裁剪为指定的尺寸大小。3.根据权利要求1所述的一种基于行为的隐写者检测方法，其特征在于，所述提取行为特征包括：训练数据是由一部分用户的图像组成，隐写者数据也是由隐写者的图像组成，特征提取的方式完全相同；对于每个用户或者隐写者，从相应的图像序列中提取能够反映图像间相关性的特征作为行为特征；提取方式如下：对于每个用户或者隐写者的图像序列，计算相邻两幅图像的灰度直方图之差，构成差值矩阵：di,i-1＝abs(hi-hi-1)；式中，hi、h...

【专利技术属性】
技术研发人员：张卫明，俞能海，李莉，姚远志，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人