基于粒子群优化的视频数据挖掘高维聚类方法技术

技术编号:13741536 阅读:86 留言:0更新日期:2016-09-22 23:21
本发明专利技术公开一种基于粒子群算法视频数据挖掘高维聚类分析方法。该方法首先对视频数据集提取特征属性,把这些属性数值化,形成样本;之后对样本数据进行适当改造,使得样本点每一维属性都改成其对应维最大值的百分比。本发明专利技术通过适当改造样本,能够解决部分噪声数据的影响;通过基于粒子群的聚类分析算法,能够提高聚类分析算法的收敛速度,减弱初始聚类中心点选择的敏感性。

【技术实现步骤摘要】

本专利技术利用粒子群优化来进行视频数据挖掘高维聚类,缓解视频数据聚类分析的“维度灾难”,属于数据挖掘、多媒体处理和进化计算交叉领域应用

技术介绍
视频数据挖掘是通过综合分析试听特性和语义,在视频中发现隐含的、有效的、有价值的、可理解的模式,进而发现知识,得出事件的趋势和关联为用户提供问题求解层次的决策支持能力。聚类分析是研究数据间逻辑上或物理上的相互关系的技术,它通过一定的规则将数据集划分为在性质上相似的数据点构成的若干个类。聚类分析的结果不仅可以揭示数据间的内在联系与区别,同时也为进一步的数据分析与知识发现提供了重要的依据,如数据间的关联规则,分类模式以及数据的变化趋势等。粒子群优化算法(PSO)从随机解出发,通过迭代寻找最优解。在每一次迭代中,粒子通过跟踪两个“极值”来更新自己。第一个“极值”就是粒子本身所找到的最优解,这个解叫做个体极值。另一个“极值”是整个种群目前找到的最优解,这个极值是全局极值。本专利技术利用粒子群优化算法来构建一种多视频数据挖掘高维聚类方法方案。
技术实现思路
技术问题:噪声数据对多视频数据挖掘聚类结果具有不良影响,同时现有多视频数据挖掘聚类方法的实际正确率和效率有待优化提高,本专利技术方法主要解决上述问题,提出一种基于粒子群优化的多视频数据挖掘高维聚类方法。技术方案:本专利技术首先对原始视频数据进行预处理,通过对不同属性特征的抽取,根据聚类分析数据类型要求,形成样本表示;然后,对原始样本数据进行适当的改造;最后,根据粒子群优化算法,改善不同的分组,使得同组对象彼此相似,不同组对象彼此相异,形成样本簇,对视频进行分类。本专利技术所述的视频数据挖掘高维聚类分析方法包含以下步骤:步骤1)用户输入n个视频文件,分别从这些视频文件提取特征值,形成n个t维样本点,所有样本点组成初始样本。所述n是用户输入视频文件数目,所述t 是指单个视频抽取所有画面中像素点个数的3倍,所述特征值是指相像素点的三通道色彩强度值共有t个特征值,所述样本点是指用t个特征值作为作为坐标值的点。每个视频文件特征值提取具体步骤为:步骤1.1)按时间均匀的抽取视频的中的m帧画面;步骤1.2)按行访问每一帧画面的每个像素点,记录每个像素点的三个通道的色彩强度值,将这些强度值作为样本点坐标值。这些样本点为Pi=(ai1,ai2,ai3,…,ait),所述i=1...n步骤2)计算样本点每一维坐标的最大值(max1,max2,max3,…,maxt)。样本点P1,P2,P3,…,Pn每一个坐标值都除以其对应维的最大值得到如下新样本点: Z i 1 = ( a i 1 max 1 , a i 2 max 2 , a i 3 max 3 , ... , a i t max t ) = ( a i 1 ′ , a i 2 ′ , a i 3 ′ , ... , a i t ′ ) . ]]>步骤3)解析步骤2)得到的新样本点,确定聚类中心点,进行分类,具体步骤如下:步骤3.1)求出每个类中样本点个数的的期望值:N=n/k所述N是指样本点个数的期望值,所述n是指样本点个数,所述k聚类中心的个数。步骤3.2)计算聚类中心的粗略位置所述粗略位置是指距离聚类中心较近的位置,所述G表示未被分类的样本点集合,所述NG表示未分类样本点的个数,所述Zi是指样本点,i∈{1,2,3,…n本文档来自技高网...

【技术保护点】
一种基于粒子群优化的视频数据挖掘高维聚类方法,其特征在于该方法包含以下步骤:步骤1)用户输入n个视频文件,分别从这些视频文件提取特征值,形成n个t维样本点,所有样本点组成初始样本,所述n是用户输入视频文件数目,所述t是指单个视频抽取所有画面中像素点个数的3倍,所述特征值是指相像素点的三通道色彩强度值共有t个特征值,所述样本点是指用t个特征值作为作为坐标值的点;步骤2)计算样本点每一维坐标的最大值(max1,max2,max3,…,maxt),样本点P1,P2,P3,…,Pn每一个坐标值都除以其对应维的最大值得到如下新样本点:Zi1=(ai1max1,ai2max2,ai3max3,...,aitmaxt)=(ai1′,ai2′,ai3′,...,ait′);]]>步骤3)解析步骤2)得到的新样本点,确定聚类中心点,进行分类;步骤4)运用粒子群优化算法,进行M次迭代;步骤5)形成样本簇,根据样本簇对这些样本所在的视频进行分类。

【技术特征摘要】
1.一种基于粒子群优化的视频数据挖掘高维聚类方法,其特征在于该方法包含以下步骤:步骤1)用户输入n个视频文件,分别从这些视频文件提取特征值,形成n个t维样本点,所有样本点组成初始样本,所述n是用户输入视频文件数目,所述t是指单个视频抽取所有画面中像素点个数的3倍,所述特征值是指相像素点的三通道色彩强度值共有t个特征值,所述样本点是指用t个特征值作为作为坐标值的点;步骤2)计算样本点每一维坐标的最大值(max1,max2,max3,…,maxt),样本点P1,P2,P3,…,Pn每一个坐标值都除以其对应维的最大值得到如下新样本点: Z i 1 = ( a i 1 max 1 , a i 2 max 2 , a i 3 max 3 , ... , a i t max ...

【专利技术属性】
技术研发人员:陈志杨天明岳文静龚凯
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1