一种多视图构建方法技术

技术编号:17812904 阅读:190 留言:0更新日期:2018-04-28 05:35
本发明专利技术公开了一种多视图构建方法,涉及数据挖掘技术领域。运用特征选择算法对原始特征集进行特征选择,生成特征子集。其中,视图数量为V,特征选择算法的数量及特征子集的数量均与视图数量相同;将特征子集中重复出现两次或两次以上的特征筛选出来,构成一个公共特征集,并将每个特征子集中存在于公共特征集中的特征删除,生成新的特征子集,将该特征子集视为初始的V个视图;根据多视图互补性和一致性的性质,对多视图进行评价,运用希尔伯特‑施密特独立性度量方法量化视图间的依赖关系,同时运用协同正则化方法测量各视图间有差异的信息。

【技术实现步骤摘要】
一种多视图构建方法
本专利技术涉及数据挖掘

技术介绍
随着信息技术的飞速发展,各个领域每天都会产生海量数据,这些数据不仅具有容量大增长速度快的特点,其数据类型和数据结构也变得越来越多样化,因此多视图数据的知识挖掘应运而生。多视图数据是从多个视角描述数据,每个视图存在独有的性质,又存在潜在联系,这也就决定了多视图互补性和一致性的特点。充分利用多视图的互补信息和视图间的一致性可以更好地挖掘数据中的潜在结构和知识。然而,不是所有领域都能得到数据的多个视图,在一些情况下我们只能获得单视图数据,并且该单视图具有很高维度,运用传统的数据挖掘技术很难取得较好的挖掘效果。现存在一些数据降维方法,可以通过特征变换的方式将原始数据特征转换到一个低维的空间,或者通过特征选择的方式,摒弃冗余的不相关的特征。但是特征变换的降维方式得到的特征集可理解性下降,无法直观地表达特征的含义,而特征选择的降维方式,选用单一的特征选择方法进行降维极有可能丢弃判别能力较强的特征。因此亟需一种学习方法,结合降维和多视图的优势,将高维特征进行分割,从而构建多个视图。通过对现有的专利及相关技术的检索发现,现有的多视图构建本文档来自技高网...
一种多视图构建方法

【技术保护点】
一种多视图构建方法,包括以下几个步骤:步骤一、运用特征选择算法对原始特征集F={f1,f2,…,fN}进行特征选择,生成特征子集Subset={Sub1,Sub2,…,SubV},其中,视图数量为V,特征选择算法的数量及特征子集的数量均与视图数量相同;步骤二、将特征子集Subset中重复出现两次或两次以上的特征筛选出来,构成一个公共特征集F′={f1′,f2′,…,fm′},并将每个特征子集中存在于公共特征集F′中的特征删除,生成新的特征子集Subset′={Sub′1,Sub′2,…,Sub′V},将该特征子集Subset′视为初始的V个视图;步骤三、根据多视图互补性和一致性的性质,对多视图...

【技术特征摘要】
1.一种多视图构建方法,包括以下几个步骤:步骤一、运用特征选择算法对原始特征集F={f1,f2,…,fN}进行特征选择,生成特征子集Subset={Sub1,Sub2,…,SubV},其中,视图数量为V,特征选择算法的数量及特征子集的数量均与视图数量相同;步骤二、将特征子集Subset中重复出现两次或两次以上的特征筛选出来,构成一个公共特征集F′={f1′,f2′,…,fm′},并将每个特征子集中存在于公共特征集F′中的特征删除,生成新的特征子集Subset′={Sub′1,Sub′2,…,Sub′V},将该特征子集Subset′视为初始的V个视图;步骤三、根据多视图互补性和一致性的性质,对多视图进行评价,运用希尔伯特-施密特独立性度量方法量化视图间的依赖关系,同时运用协同正则化方法测量各视图间有差异的信息,其计算步骤如下:a、视V(v)和V(w)为第v个视图和第w个视图的符号表示,假设V(v)和V(w)均为可分度量空间,那么选取核函数k(v),将V(v)映射到O中,表示为φ:V(v)→O;选取核函数k(w),将V(w)映射到G中,表示为V(w)→G;其中,核函数k(v)(xi,xj)=<φ(xi),φ(xj)>,核函数xi和xj分别表示视图的第i个和第j个样本,O和G分别表示V(v)和V(w)的再生核希尔伯特空间;b、量化视图V(v)与V(w)之间的依赖关系,用符号D(V(v),V(w))来表示,其计算公式如下:D(V(v),V(w))=(n-1)-2tr(K(v)HK(w)H)其中,tr(.)为矩阵的迹,I为n×n的单位矩阵,n为数据样本个数,e为元素值均为1的列向量,上标T为向量的转置,K(v)、K(w)分别为核函数k(v)、核函数k(w)的Gram矩阵,即c、根据谱聚类算法的思想,计算每个视图的原始数据在嵌入空间上的表示,其计算公式如下:其中,R为实数,L(v)为...

【专利技术属性】
技术研发人员:杨燕常晓静胡节
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1