【技术实现步骤摘要】
一种基于张量表示的多视图离群点检测算法
本专利技术属于机器学习领域,具体涉及一种基于张量表示的多视图离群点检测方法,用于解决多视图场景下的离群点检测问题。
技术介绍
离群点检测,也被称为异常检测,是一种用于识别数据集中异常样本的数据分析技术。最近的几年里,已发展了大量离群点检测方法。然而,这些离群点检测算法都是针对单视图数据而设计,并不适用于多视图离群点检测场景。现实中,许多数据通常来自不同的域或不同的特征提取器,相应的每组特征能被视为一个特定视图,由此形成了多视图数据。由于特征提取常受噪声干扰,使得多视图数据中常易出现异常点,进而影响后续任务,因此研究者开始关注如何从多视图数据中检测出离群点。张量在表示多视图数据时能够充分捕获数据的多个视图之间可能的关系,同时也能避免视图间的成对比较。据我们所知,基于张量表示的多视图离群点检测方法至今还没有被研究过。现有方法大多采用跨视图成对约束来获得新的特征表示,并根据这些特征来定义离群点评分度量,这没有充分利用视图间的交互信息,并且导致在面对三个或多个视图时较高的复杂度 ...
【技术保护点】
1.一种基于张量表示的多视图离群点检测方法,其特征在于该方法包括以下步骤:/nS1:将原始多视图样本重塑成张量表示形式,从而形成多视图张量集,并将每个张量展开成向量,得到转化后的样本矩阵。/nS2:构造样本矩阵的低秩表示学习目标函数,并计算使目标函数值最小的最佳的表示系数和误差矩阵。/nS3:根据步骤S2得到的表示系数和误差矩阵,计算所有样本的离群分数,并输出所有样本的离群标签。/n
【技术特征摘要】
1.一种基于张量表示的多视图离群点检测方法,其特征在于该方法包括以下步骤:
S1:将原始多视图样本重塑成张量表示形式,从而形成多视图张量集,并将每个张量展开成向量,得到转化后的样本矩阵。
S2:构造样本矩阵的低秩表示学习目标函数,并计算使目标函数值最小的最佳的表示系数和误差矩阵。
S3:根据步骤S2得到的表示系数和误差矩阵,计算所有样本的离群分数,并输出所有样本的离群标签。
2.根据权利要求1所述一种基于张量表示的多视图离群点检测方法,所述的步骤S1具体为:
S101:预先定义M个视图数据的集合D={X1,X2,...,XM}表示,其中表示第v个视图中的N个样本,其中特征维度为dv。按归一化每个
S102:对每个多视图样本按照构造相应的多视图张量,从而得到多视图张量集其中Xi表示第i个实例的多视图张量。
S103:把每个多视图张量x展开成向量形式这样,多视图张量集I就转化成样本矩阵
3.根据权利要求1所述的一种基于张量表示的多视图离群点检测方法,所述的步骤S2具体为...
【专利技术属性】
技术研发人员:陈松灿,钟颖宇,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。