【技术实现步骤摘要】
一种多源异构数据一致性计算可视化方法
[0001]本专利技术涉及多源异构数据一致性计算
,具体为一种多源异构数据一致性计算可视化方法。
技术介绍
[0002]近年来,随着大量的智能装置和智能设备应用于人们科研和生活中的方方面面,由这些装置和设备产生的多源异构数据日益混乱复杂。
[0003]在分析结果的呈现上,绝大部分分析均以数据或结论形式表现,缺乏图形化显示和直观对比,缺乏探索式交互的视图,导致人们对分析结果不能进行快速有效地解读。同时传统的多源异构数据处理方法不能有效的提取出不同渠道数据之间的差异性,传统的强行拼接多源数据的方法忽略了多源异构数据之间语义互补性,该性质对模型的训练与学习有着极大的作用。
[0004]由于多源异构数据存在严重的“内容鸿沟”和“语义鸿沟”,直接使用传统的一致性多源异构数据分析法不能有效的提取出不同渠道数据之间的相识关系,强行拼接跨模态数据特征的方式会忽略掉模态数据之间的语义互补性,该性质对模型的训练有着极大的作用。而单使用DCCA模型对数据进行子空间特征映射也无法有效的去除 ...
【技术保护点】
【技术特征摘要】
1.一种多源异构数据一致性计算可视化方法,其特征在于,包括以下步骤:步骤1,生成器模型数据生成模型G专注于使用噪音z生成伪造数据G(z),并通过判别器D的反馈不断优化生成数据,最终达到生成数据与真实数据处于同一分布为止;步骤2,判别器模型判别器D需要同时学习伪造数据G(z)和真实数据x,并尽可能的去区分x与G(z),让所处同一分布的数据具有区分性,同样判别器D也需要针对伪造的数据G(z)不断学习,直到在同一分布中区分不了G(z)与x,所以判别器D的输出是一个真实数据与伪造数据判断的概率,模型的最终训练结果无法区分P(z)与P(x);步骤3,对抗生成网络模型对处理后的特征数据进行子空间映射,在对子空间中的特征进行语义分类,采用对抗学习的方式剔除跨模态数据带来的模态信息,保留特征点所表达的语义信息;指定通过数据预处理的文本特征矩阵为T={t1,t2,
…
,t
n
}和图片特征矩阵V={v1,v2,
…
,v
n
},而每组数据对应的标签向量为L
i
={l
i1
,l
i2
,
…
,l
in
};在对抗网络模型对特征数据进行子空间映射的过程中,首先将具有同样语义的图文数据对z
i
={v
i
,t
i
}和该图文数据对对应的标签语义传入网络中,通过二值来区分图文数据对z
i
所具有的语义类别,数据生成模型G将传入网络中的数据映射到公共子空间S中,图文映射函数分别使用S
V
=f
V
(V;θ
v
)和S
T
=f
T
(T;θ
t
)表示,最后通过判别器D不断对数据生成模型G生成的S子空间中的特征数据进行辨别,直到分辨不出子空间内部的特征数据原始的模态类型为止;通过不断的迭代以上过程,对抗网络模型网络最终可以生成一个单具有语义特征的子空间数据集;步骤4,Loss普通的生成对抗子空间映射模型可以将图文的语义特征均匀的分布在子空间S中,能够突显出不同模态数据内的语义信息,降低不同模态所具有的源数据特征信息,但判别器D在学习的过程中并没有将提取不同模态相同的语义信息和区分相同模态内不同的语义信息作为主要目的,所以针对对抗网络模型中的上述问题,DCCA
‑
ACMR采用了三元组约束和CCA约束两种方式来对模型中的子空间映射模块进行规范,下面是约束构建的过程:对抗生成网络模型的生成器约束条件由四部分构成,分别是判别语义损失的L
imd
函数和保持结构损失的L
imi
函数、L
dcca
函数,最后防止对抗网络模型在训练的过程中过拟合,加入了正则函数L
reg
对模型进行约束,最后的LF(loss function)公式如下:L
emb
(θ
V
,θ
T
,θ
imd
)=α
·
(L<...
【专利技术属性】
技术研发人员:张红英,王娇,邓佳康,王赋攀,张晓蓉,
申请(专利权)人:西南科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。