【技术实现步骤摘要】
一种基于多标记深度关联分析的物联网跨媒体大数据检索方法
[0001]本专利技术涉及物联网大数据检索领域,特别是一种基于多标记深度关联分析的物联网跨媒体大数据检索方法。
技术介绍
[0002]随着互联网、物联网、大数据等技术的快速发展,通过物联网获取的图像、文本、视频等多媒体大数据的不断涌现,对现有数据检索方法提出了新的挑战。一方面,多媒体数据为人类理解认识世界提供了丰富的素材,另一方面,多媒体数据的异构性对多媒体数据的处理提出的挑战。目前,对于物联网多媒体数据处理,主要存在两种方法。一种对多媒体数据提取特征,然后将所有特征映射至低维子空间,从而实现多媒体数据的统一表示。这种方法将特征提取和特征学习两个步骤分开处理,实现过程中会损失一些重要的信息。第二种方法是采用深度学习模型直接对多媒体数据进行特征学习,这种端到端的学习方法由于实现了特征自动提取及学习,在实际应用中表现出了优越的性能。一方面通过大量标记数据可以学习更为紧凑的表示特征。另一方面,多媒体数据具有丰富的标记信息,现有方法大多采用单一标记信息。
[0003]针 ...
【技术保护点】
【技术特征摘要】
1.一种基于多标记深度关联分析的物联网跨媒体大数据检索方法,其特征在于,包括以下步骤:1)对物联网获取的图像大数据使用VGG深度神经网络提取特征;对文本大数据,使用词袋模型编码,进而利用全连接神经网络进行特征学习;2)利用多标签信息构建语义相似性矩阵;3)利用图像、文本特征和语义相似性矩阵,建立深度关联学习模型;4)利用深度关联学习模型输出图像文本特征向量,计算向量之间的余弦距离,实现跨媒体检索。2.根据权利要求1所述的基于多标记深度关联分析的物联网跨媒体大数据检索方法,其特征在于,所述步骤1)中图像文本特征提取方法具体为:对物联网跨媒体大数据内容中的图像数据,选用VGG网络提取图像特征,然后利用2层的神经网络进行特征学习;对文本数据,先采用词袋模型进行编码,然后输入2层的全连接神经网络进行特征学习。3.根据权利要求1或2所述的基于多标记深度关联分析的物联网跨媒体大数据检索方法,其特征在于,所述步骤2中语义相似性矩阵构造公式为:其中S
ij
表示第i,j个样本之间的相似程度,z
i
,z
j
为第i,j个样本的多标签向量,||z
i
‑
z
j
||表示向量的2范数,σ为权重。4.根据权利要求3所述的基于多标记深度关联分析的物联网跨媒体大数据检索方法,其特征在于,所述步骤3)中采用深度关联分析的具体步骤为:3
‑
1)利用图像网络和文本网络提取的特征建立如下深度关联分析模型:其中其中其中分别是加权互协方差矩阵和加权方差矩...
【专利技术属性】
技术研发人员:李庆铁,熊迎军,李靖,任守纲,舒欣,戴寅峰,
申请(专利权)人:上海蓝长自动化科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。