一种基于多标记深度关联分析的物联网跨媒体大数据检索方法技术

技术编号：33471243 阅读：15 留言：0更新日期：2022-05-19 00:48

本发明专利技术公开了一种基于多标记深度关联分析的物联网跨媒体大数据检索方法，针对物联网大数据平台获取的各类跨媒体数据，利用深度模型提取图像和文本特征，并通过关联分析刻画特征之间的语义相关性，最终借助深度关联特征实现跨媒体内容检索。本方法首先通过深度模型提取物联网跨媒体大数据平台的图像文本数据特征，然后利用多标记信息构造语义相似性矩阵，最后基于已获得的特征和语义相似性矩阵计算文本和图像的关联分析，进而实现跨媒体检索。进而实现跨媒体检索。进而实现跨媒体检索。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多标记深度关联分析的物联网跨媒体大数据检索方法

[0001]本专利技术涉及物联网大数据检索领域，特别是一种基于多标记深度关联分析的物联网跨媒体大数据检索方法。

技术介绍

[0002]随着互联网、物联网、大数据等技术的快速发展，通过物联网获取的图像、文本、视频等多媒体大数据的不断涌现，对现有数据检索方法提出了新的挑战。一方面，多媒体数据为人类理解认识世界提供了丰富的素材，另一方面，多媒体数据的异构性对多媒体数据的处理提出的挑战。目前，对于物联网多媒体数据处理，主要存在两种方法。一种对多媒体数据提取特征，然后将所有特征映射至低维子空间，从而实现多媒体数据的统一表示。这种方法将特征提取和特征学习两个步骤分开处理，实现过程中会损失一些重要的信息。第二种方法是采用深度学习模型直接对多媒体数据进行特征学习，这种端到端的学习方法由于实现了特征自动提取及学习，在实际应用中表现出了优越的性能。一方面通过大量标记数据可以学习更为紧凑的表示特征。另一方面，多媒体数据具有丰富的标记信息，现有方法大多采用单一标记信息。
[0003]针对于上述这种情况，多标记语义信息在物联网跨媒体大数据检索中得到越来越多的重视。对跨媒体大数据而言，多标记信息能更好的描述多媒体的语义特征，从而在检索中得到更好的消息。

技术实现思路

[0004]针对现有技术中存在的问题，本专利技术提供了一种以现有深度模型的高层特征为基础，结合多标记信息进行深度关联学习获取图像、文本的低维表示，提升多标记跨媒体检索性能的基于多标记深度关联分析的物联网...

【技术保护点】

【技术特征摘要】
1.一种基于多标记深度关联分析的物联网跨媒体大数据检索方法，其特征在于，包括以下步骤：1)对物联网获取的图像大数据使用VGG深度神经网络提取特征；对文本大数据，使用词袋模型编码，进而利用全连接神经网络进行特征学习；2)利用多标签信息构建语义相似性矩阵；3)利用图像、文本特征和语义相似性矩阵，建立深度关联学习模型；4)利用深度关联学习模型输出图像文本特征向量，计算向量之间的余弦距离，实现跨媒体检索。2.根据权利要求1所述的基于多标记深度关联分析的物联网跨媒体大数据检索方法，其特征在于，所述步骤1)中图像文本特征提取方法具体为：对物联网跨媒体大数据内容中的图像数据，选用VGG网络提取图像特征，然后利用2层的神经网络进行特征学习；对文本数据，先采用词袋模型进行编码，然后输入2层的全连接神经网络进行特征学习。3.根据权利要求1或2所述的基于多标记深度关联分析的物联网跨媒体大数据检索方法，其特征在于，所述步骤2中语义相似性矩阵构造公式为：其中S
ij
表示第i,j个样本之间的相似程度,z
i
,z
j
为第i,j个样本的多标签向量，||z
i
‑
z
j
||表示向量的2范数，σ为权重。4.根据权利要求3所述的基于多标记深度关联分析的物联网跨媒体大数据检索方法，其特征在于，所述步骤3)中采用深度关联分析的具体步骤为：3
‑
1)利用图像网络和文本网络提取的特征建立如下深度关联分析模型：其中其中其中分别是加权互协方差矩阵和加权方差矩...

【专利技术属性】
技术研发人员：李庆铁，熊迎军，李靖，任守纲，舒欣，戴寅峰，
申请(专利权)人：上海蓝长自动化科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人