数据处理方法、装置、服务器及存储介质制造方法及图纸

技术编号：26890858 阅读：26 留言：0更新日期：2020-12-29 16:07

本发明专利技术实施例公开了一种数据处理方法、装置、服务器及存储介质，其中方法包括：获取样本多媒体数据集，样本多媒体数据集包括至少两个样本多媒体数据；获取样本多媒体数据集中每个样本多媒体数据的特征信息，其中，特征信息包括数据内容信息或向量分布特征信息；对任意两个样本多媒体数据的特征信息进行关联性分析，并根据关联性分析结果确定样本多媒体数据集中任意两个样本多媒体数据之间的数据关联关系；根据数据关联关系构建目标模型，目标模型用于对输入的目标多媒体数据进行处理并生成目标哈希码，目标哈希码用于获取与目标多媒体数据相关的多媒体数据。可构建新的目标模型，采用该新的目标模型可提升进行数据搜索时的速度和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、服务器及存储介质
本申请涉及计算机
，尤其涉及一种数据处理方法、装置、服务器及存储介质。
技术介绍
随着当前互联网技术的深入发展，当前，为了实现基于用户的搜索信息(或查询信息)，向用户输出满足搜索条件的多媒体数据，通常采用训练完成的模型对用户的信息搜索(或数据搜索)过程进行支撑，其中，当前用于支撑信息搜索的模型都是调用模型对多媒体数据进行数据分析，从而根据模型对多媒体数据的分析结果确定每个多媒体数据是否满足搜索条件，并输出满足搜索条件的多媒体数据。但是，随着多媒体数据数量的快速增长，使得对多媒体数据的数据分析压力越来越大，从而造成信息搜索的响应速度的下降和精准度的降低，由此可见，如何构建新的模型，并使得该新的模型进行信息搜索时具备较高的精准度和搜索速度成为了当前的研究热点。
技术实现思路
本专利技术实施例提供了一种数据处理方法、装置、服务器及存储介质，可构建新的目标模型，采用该新的目标模型可提升进行数据搜索时的速度和准确度。一方面，本专利技术实施例提供了一种数据处理方法，包括：<...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n获取样本多媒体数据集，所述样本多媒体数据集包括至少两个样本多媒体数据；/n获取所述样本多媒体数据集中每个样本多媒体数据的特征信息，其中，所述特征信息包括数据内容信息或向量分布特征信息；/n对任意两个样本多媒体数据的特征信息进行关联性分析，并根据关联性分析结果确定所述样本多媒体数据集中任意两个样本多媒体数据之间的数据关联关系；/n根据所述数据关联关系构建目标模型，所述目标模型用于对输入的目标多媒体数据进行处理并生成目标哈希码，所述目标哈希码用于获取与所述目标多媒体数据相关的多媒体数据。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
获取样本多媒体数据集，所述样本多媒体数据集包括至少两个样本多媒体数据；
获取所述样本多媒体数据集中每个样本多媒体数据的特征信息，其中，所述特征信息包括数据内容信息或向量分布特征信息；
对任意两个样本多媒体数据的特征信息进行关联性分析，并根据关联性分析结果确定所述样本多媒体数据集中任意两个样本多媒体数据之间的数据关联关系；
根据所述数据关联关系构建目标模型，所述目标模型用于对输入的目标多媒体数据进行处理并生成目标哈希码，所述目标哈希码用于获取与所述目标多媒体数据相关的多媒体数据。

2.根据权利要求1所述的方法，其特征在于，一个样本多媒体数据对应一个哈希码向量，若所述特征信息为向量分布特征信息，且所述多媒体数据集中每个样本多媒体数据的哈希码向量的分布属于目标分布；所述对任意两个样本多媒体数据的特征信息进行关联性分析，包括：
确定任意两个样本多媒体数据对应哈希码向量的数量积，并将所述数量积和预设数量积阈值进行对比；
将所述数量与和所述预设数量积阈值的对比结果，作为对所述任意两个样本多媒体数据的关联性分析结果。

3.根据权利要求2所述的方法，其特征在于，所述根据关联性分析结果确定所述样本多媒体数据集中任意两个样本多媒体数据之间的数据关联关系，包括：
若所述数量积大于所述预设数量积阈值，则确定所述任意两个样本多媒体数据之间具备数据关联关系；
若所述数量积小于等于所述预设数量积阈值，则确定所述任意两个样本多媒体数据之间不具备数据关联关系。

4.根据权利要求1所述的方法，其特征在于，若所述特征信息为数据内容信息，所述对任意两个样本多媒体数据的特征信息进行关联性分析，包括：
根据任意两个样本多媒体数据的数据内容信息，对所述任意两个样本多媒体数据进行引用关系检测；
将所述引用关系检测的结果作为对所述任意两个样本多媒体数据的关联性分析结果。

5.根据权利要求4所述的方法，其特征在于，所述根据关联性分析结果确定所述样本多媒体数据集中任意两个样本多媒体数据之间的数据关联关系，包括：
若所述引用关系检测的结果指示所述任意两个多媒体数据的数据内容存在引用关系，则确定所述任意两个样本多媒体数据之间具备数据关联关系；
若所述引用关系检测的结果指示所述任意两个多媒体数据的数据内容不存在引用关系，则确定所述任意两个样本多媒体数据之间不具备数据关联关系。

6.根据权利要求1所述的方法，其特征在于，构建的目标模型满足联合概率分布函数，所述联合概率分布函数为第一联合概率分布函数或第二联合概率分布函数；
其中，若所述数据关联关系根据对所述向量分布特征信息的关联性分析确定，则所述目标模型满足所述第一联合概率分布函数，若所述数据关联关系根据对所述数据内容信息的关联性分析确定，则所述目标模型满足所述第二联合概率分布函数。

7.根据权利要求1所述的方法，其特征在于，所述根据所述数据关联关系构建目标模型之后，所述方法还包括：
确定用于训练所述目标模型的奖励函数；
采用所述样本多媒体数据集包括的样本多媒体数据，并按照所述奖励函数增大的方向对所述目标模型满足的联合概率分布函数和概率计算函数进行训练；
在所述奖励函数的函数取值满足预设阈值时完成对所述目标模型的训练。

8...

【专利技术属性】
技术研发人员：欧子菁，赵瑞辉，林民龙，苏勤亮，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人