一种数据处理方法、装置以及可读存储介质制造方法及图纸

技术编号:22219006 阅读:23 留言:0更新日期:2019-09-30 01:18
本申请实施例公开了一种数据处理方法、装置以及可读存储介质,方法包括:获取多媒体数据对应的数据内容特征;根据所述数据内容特征,确定用于筛选与所述识别维度信息相关特征的第一筛选向量;根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征;根据所述目标信息特征,确定所述多媒体数据中与所述识别维度信息相匹配的数据属性类型。采用本申请实施例,可以提高多媒体数据属性类型分类的准确率。

A Data Processing Method, Device and Readable Storage Media

【技术实现步骤摘要】
一种数据处理方法、装置以及可读存储介质
本申请涉及计算机
,尤其涉及一种数据处理方法、装置以及可读存储介质。
技术介绍
随着互联网的快速发展,产生了大量的多媒体数据(包括文本、图像、视频等数据)。通过对大量的多媒体数据进行分析,可以抽取出用户所关心的内容,或者判断出多媒体数据或多媒体数据发布者所蕴含的情感倾向,基于这些分析结果,可以帮助用户做出更好的决定或采取相应的措施来实现更大的正面效果。现有技术中,数据处理过程可以通过对多媒体数据进行数据内容特征的提取,进而根据提取到的数据内容特征预测出该多媒体数据所蕴含的情感倾向。现有技术的方案虽然实现了多媒体数据的情感倾向预测,但由于多媒体数据中所包含的信息量较大,即干扰信息较多,使得多媒体数据所蕴含的情感倾向预测出现误差,进而降低情感倾向预测的准确率。
技术实现思路
本申请实施例提供一种数据处理方法、装置以及可读存储介质,可以提高多媒体数据属性类型分类的准确率。本申请实施例一方面提供了一种数据处理方法,包括:获取多媒体数据对应的数据内容特征;根据所述数据内容特征,确定用于筛选与识别维度信息相关特征的第一筛选向量;根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征;根据所述目标信息特征,确定所述多媒体数据中与所述识别维度信息相匹配的数据属性类型。其中,所述获取多媒体数据对应的数据内容特征,包括:获取多媒体数据,将所述多媒体数据和识别维度信息输入至数据识别模型中;在所述数据识别模型中获取所述多媒体数据对应的数据内容特征;所述数据识别模型包括输入层、卷积层、重置门单元、第一全连接层以及输出层;所述输入层用于输入所述多媒体数据和所述识别维度信息,所述卷积层用于获取所述多媒体数据对应的数据内容特征,所述重置门单元包括第二全连接层,所述第二全连接层用于获取所述第一筛选向量,所述第一全连接层用于获取所述目标信息特征,所述输出层用于输出所述多媒体数据对应的数据属性类型。其中,所述多媒体数据包括文本数据;所述在所述数据识别模型中获取所述多媒体数据对应的数据内容特征,包括:在所述数据识别模型中,将所述文本数据划分为多个单位字符,并将每个单位字符转换为单位词向量;将所述单位词向量拼接为所述文本数据对应的文本矩阵;基于所述卷积层,对所述文本矩阵进行特征提取,获取所述文本数据对应的数据内容特征。其中,所述根据所述数据内容特征,确定用于筛选与所述识别维度信息相关特征的第一筛选向量,包括:将所述识别维度信息转换为目标词向量;将所述目标词向量与所述数据内容特征输入至所述第二全连接层中,基于所述第二全连接层对应的第一激活函数,得到用于筛选与所述识别维度信息相关特征的第一筛选向量。其中,所述根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征,包括:将所述第一筛选向量与所述数据内容特征进行向量点乘,得到与所述识别维度信息相关联的保留信息特征;将所述保留信息特征和所述识别维度信息对应的目标词向量输入至所述第一全连接层中;基于所述第一全连接层对应的第二激活函数,得到所述数据内容特征中的目标信息特征。其中,所述数据识别模型还包括更新门单元,所述更新门单元包括第三全连接层;所述方法还包括:将所述识别维度信息对应的目标词向量与所述数据内容特征输入至所述第三全连接层中,基于所述第三全连接层对应的第三激活函数,得到用于筛选与所述识别维度信息相关特征的第二筛选向量;则所述基于所述第一全连接层对应的第二激活函数,得到所述数据内容特征中的目标信息特征,包括:基于所述第一全连接层对应的第二激活函数,获取所述数据内容特征中与所述识别维度信息相关联的第一候选信息特征;将所述第二筛选向量与所述第一候选信息特征进行向量点乘,得到目标信息特征。其中,所述将所述第二筛选向量与所述第一候选信息特征进行向量点乘,得到目标信息特征,包括:将所述第二筛选向量与所述第一候选信息特征进行向量点乘,得到第二候选信息特征;基于所述第二筛选向量与所述数据内容特征,确定全局信息特征;根据所述第二候选信息特征与所述全局信息特征,确定目标信息特征。其中,所述根据所述目标信息特征,确定所述多媒体数据中与所述识别维度信息相匹配的数据属性类型,包括:将所述目标信息特征输入至所述输出层中的分类器;基于所述分类器,识别所述目标信息特征与所述分类器中多种属性类型之间的匹配概率,将具有最大匹配概率的属性类型确定为所述多媒体数据中与所述识别维度信息相匹配的数据属性类型。其中,所述方法还包括:获取样本多媒体数据与所述样本多媒体数据对应的至少一个属性类型标签;所述属性类型标签用于表征所述样本多媒体数据对应的数据属性类型;从所述样本多媒体数据中,获取与所述至少一个属性类型标签相关联的样本多媒体子数据;每个样本多媒体子数据对应一个属性类型标签;基于所述样本多媒体子数据与所述至少一个属性类型标签之间的映射关系训练所述数据识别模型。其中,所述从所述样本多媒体数据中,获取与所述至少一个属性类型标签相关联的样本多媒体子数据,包括:将所述样本多媒体数据调整至目标尺寸,将尺寸调整后的样本多媒体数据确定为目标样本数据;生成所述目标样本数据对应的样本数据矩阵,从所述样本数据矩阵中,获取与所述至少一个属性类型标签相关联的样本多媒体子数据。本申请实施例一方面提供了一种数据处理装置,包括:数据获取模块,用于获取多媒体数据对应的数据内容特征;第一确定模块,用于根据所述数据内容特征,确定用于筛选与识别维度信息相关特征的第一筛选向量;筛选模块,用于根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征;第二确定模块,用于根据所述目标信息特征,确定所述多媒体数据中与所述识别维度信息相匹配的数据属性类型。其中,所述数据获取模块包括:数据输入单元,用于获取多媒体数据,将所述多媒体数据和识别维度信息输入至数据识别模型中;内容特征获取单元,用于在所述数据识别模型中获取所述多媒体数据对应的数据内容特征;所述数据识别模型包括输入层、卷积层、重置门单元、第一全连接层以及输出层;所述输入层用于输入所述多媒体数据和所述识别维度信息,所述卷积层用于获取所述多媒体数据对应的数据内容特征,所述重置门单元包括第二全连接层,所述第二全连接层用于获取所述第一筛选向量,所述第一全连接层用于获取所述目标信息特征,所述输出层用于输出所述多媒体数据对应的数据属性类型。其中,所述多媒体数据包括文本数据;所述内容特征获取单元包括:第一转换子单元,用于在所述数据识别模型中,将所述文本数据划分为多个单位字符,并将每个单位字符转换为单位词向量;拼接子单元,用于将所述单位词向量拼接为所述文本数据对应的文本矩阵;特征提取子单元,用于基于所述卷积层,对所述文本矩阵进行特征提取,获取所述文本数据对应的数据内容特征。其中,所述第一确定模块包括:第二转换单元,用于将所述识别维度信息转换为目标词向量;第一筛选向量确定单元,用于将所述目标词向量与所述数据内容特征输入至所述第二全连接层中,基于所述第二全连接层对应的第一激活函数,得到用于筛选与所述识别维度信息相关特征的第一筛选向量。其中,所述筛选模块包括:点乘单元,用于将所述第一筛选向量与所述数据内容特征进行本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取多媒体数据对应的数据内容特征;根据所述数据内容特征,确定用于筛选与识别维度信息相关特征的第一筛选向量;根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征;根据所述目标信息特征,确定所述多媒体数据中与所述识别维度信息相匹配的数据属性类型。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取多媒体数据对应的数据内容特征;根据所述数据内容特征,确定用于筛选与识别维度信息相关特征的第一筛选向量;根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征;根据所述目标信息特征,确定所述多媒体数据中与所述识别维度信息相匹配的数据属性类型。2.根据权利要求1所述的方法,其特征在于,所述获取多媒体数据对应的数据内容特征,包括:获取多媒体数据,将所述多媒体数据和识别维度信息输入至数据识别模型中;在所述数据识别模型中获取所述多媒体数据对应的数据内容特征;所述数据识别模型包括输入层、卷积层、重置门单元、第一全连接层以及输出层;所述输入层用于输入所述多媒体数据和所述识别维度信息,所述卷积层用于获取所述多媒体数据对应的数据内容特征,所述重置门单元包括第二全连接层,所述第二全连接层用于获取所述第一筛选向量,所述第一全连接层用于获取所述目标信息特征,所述输出层用于输出所述多媒体数据对应的数据属性类型。3.根据权利要求2所述的方法,其特征在于,所述多媒体数据包括文本数据;所述在所述数据识别模型中获取所述多媒体数据对应的数据内容特征,包括:在所述数据识别模型中,将所述文本数据划分为多个单位字符,并将每个单位字符转换为单位词向量;将所述单位词向量拼接为所述文本数据对应的文本矩阵;基于所述卷积层,对所述文本矩阵进行特征提取,获取所述文本数据对应的数据内容特征。4.根据权利要求2所述的方法,其特征在于,所述根据所述数据内容特征,确定用于筛选与所述识别维度信息相关特征的第一筛选向量,包括:将所述识别维度信息转换为目标词向量;将所述目标词向量与所述数据内容特征输入至所述第二全连接层中,基于所述第二全连接层对应的第一激活函数,得到用于筛选与所述识别维度信息相关特征的第一筛选向量。5.根据权利要求2所述的方法,其特征在于,所述根据所述第一筛选向量从所述数据内容特征中过滤出与所述识别维度信息相关联的目标信息特征,包括:将所述第一筛选向量与所述数据内容特征进行向量点乘,得到与所述识别维度信息相关联的保留信息特征;将所述保留信息特征和所述识别维度信息对应的目标词向量输入至所述第一全连接层中;基于所述第一全连接层对应的第二激活函数,得到所述数据内容特征中的目标信息特征。6.根据权利要求5所述的方法,其特征在于,所述数据识别模型还包括更新门单元,所述更新门单元包括第三全连接层;所述方法还包括:将所述识别维度信息对应的目标词向量与所述数据内容特征输入至所述第三全连接层中,基于所述第三全连接层对应的第三激活函数,得到用于筛选与所述识别维度信息相关特征的第二筛选向量;则所述基于所述第一全连接层对应的第二激活函数,得到所述数据内容特征中的目标信息特征,包括:基于所述...

【专利技术属性】
技术研发人员:刘巍
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1