一种数据处理方法、装置、设备以及可读存储介质制造方法及图纸

技术编号:33795359 阅读:19 留言:0更新日期:2022-06-12 14:57
本申请公开了一种数据处理方法、装置、设备以及可读存储介质,方法包括:获取目标媒体数据对应的目标数据帧,识别目标媒体数据所属的目标媒体类别、目标数据帧对应的目标图像特征以及目标图像类别;在参数映射表中,获取目标媒体类别以及目标图像类别共同指示的目标匹配参数;根据目标图像特征与目标匹配参数,在候选图像特征集合中查找与目标图像特征相匹配的匹配图像特征;候选图像特征集合是由待召回媒体数据集合中,每个待召回媒体数据所分别对应的图像特征所组成的集合;根据匹配图像特征以及目标图像特征,在待召回媒体数据集合中确定有效召回媒体数据。采用本申请,可以在媒体数据的检索业务中,提高检索准确率。提高检索准确率。提高检索准确率。

【技术实现步骤摘要】
一种数据处理方法、装置、设备以及可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、设备以及可读存储介质。

技术介绍

[0002]随着多媒体技术的快速发展,海量多媒体数据(如音乐、视频等等)进入人们视野,对于多媒体数据的检索,也变得越来越重要。其中,多媒体数据的检索是基于某个多媒体数据包含的媒体内容,从各个候选多媒体数据中检索出与该多媒体数据存在一定相似媒体内容的多媒体数据。
[0003]现有技术中对多媒体数据的的检索,通常为人工操作。然而,由于媒体业务平台的多样性,包含有各种类型(如比赛类型、影视综艺类型、演唱会类型、日常生活类型、音乐类型等等)的多媒体数据,且每个类型的多媒体数据又包含有不同内容,则在多媒体数据具备多样性、丰富性、海量性的情况下,基于人工操作来进行多媒体数据检索的方式,无疑需要投入大量的人力与时间,成本极大;同时,由于人工操作的局限性,覆盖面不全,所检索到的媒体数据也不够准确,准确率非常低下。

技术实现思路

[0004]本申请实施例提供一种数据处理方法、装置、设备以及可读存储介质,可以在媒体数据的检索业务中,提高检索准确率。
[0005]本申请实施例一方面提供了一种数据处理方法,包括:获取目标媒体数据对应的目标数据帧,识别目标媒体数据所属的目标媒体类别、目标数据帧对应的目标图像特征以及目标图像类别;在参数映射表中,获取目标媒体类别以及目标图像类别共同指示的目标匹配参数;参数映射表包括配置媒体类别集合、配置图像类别集合以及匹配参数集合之间的映射关系,配置媒体类别集合中的一个配置媒体类别、配置图像类别集合中的一个配置图像类别与匹配参数集合中的一个配置匹配参数之间存在映射关系;一个配置匹配参数用于反映具有对应的配置媒体类别和对应的配置图像类别的数据帧的图像特征的匹配条件;根据目标图像特征与目标匹配参数,在候选图像特征集合中查找与目标图像特征相匹配的匹配图像特征;候选图像特征集合是由待召回媒体数据集合中,每个待召回媒体数据所分别对应的图像特征所组成的集合;根据匹配图像特征以及目标图像特征,在待召回媒体数据集合中确定有效召回媒体数据。
[0006]本申请实施例一方面提供了一种数据处理装置,包括:帧获取模块,用于获取目标媒体数据对应的目标数据帧;识别模块,用于识别目标媒体数据所属的目标媒体类别、目标数据帧对应的目标图像特征以及目标图像类别;
阈值获取模块,用于在参数映射表中,获取目标媒体类别以及目标图像类别共同指示的目标匹配参数;参数映射表包括配置媒体类别集合、配置图像类别集合以及匹配参数集合之间的映射关系,配置媒体类别集合中的一个配置媒体类别、配置图像类别集合中的一个配置图像类别与匹配参数集合中的一个配置匹配参数之间存在映射关系;一个配置匹配参数用于反映具有对应的配置媒体类别和对应的配置图像类别的数据帧的图像特征的匹配条件;特征匹配模块,用于根据目标图像特征与目标匹配参数,在候选图像特征集合中查找与目标图像特征相匹配的匹配图像特征;候选图像特征集合是由待召回媒体数据集合中,每个待召回媒体数据所分别对应的图像特征所组成的集合;有效媒体确定模块,用于根据匹配图像特征以及目标图像特征,在待召回媒体数据集合中确定有效召回媒体数据。
[0007]在一个实施例中,识别模块包括:特征提取单元,用于将目标数据帧输入至多任务识别模型中,通过多任务识别模型中的基础特征提取层,提取目标数据帧对应的图像基础特征;特征输入单元,用于将图像基础特征输入至多任务识别模型中的卷积网络层,通过卷积网络层与图像基础特征,确定目标数据帧对应的图像嵌入特征,将图像嵌入特征确定为目标图像特征;特征输入单元,还用于将图像基础特征输入至多任务识别模型中的图像类别预测层,通过图像类别预测层与图像基础特征,确定目标数据帧对应的目标图像类别;特征输入单元,还用于将图像基础特征输入至多任务识别模型中的媒体类别预测层,通过媒体类别预测层与图像基础特征,确定目标媒体数据所属的目标媒体类别。
[0008]在一个实施例中,目标数据帧的数量为N个,N个目标数据帧中包括目标数据帧S
i
,图像基础特征包括目标数据帧S
i
对应的图像基础特征T
i
,N、i均为正整数;特征输入单元,包括:类别确定子单元,用于通过媒体类别预测层与目标数据帧S
i
对应的图像基础特征T
i
,确定目标数据帧S
i
对应的帧媒体类别;帧归类子单元,用于当确定出N个目标数据帧分别对应的帧媒体类别时,按照N个帧媒体类别对N个目标数据帧进行归类处理,得到M个数据帧集合;每个数据帧集合中包含的目标数据帧所属的帧媒体类别为相同类别;M为正整数;数量统计子单元,用于统计M个数据帧集合中,每个数据帧集合所分别包含的目标数据帧的数量,得到M个帧数量;数量统计子单元,还用于在M个帧数量中获取最大帧数量,将最大帧数量对应的数据帧集合,确定为目标数据帧集合;类别预测子单元,用于将目标数据帧集合中包含的目标数据帧所属的帧媒体类别,确定为目标媒体数据所属的目标媒体类别。
[0009]在一个实施例中,匹配参数集合中的每个配置匹配参数包括配置相似度阈值,目标匹配参数包括目标相似度阈值;特征匹配模块包括:相似度确定单元,用于确定目标图像特征分别与候选图像特征集合中,每个候选
图像特征之间的特征相似度,得到特征相似度集合;特征确定单元,用于将特征相似度集合中,大于目标相似度阈值的特征相似度,确定为目标特征相似度;特征确定单元,还用于将目标特征相似度对应的候选图像特征,确定为与目标图像特征相匹配的匹配图像特征。
[0010]在一个实施例中,目标数据帧的数量为N个,目标数据帧对应的目标图像特征包括N个目标数据帧分别对应的目标图像特征,N为正整数;匹配图像特征的数量为Q个,Q个匹配图像特征由与N个目标图像特征分别相匹配的匹配图像特征组成,Q为正整数;有效媒体确定模块包括:特征分类单元,用于在待召回媒体数据集合中,获取Q个匹配图像特征分别所属的待召回媒体数据;特征分类单元,还用于按照Q个匹配图像特征分别所属的待召回媒体数据,对Q个匹配图像特征进行特征分类,得到W个匹配特征集合;每个匹配特征集合中包含的匹配图像特征所属的待召回媒体数据为相同媒体数据;W个匹配特征集合中包括匹配特征集合R
j
,W、j均为正整数;特征数量统计单元,用于统计匹配特征集合R
j
中包含的匹配图像特征的第一特征数量;属性确定单元,用于根据第一特征数量以及N个目标图像特征,确定匹配特征集合R
j
所指示的待召回媒体数据的召回属性;有效媒体确定单元,用于在确定出W个匹配特征集合分别所指示的待召回媒体数据的召回属性时,将W个匹配特征集合分别所指示的待召回媒体数据中的召回属性为有效属性的待召回媒体数据,确定为有效召回媒体数据。
[0011]在一个实施例中,匹配特征集合R
j
中包含的匹配图像特征包括第一匹配图像特征与第二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取目标媒体数据对应的目标数据帧,识别所述目标媒体数据所属的目标媒体类别、所述目标数据帧对应的目标图像特征以及目标图像类别;在参数映射表中,获取所述目标媒体类别以及所述目标图像类别共同指示的目标匹配参数;所述参数映射表包括配置媒体类别集合、配置图像类别集合以及匹配参数集合之间的映射关系,所述配置媒体类别集合中的一个配置媒体类别、所述配置图像类别集合中的一个配置图像类别与所述匹配参数集合中的一个配置匹配参数之间存在映射关系;所述一个配置匹配参数用于反映具有对应的配置媒体类别和对应的配置图像类别的数据帧的图像特征的匹配条件;根据所述目标图像特征与所述目标匹配参数,在候选图像特征集合中查找与所述目标图像特征相匹配的匹配图像特征;所述候选图像特征集合是由待召回媒体数据集合中,每个待召回媒体数据所分别对应的图像特征所组成的集合;根据所述匹配图像特征以及所述目标图像特征,在所述待召回媒体数据集合中确定有效召回媒体数据。2.根据权利要求1所述的方法,其特征在于,所述识别所述目标媒体数据所属的目标媒体类别、所述目标数据帧对应的目标图像特征以及目标图像类别,包括:将所述目标数据帧输入至多任务识别模型中,通过所述多任务识别模型中的基础特征提取层,提取所述目标数据帧对应的图像基础特征;将所述图像基础特征输入至所述多任务识别模型中的卷积网络层,通过所述卷积网络层与所述图像基础特征,确定所述目标数据帧对应的图像嵌入特征,将所述图像嵌入特征确定为所述目标图像特征;将所述图像基础特征输入至所述多任务识别模型中的图像类别预测层,通过所述图像类别预测层与所述图像基础特征,确定所述目标数据帧对应的目标图像类别;将所述图像基础特征输入至所述多任务识别模型中的媒体类别预测层,通过所述媒体类别预测层与所述图像基础特征,确定所述目标媒体数据所属的目标媒体类别。3.根据权利要求2所述的方法,其特征在于,所述目标数据帧的数量为N个,N个目标数据帧中包括目标数据帧S
i
,所述图像基础特征包括所述目标数据帧S
i
对应的图像基础特征T
i
,N、i均为正整数;所述通过所述媒体类别预测层与所述图像基础特征,确定所述目标媒体数据所属的目标媒体类别,包括:通过所述媒体类别预测层与所述目标数据帧S
i
对应的图像基础特征T
i
,确定所述目标数据帧S
i
对应的帧媒体类别;当确定出所述N个目标数据帧分别对应的帧媒体类别时,按照N个帧媒体类别对所述N个目标数据帧进行归类处理,得到M个数据帧集合;每个数据帧集合中包含的目标数据帧所属的帧媒体类别为相同类别;M为正整数;统计所述M个数据帧集合中,每个数据帧集合所分别包含的目标数据帧的数量,得到M个帧数量;在所述M个帧数量中获取最大帧数量,将所述最大帧数量对应的数据帧集合,确定为目标数据帧集合;
将所述目标数据帧集合中包含的目标数据帧所属的帧媒体类别,确定为所述目标媒体数据所属的目标媒体类别。4.根据权利要求1所述的方法,其特征在于,所述匹配参数集合中的每个配置匹配参数包括配置相似度阈值,所述目标匹配参数包括目标相似度阈值;所述根据所述目标图像特征与所述目标匹配参数,在候选图像特征集合中查找与所述目标图像特征相匹配的匹配图像特征,包括:确定所述目标图像特征分别与所述候选图像特征集合中,每个候选图像特征之间的特征相似度,得到特征相似度集合;将所述特征相似度集合中,大于所述目标相似度阈值的特征相似度,确定为目标特征相似度;将所述目标特征相似度对应的候选图像特征,确定为与所述目标图像特征相匹配的匹配图像特征。5.根据权利要求1所述的方法,其特征在于,所述目标数据帧的数量为N个,所述目标数据帧对应的目标图像特征包括N个目标数据帧分别对应的目标图像特征,N为正整数;所述匹配图像特征的数量为Q个,Q个匹配图像特征由与N个目标图像特征分别相匹配的匹配图像特征组成,Q为正整数;所述根据所述匹配图像特征以及所述目标图像特征,在所述待召回媒体数据集合中确定有效召回媒体数据,包括:在所述待召回媒体数据集合中,获取所述Q个匹配图像特征分别所属的待召回媒体数据;按照所述Q个匹配图像特征分别所属的待召回媒体数据,对所述Q个匹配图像特征进行特征分类,得到W个匹配特征集合;每个匹配特征集合中包含的匹配图像特征所属的待召回媒体数据为相同媒体数据;所述W个匹配特征集合中包括匹配特征集合R
j
,W、j均为正整数;统计所述匹配特征集合R
j
中包含的匹配图像特征的第一特征数量,根据所述第一特征数量以及所述N个目标图像特征,确定所述匹配特征集合R
j
所指示的待召回媒体数据的召回属性;在确定出所述W个匹配特征集合分别所指示的待召回媒体数据的召回属性时,将所述W个匹配特征集合分别所指示的待召回媒体数据中的召回属性为有效属性的待召回媒体数据,确定为所述有效召回媒体数据。6.根据权利要求5所述的方法,其特征在于,所述匹配特征集合R
j
中包含的匹配图像特征包括第一匹配图像特征与第二匹配图像特征;所述根据所述第一特征数量以及所述N个目标图像特征,确定所述匹配特征集合R
j
所指示的待召回媒体数据的召回属性,包括:在所述N个目标图像特征中,获取与所述第一匹配图像特征相匹配的第一目标图像特征,以及与所述第二匹配图像相匹配的第二目标图像特征;将所述第一目标图像特征与所述第二目标图像特征所包含的特征总数量,确定为第二特征数量;根据所述第一特征数量、所述第二特征数量以及所述目标媒体数据,确定所述匹配特征集合R
j
所指示的待召回媒体数据的召回属性。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第一特征数量、所述第二特征数量以及所述目标媒体数据,确定所述匹配特征集合R
j
所指示的待召回媒体数据的召回属性,包括:获取所述匹配特征集合R
j
所指示的待召回媒体数据所对应的第一媒体时长,以及所述目标媒体数据对应的第二媒体时长;确定所述第一特征数量与所述第一媒体时长之间的第一比值,以及所述第二特征数量与所述第二媒体时长之间的第二比值;若所述第一比值与所述第二比值中存在至少一个比值大于比值阈值,则将所述匹配特征集合R
j
所指示的待召回媒体数据的召回属性,确定为有效属性;若所述第一比值与所述第二比值均小于所述比值阈值,则将所述匹配特征集合...

【专利技术属性】
技术研发人员:郭卉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1