视频数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38894944 阅读：14 留言：0更新日期：2023-09-22 14:17

本公开实施例提供一种视频数据处理方法、装置、电子设备及存储介质。该方法包括：获取目标话题标签对应的聚类表征和包括所述目标话题标签的待处理视频数据，其中所述聚类表征是对多个包括所述目标话题标签的目标视频数据进行聚类获得的；对所述待处理视频数据进行多模态特征提取，获得所述待处理视频数据的多模态表征；根据所述目标话题标签对应的聚类表征和所述待处理视频的多模态表征，确定所述目标话题标签和所述待处理视频数据的相关性。话题标签和所述待处理视频数据的相关性。话题标签和所述待处理视频数据的相关性。

全部详细技术资料下载

【技术实现步骤摘要】
视频数据处理方法、装置、电子设备及存储介质

[0001]本公开涉及计算机
，具体而言，涉及一种视频数据处理方法、视频数据处理装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]话题标签(hashtag)是一种内容平台上的用于表示视频内容的标志，常用于内容平台上生成独特话题，以及精炼地表达发布内容包含的信息。在内容平台上，合理的话题标签能有效地吸引内容消费者积极参与到相关的话题，同时带动视频的播放量。
[0003]但是，在实际情况中，存在视频创作者为了蹭话题热度而为自己发布的视频添加与视频内容无关的热点话题标签，以吸引用户点击视频。
[0004]相关技术中，通过人工观看的方式判断视频内容和话题标签的相关性，这种方式准确性较差、效率较低。

技术实现思路

[0005]本公开实施例提供一种视频数据处理方法、视频数据处理装置、视频表征装置、电子设备以及计算机可读存储介质，该方法提高了目标话题标签和待处理视频数据的相关性判断的效率和准确性，从而可以根据相关性筛选获得与目标话题标签相关程度较低的待处理视频数据，以提高话题标签和视频数据匹配的准确性。
[0006]本公开实施例提供一种视频数据处理方法，该方法包括：获取目标话题标签对应的聚类表征和包括所述目标话题标签的待处理视频数据，其中所述聚类表征是对多个包括所述目标话题标签的目标视频数据进行聚类获得的；对所述待处理视频数据进行多模态特征提取，获得所述待处理视频数据的多模态表征；根据所述目标话题标签对应的聚类表征和所述待处理视频...

【技术保护点】

【技术特征摘要】
1.一种视频数据处理方法，其特征在于，包括：获取目标话题标签对应的聚类表征和包括所述目标话题标签的待处理视频数据，其中所述聚类表征是对多个包括所述目标话题标签的目标视频数据进行聚类获得的；对所述待处理视频数据进行多模态特征提取，获得所述待处理视频数据的多模态表征；根据所述目标话题标签对应的聚类表征和所述待处理视频的多模态表征，确定所述目标话题标签和所述待处理视频数据的相关性。2.根据权利要求1所述的视频数据处理方法，其特征在于，获取目标话题标签对应的聚类表征，包括：获取多个包括所述目标话题标签的目标视频数据；对各个目标视频数据进行多模态特征提取，获得各个目标视频数据的多模态表征；对各个目标视频数据的多模态表征进行聚类，获得所述目标话题标签对应的聚类表征。3.根据权利要求1或2所述的视频数据处理方法，其特征在于，还包括：获取所述目标话题标签及包括所述目标话题标签的多个训练视频数据；通过多模态表征模型对各个训练视频数据进行多模态特征提取，获得各个训练视频数据的多模态表征；根据各个训练视频数据的多模态表征获得预测话题标签；根据所述预测话题标签和所述目标话题标签训练所述多模态表征模型，以根据训练完成的所述多模态表征模型对所述待处理视频数据或者各个目标视频数据进行多模态特征提取。4.根据权利要求3所述的视频数据处理方法，其特征在于，所述训练视频数据包括训练图像数据、训练文本数据和训练音频数据，所述多模态表征模型包括视频表征模块、文本表征模块、音频表征模块和特征融合模块；所述通过多模态表征模型对各个训练视频数据进行多模态特征提取，获得各个训练视频数据的多模态表征，包括：通过所述视频表征模块对各个训练图像数据进行视频特征提取，获得各个训练图像数据的视频特征；通过所述文本表征模块对各个训练文本数据进行文本特征提取，获得各个训练文本数据的文本特征；通过所述音频表征模块对各个训练音频数据进行音频特征提取，获得各个训练音频数据的音频特征；通过所述特征融合模块对各个训练图像数据...

【专利技术属性】
技术研发人员：谢树雷，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人