视频作者识别方法、装置、电子设备及介质制造方法及图纸

技术编号:37783024 阅读:7 留言:0更新日期:2023-06-09 09:13
本公开关于一种视频作者识别方法、装置、电子设备及介质,涉及计算机技术领域。获取待识别作者的作者相关信息以及由待识别作者创建的已发布视频的内容相关信息;将作者相关信息以及内容相关信息输入目标识别模型,以将作者相关信息编码为文本向量序列,将内容相关信息编码为视频向量序列;目标识别模型是基于样本作者的样本作者相关信息、样本作者创建的已发布视频的样本内容相关信息以及样本作者标签训练得到的,样本作者标签用于表征样本作者是否为知识类作者;基于文本向量序列以及视频向量序列对待识别作者进行作者类型分类识别,得到待识别作者的作者类型识别结果;作者类型识别结果用于表征待识别作者是否为知识类作者,提高了识别准确率。提高了识别准确率。提高了识别准确率。

【技术实现步骤摘要】
视频作者识别方法、装置、电子设备及介质


[0001]本公开涉及计算机
,尤其涉及一种视频作者识别方法、装置、电子设备及介质。

技术介绍

[0002]随着网络技术的发展,涌现出了大量视频平台(例如,短视频平台),平台用户作为创作者,可以通过上传或发布视频实现与其他用户的交流和分享,相应地,平台方可以根据用户的实际需求对不同类型的视频进行推荐和激励。
[0003]其中,知识类的视频分享在平台中占据的比重越来越大,因此,如何准确识别出平台中的创作者是否为知识类作者成为亟需解决的问题。

技术实现思路

[0004]本公开提供一种视频作者识别方法、装置、电子设备及介质,以至少解决如何准确识别出平台中的创作者是否为知识类作者的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供了一种视频作者识别方法,包括:
[0006]获取待识别作者的作者相关信息以及由所述待识别作者创建的已发布视频的内容相关信息;
[0007]将所述作者相关信息以及内容相关信息输入目标识别模型,以将所述作者相关信息编码为文本向量序列,将所述内容相关信息编码为视频向量序列;所述目标识别模型是基于样本作者的样本作者相关信息、所述样本作者创建的已发布视频的样本内容相关信息以及样本作者标签训练得到的,所述样本作者标签用于表征所述样本作者是否为知识类作者;
[0008]基于所述文本向量序列以及所述视频向量序列对所述待识别作者进行作者类型分类识别,得到所述待识别作者的作者类型识别结果;所述作者类型识别结果用于表征所述待识别作者是否为知识类作者。
[0009]可选的,所述待识别作者创建的已发布视频的数量为至少两个,所述内容相关信息包括视频标签以及视频多模态信息;所述视频标签用于表征所述已发布视频是否为知识类视频,所述视频标签是基于所述已发布视频的视频内容确定的;所述方法还包括:获取所述待识别作者创建的已发布视频的视频上传时间;
[0010]所述将所述内容相关信息编码为视频向量序列,包括:
[0011]对各个所述已发布视频的视频标签进行编码处理,得到各个所述已发布视频的第一向量;
[0012]基于各个所述已发布视频的视频上传时间,将所述已发布视频分类至对应不同时间区间的多个数据集合中;所述多个数据集合属于至少两种不同的时间区间;
[0013]获取各个所述数据集合中已发布视频的置信度,并基于各个所述已发布视频的置信度生成第二向量;
[0014]基于各个所述已发布视频的视频多模态信息为各个所述已发布视频生成第三向量;
[0015]基于各个所述已发布视频的第一向量、第二向量以及第三向量,生成所述视频向量序列。
[0016]可选的,所述基于各个所述已发布视频的视频上传时间,将所述已发布视频分类至对应不同时间区间的多个数据集合中,包括:
[0017]对于任一所述时间区间,从各个所述已发布视频中,确定属于所述时间区间的已发布视频;
[0018]基于所述时间区间对应的时间跨度以及所述时间区间对应的数据集合数量,确定属于所述时间区间的数据集合对应的集合时长;所述集合时长用于表征所述数据集合中视频的视频上传时间之间的差值上限值;
[0019]基于所述集合时长以及所述时间区间的时间跨度,确定属于所述时间区间的各数据集合对应的时间范围;
[0020]对于属于所述时间区间的任一已发布视频,基于所述已发布视频的视频上传时间,将所述已发布视频分类至,所述已发布视频的视频上传时间所属时间范围对应的数据集合。
[0021]可选的,所述基于各个所述已发布视频的置信度生成第二向量,包括:
[0022]对于任一所述时间区间,基于属于所述时间区间的各个数据集合中已发布视频的置信度,为属于所述时间区间的各个数据集合生成第一子向量;
[0023]基于各个所述数据集合的第一子向量生成所述时间区间对应的第二子向量,并将所有时间区间对应的第二子向量进行拼接;
[0024]基于拼接后的第二子向量,为各个所述已发布视频生成第二向量。
[0025]可选的,所述基于各个所述已发布视频的第一向量、第二向量以及第三向量,生成所述视频向量序列,包括:
[0026]将各个所述已发布视频的第一向量、第二向量及第三向量进行拼接,得到各个所述已发布视频的视频向量;
[0027]对于任一所述已发布视频,基于所述目标识别模型中的第一编码层,对所述已发布视频的视频向量进行处理,以生成所述已发布视频的目标置信度;
[0028]将目标置信度不小于预设置信度阈值的已发布视频的视频向量进行拼接,生成所述视频向量序列。
[0029]可选的,所述作者相关信息包括所述待识别作者的不同维度的属性信息;所述将所述作者相关信息编码为文本向量序列,包括:
[0030]基于所述目标识别模型中的第二编码层,对所述不同维度的属性信息中包括的文本进行拼接,得到目标文本;
[0031]对所述目标文本中的各个字符进行编码,得到各个所述字符的字符向量;
[0032]将各个所述字符的字符向量进行拼接,生成所述文本向量序列。
[0033]可选的,所述基于属于所述时间区间的各个数据集合中已发布视频的置信度,为属于所述时间区间的各个数据集合生成第一子向量,包括:
[0034]对于属于所述时间区间的任一数据集合,按照预设排序指标对所述数据集合中的
已发布视频进行排序,得到排序结果;
[0035]基于所述排序结果对所述数据集合中已发布视频的置信度进行排序,并基于排序后的置信度生成所述数据集合的第一子向量。
[0036]可选的,所述目标识别模型是通过下述方式训练得到的:
[0037]获取所述样本作者的样本作者相关信息以及所述样本作者创建的已发布视频的样本内容相关信息;
[0038]将所述样本作者相关信息以及样本内容相关信息输入待训练的作者类型识别模型,以将所述样本作者相关信息编码为样本文本向量序列,将所述样本内容相关信息编码为样本视频向量序列,并基于所述样本文本向量序列以及样本视频向量序列对所述样本作者进行作者类型分类识别,得到所述样本作者的样本识别结果;
[0039]基于所述样本识别结果以及所述样本作者的样本作者标签,对所述待训练的作者类型识别模型进行调整;
[0040]在所述待训练的作者类型识别模型的训练过程达到停止条件的情况下,将达到停止条件的作者类型识别模型确定为所述目标识别模型。
[0041]根据本公开实施例的第二方面,提供了一种视频作者识别装置,包括:
[0042]信息获取模块,被配置为执行获取待识别作者的作者相关信息以及由所述待识别作者创建的已发布视频的内容相关信息;
[0043]信息输入模块,被配置为执行将所述作者相关信息以及内容相关信息输入目标识别模型,以将所述作者相关信息编码为文本向量序列,将所述内容相关信息编码为视频向量序列;所述目标识别模型是基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频作者识别方法,其特征在于,所述方法包括:获取待识别作者的作者相关信息以及由所述待识别作者创建的已发布视频的内容相关信息;将所述作者相关信息以及内容相关信息输入目标识别模型,以将所述作者相关信息编码为文本向量序列,将所述内容相关信息编码为视频向量序列;所述目标识别模型是基于样本作者的样本作者相关信息、所述样本作者创建的已发布视频的样本内容相关信息以及样本作者标签训练得到的,所述样本作者标签用于表征所述样本作者是否为知识类作者;基于所述文本向量序列以及所述视频向量序列对所述待识别作者进行作者类型分类识别,得到所述待识别作者的作者类型识别结果;所述作者类型识别结果用于表征所述待识别作者是否为知识类作者。2.根据权利要求1所述的方法,其特征在于,所述待识别作者创建的已发布视频的数量为至少两个,所述内容相关信息包括视频标签以及视频多模态信息;所述视频标签用于表征所述已发布视频是否为知识类视频,所述视频标签是基于所述已发布视频的视频内容确定的;所述方法还包括:获取所述待识别作者创建的已发布视频的视频上传时间;所述将所述内容相关信息编码为视频向量序列,包括:对各个所述已发布视频的视频标签进行编码处理,得到各个所述已发布视频的第一向量;基于各个所述已发布视频的视频上传时间,将所述已发布视频分类至对应不同时间区间的多个数据集合中;所述多个数据集合属于至少两种不同的时间区间;获取各个所述数据集合中已发布视频的置信度,并基于各个所述已发布视频的置信度生成第二向量;基于各个所述已发布视频的视频多模态信息为各个所述已发布视频生成第三向量;基于各个所述已发布视频的第一向量、第二向量以及第三向量,生成所述视频向量序列。3.根据权利要求2所述的方法,其特征在于,所述基于各个所述已发布视频的视频上传时间,将所述已发布视频分类至对应不同时间区间的多个数据集合中,包括:对于任一所述时间区间,从各个所述已发布视频中,确定属于所述时间区间的已发布视频;基于所述时间区间对应的时间跨度以及所述时间区间对应的数据集合数量,确定属于所述时间区间的数据集合对应的集合时长;所述集合时长用于表征所述数据集合中视频的视频上传时间之间的差值上限值;基于所述集合时长以及所述时间区间的时间跨度,确定属于所述时间区间的各数据集合对应的时间范围;对于属于所述时间区间的任一已发布视频,基于所述已发布视频的视频上传时间,将所述已发布视频分类至,所述已发布视频的视频上传时间所属时间范围对应的数据集合。4.根据权利要求3所述的方法,其特征在于,所述基于各个所述已发布视频的置信度生成第二向量,包括:对于任一所述时间区间,基于属于所述时间区间的各个数据集合中已发布视频的置信度,为属于所述时间区间的各个数据集合生成第一子向量;
基于各个所述数据集合的第一子向量生成所述时间区间对应的第二子向量,并将所有时间区间对应的第二子向量进行拼接;基于拼接后的第二子向量,为各个所述已发布视频生成第二向量。5.根据权利要求2所述的方法,其特征在于,所述基于各个所述已发布视频的第一向量、第二向量以及第三向量,生成所述视频向量序列,包括:基于各个所述已发布视频的第一向量、第二向量及第三向量,得到各个所述已发布视频的视频向量;对于...

【专利技术属性】
技术研发人员:潘浩杰梅立军李月雷付瑞吉
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1