视频聚合方法及装置、电子设备和介质制造方法及图纸

技术编号：37879664 阅读：27 留言：0更新日期：2023-06-15 21:08

本公开提供了一种视频聚合方法、装置、电子设备、计算机可读存储介质和计算机程序产品，涉及人工智能领域，尤其涉及深度学习、自然语言处理技术领域。实现方案为：获取待聚合的多个视频；确定该多个视频中的每个视频各自对应的视频信息，该视频信息包括视频标题、包括文字信息的图像以及描述文本中的至少一个；对视频信息进行文字识别，以确定各自对应的一个或多个视频标签；对于至少一个视频标签，分别确定该至少一个视频标签中的每个视频标签各自对应的第一视频合集，第一视频合集中的每个视频均对应于相应的视频标签；响应于确定至少两个第一视频合集中的视频内容相同，进行去重操作；以及确定去重操作后剩余的视频合集的合集标题。集标题。集标题。

全部详细技术资料下载

【技术实现步骤摘要】
视频聚合方法及装置、电子设备和介质

[0001]本公开涉及人工智能领域，尤其涉及深度学习、自然语言处理
，具体涉及一种视频聚合方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]视频合集是一种重要的产品形态，对用户体验具有明显增益，如用户搜索手表相关视频，展现的手表视频合集相较于普通的单个手表视频，具备更好地用户满足增益和优秀的用户体验。因此，如何将搜索库内的视频聚合成视频合集以在搜索库内补充大量的视频合集资源成为关键。

技术实现思路

[0004]本公开提供了一种视频聚合方法、装置、电子设备、计算机可读存...

【技术保护点】

【技术特征摘要】
1.一种视频聚合方法，包括：获取待聚合的多个视频；确定所述多个视频中的每个视频各自对应的视频信息，其中所述视频信息包括视频标题、图像以及描述文本中的至少一个，其中所述图像包括文字信息；对所述视频信息进行文字识别，以确定所述每个视频所对应的一个或多个视频标签；对于所述多个视频所对应的多个视频标签中的至少一个视频标签，分别确定所述至少一个视频标签中的每个视频标签各自对应的第一视频合集，其中，所述第一视频合集中的每个视频均对应于相应的视频标签；响应于确定至少两个第一视频合集中的视频内容相同，对所述至少两个第一视频合集进行去重操作；以及确定去重操作后剩余的一个或多个视频合集各自的合集标题。2.如权利要求1所述的方法，其中，获取待聚合的多个视频包括：在预设平台抓取多个视频，以所形成第二视频合集；以及对所述第二视频合集中的视频按作者进行归类，以将同一作者所对应的多个视频作为所述待聚合的多个视频。3.如权利要求2所述的方法，其中，在对所述第二视频合集中的视频按作者进行归类之前，还包括：基于视频的链接地址对所述第二视频合集中的视频进行去重操作。4.如权利要求1所述的方法，其中，对所述视频信息进行文字识别以确定所述每个视频所对应的一个或多个视频标签包括以下项中的至少一项：识别所述每个视频对应的文本信息中的关键字，以获得所述一个或多个视频标签；识别所述每个视频对应的文本信息中的预设字符，以基于所述预设字符获得所述一个或多个视频标签，所述预设字符包括以下项中的至少一项：括号、冒号、空格、问号；以及识别所述每个视频对应的文本信息中文本的字体大小，以基于所述字体大小获得所述一个或多个视频标签。5.如权利要求1所述的方法，还包括：对于所述一个或多个视频合集中的至少一个视频合集，基于预设视频标签对该视频合集中的视频进行细粒度划分，以在该视频合集中形成与所述预设视频标签相对应的子视频合集。6.如权利要求1或5所述的方法，其中，确定去重操作后剩余的一个或多个视频合集各自的合集标题包括：对于剩余的一个或多个视频合集中的每一个视频合集，确定该视频合集内所有视频对应的视频标题的最大公共子序列，以基于所述最大公共子序列确定该视频合集的合集标题。7.如权利要求6所述的方法，其中，确定该视频合集内所有视频对应的视频标题的最大公共子序列包括：在该视频合集内随机抽取N个视频对，其中N为正整数；对于所述N个视频对中的每一个视频对，确定该视频对中的两个视频所对应视频标题的最大公共子序列；以及确定所述N个视频对中出现次数最多的最大公共子序列，作为该视频合集内所有视频对应的视频标题的最大公共子序列。
8.如权利要求1或5所述的方法，其中，确定去重操作后剩余的一个或多个视频合集各自的合集标题包括：基于经训练的神经网络模型确定所述合集标题，其中所述神经网络模型基于以下操作训练得到：获取样本视频所对应的视频标题；对所述样本视频所对应的视频标题进行掩码操作，以屏蔽相应文本信息；将掩码操作后的所述视频标题输入神经网络模型进行预训练，以获得预训练后的神经网络模型，其中，在预训练过程中，所述神经网络模型用于预测所输入的视频标题中所屏蔽的文本信息；获取样本视频合集中的一个或多个视频对应的视频标题、以及所述样本视频合集对应的合集标题；将所述样本视频合集中的一个或多个视频对应的视频标题进行拼接；将所述拼接后的所述视频标题输入所述预训练后的神经网络模型，以获得预测得到的合集标题；以及基于所述预测得到的合集标题以及所述样本视频合集对应的合集标题对所述预训练后的神经网络模型的参数进行调节，以获得所述经训练的神经网络模型。9.一种视频聚合装置，包括：获取单元，配置为获取待聚合的多个视频；第一确定单元，配置为确定所述多个视频中的每个视频各自对应的视频信息，其中所述视频信息包括视频标题、图像以及描述文本中的至少一个，其中所述图像包括文字信息；第二确定单元，配置为对所述视频信息进行文字识别，以确定所述每个视频所对应的一个或多个视频标签；第三确定单元，配置为对于所述多个视频所...

【专利技术属性】
技术研发人员：王艺鹏，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人