用于生成信息的方法和装置制造方法及图纸

技术编号：25224107 阅读：11 留言：0更新日期：2020-08-11 23:13

本申请公开了用于生成信息的方法和装置，涉及知识图谱领域。具体实现方案为：从目标视频中获取多个标签实体词，其中，标签实体词包括人物实体词、作品实体词、视频类别实体词和视频核心实体词，视频核心实体词包括用于表征目标视频相关内容的实体词；针对多个标签实体词中的标签实体词，将该标签实体词链接到预先设置的知识图谱中的节点上；基于各标签实体词的链接结果，确定目标视频的语义信息；按照知识图谱中节点和边的关系，对目标视频的语义信息进行结构化，得到目标视频结构化的语义信息。该实现方式采用知识图谱生成视频结构化的语义信息，在保留视频语义信息的同时，语义信息的结构化可以提高视频在推荐、搜索等中的效率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成信息的方法和装置
本公开的实施例涉及计算机
，具体涉及知识图谱

技术介绍
随着互联网上视频资源增多，有越来越多视频相关的产品，例如视频推荐以及视频搜索等等。相关技术中，视频搜索或者视频推荐通常采用视频标签技术，给视频资源设置对应的标签。然后，基于标签对视频进行推荐，或者基于标签建立索引，实现视频的推荐或搜索。通常情况下，视频的标签是扁平的无结构化的，并且视频的标签也不包含视频的语义信息，并不适用于视频推荐、搜索等。
技术实现思路
提供了一种用于生成信息的方法、装置、设备以及存储介质。根据第一方面，提供了一种用于生成信息的方法，该方法包括：从目标视频中获取多个标签实体词，其中，标签实体词包括人物实体词、作品实体词、视频类别实体词和视频核心实体词，视频核心实体词包括用于表征目标视频相关内容的实体词；针对多个标签实体词中的标签实体词，将该标签实体词链接到预先设置的知识图谱中的节点上；基于各标签实体词的链接结果，确定目标视频的语义信息；按照知识图谱中节点和边的关系，对目标视频的语义信息进行结构化，得到目标视频结构化的语义信息。根据第二方面，提供了一种用于生成信息的装置，该装置包括：获取单元，被配置成从目标视频中获取多个标签实体词，其中，标签实体词包括人物实体词、作品实体词、视频类别实体词和视频核心实体词，视频核心实体词包括用于表征目标视频相关内容的实体词；链接单元，被配置成针对多个标签实体词中的标签实体词，将该标签实体词链接到预先设置的知识图谱中的节...

【技术保护点】
1.一种用于生成信息的方法，包括：/n从目标视频中获取多个标签实体词，其中，所述标签实体词包括人物实体词、作品实体词、视频类别实体词和视频核心实体词，所述视频核心实体词包括用于表征所述目标视频相关内容的实体词；/n针对所述多个标签实体词中的标签实体词，将该标签实体词链接到预先设置的知识图谱中的节点上；/n基于各所述标签实体词的链接结果，确定所述目标视频的语义信息；/n按照所述知识图谱中节点和边的关系，对所述目标视频的语义信息进行结构化，得到所述目标视频结构化的语义信息。/n

【技术特征摘要】
1.一种用于生成信息的方法，包括：
从目标视频中获取多个标签实体词，其中，所述标签实体词包括人物实体词、作品实体词、视频类别实体词和视频核心实体词，所述视频核心实体词包括用于表征所述目标视频相关内容的实体词；
针对所述多个标签实体词中的标签实体词，将该标签实体词链接到预先设置的知识图谱中的节点上；
基于各所述标签实体词的链接结果，确定所述目标视频的语义信息；
按照所述知识图谱中节点和边的关系，对所述目标视频的语义信息进行结构化，得到所述目标视频结构化的语义信息。

2.根据权利要求1所述的方法，其中，在得到所述目标视频结构化的语义信息之后，所述方法还包括：
基于所述目标视频结构化的语义信息，生成所述目标视频的结构化子图；
将所述结构化子图输入预先训练的向量化模型，得到所述目标视频结构化的语义信息的向量，其中，所述向量化模型用于表征结构化子图与结构化的语义信息的向量之间的对应关系。

3.根据权利要求2所述的方法，其中，所述向量化模型通过图神经网络或图嵌入算法训练得到。

4.根据权利要求1所述的方法，其中，所述从目标视频中获取多个标签实体词，包括：
对所述目标视频进行人脸识别，获取所述目标视频的人物实体词；
对所述目标视频进行视频指纹识别，获取所述目标视频的作品实体词；
基于所述目标视频的图像内容、音频内容和文本内容的识别结果，获取所述目标视频的视频类别实体词和视频核心实体词。

5.根据权利要求1所述的方法，其中，在针对所述多个标签实体词中的标签实体词，将该标签实体词链接到预先设置的知识图谱中的节点上之后，所述方法还包括：
基于各所述标签实体词的链接结果，判断各所述标签实体词中是否存在无关实体词，其中，所述无关实体词为所述多个标签实体词中与所述目标视频不相关的实体词；
响应于确定出所述标签实体词为无关实体词，删除所述无关实体词。

6.根据权利要求1-5之一所述的方法，其中，所述基于各所述标签实体词的链接结果，确定所述目标视频的语义信息，包括：
基于各所述标签实体词的链接结果，获取该各述标签实体词的属性信息；
基于各所述标签实体词的链接结果，按照所述知识图谱中边的关系对所述标签实体词进行扩展，得到所述目标视频的扩展信息；
将各所述标签实体词的属性信息和所述扩展信息确定为所述目标视频的语义信息。

7.一种用于生成信息的装置，包括：
获取单元，被配置成从目标视频中获取多个标签实体词，其中，所述标签实体词包括人物实体词、作品实体词、视频类别实体词和视频核心实体词，所述视频核心实体词包...

【专利技术属性】
技术研发人员：王述，任可欣，张晓寒，冯知凡，柴春光，朱勇，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人