【技术实现步骤摘要】
构建知识图谱的方法、装置、设备和计算机可读存储介质
[0001]本公开的实施例主要涉及信息处理领域,并且更具体地,涉及构建知识图谱和基于知识图谱生成视频的方法、装置、设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]当前,在创作视频时,用户需要手动搜索与视频所针对的对象相关联的各类可用的多模态数据(如文本、视频、声音等)作为素材来进行创作。然而,由于所搜索的内容的数据量较大和数据质量较低,并且人为收集和整理所搜索的素材低效和耗时,因此显著限制了视频生成的效率。
技术实现思路
[0003]根据本公开的示例实施例,提供了一种构建知识图谱和基于知识图谱生成视频的方案。
[0004]在本公开的第一方面中,提供了一种构建知识图谱的方法,包括:获取当前数据,当前数据具有多种预定数据格式中的一种数据格式;确定针对当前数据的第一关键短语,第一关键短语对应于当前数据的描述;以及基于第一关键短语和知识图谱中的节点所对应的第二关键短语的匹配度,构建知识图谱,第二关键短语对应于历史数据描述。
[0005]在本公开的第二方面中,提供了一种基于知识图谱生成视频的方法,包括:接收目标关键短语,其中目标关键短语用于描述视频;确定知识图谱中与目标关键短语相匹配的一个或多个目标节点,知识图谱中的节点对应于关键短语并且与多种预定数据格式的数据相关联;确定与一个或多个目标节点相关联的目标数据;以及将目标数据进行组合,以生成待合成视频。
[0006]在本公开的第三方面中,提供了一种构建知识图谱的装置,包 ...
【技术保护点】
【技术特征摘要】
1.一种构建知识图谱的方法,包括:获取当前数据,所述当前数据具有多种预定数据格式中的一种数据格式;确定针对所述当前数据的第一关键短语,所述第一关键短语对应于所述当前数据的描述;以及基于所述第一关键短语和所述知识图谱中的节点所对应的第二关键短语的匹配度,构建所述知识图谱,所述第二关键短语对应于历史数据描述。2.根据权利要求1所述的方法,其中确定针对所述当前数据的第一关键短语包括:生成所述当前数据的摘要,所述摘要的字数低于第一预定阈值;以及通过语义分析,从所述摘要中确定所述第一关键短语。3.根据权利要求1所述的方法,其中基于所述第一关键短语和所述知识图谱中的节点所对应的第二关键短语的匹配度,构建所述知识图谱包括:如果确定第一关键短语和所述第二关键短语的匹配度小于第二预定阈值,将所述第一关键短语所对应的节点加入所述知识图谱;以及将所述当前数据与所加入的节点相关联,以构建所述知识图谱。4.根据权利要求1所述的方法,其中基于所述第一关键短语和所述知识图谱中的节点所对应的第二关键短语的匹配度,构建所述知识图谱包括:如果确定第一关键短语和所述第二关键短语的匹配度大于第二预定阈值,比较所述当前数据和所述历史数据;以及如果确定所述当前数据和所述历史数据的匹配度小于第三预定阈值,将所述当前数据与所述节点相关联以构建所述知识图谱。5.根据权利要求1所述的方法,其中所述多种预定数据格式包括文本数据格式、图片数据格式、视频数据格式和声音数据格式中的至少一项。6.一种基于知识图谱生成视频的方法,包括:接收目标关键短语,其中所述目标关键短语用于描述所述视频;确定知识图谱中与所述目标关键短语相匹配的一个或多个目标节点,所述知识图谱中的节点对应于关键短语并且与多种预定数据格式的数据相关联;确定与所述一个或多个目标节点相关联的目标数据;以及将所述目标数据进行组合,以生成所述待合成视频。7.根据权利要求6所述的方法,其中确定与所述目标节点相关联的目标数据包括:获取与目标节点相关联的数据的关注度,所述关注度指示以下至少一项的数目:浏览、点击、点赞、评论和转发;以及将所述数据中的、关注度超过第一预定阈值的数据确定为所述目标数据。8.根据权利要求6所述的方法,其中所述知识图谱根据权利要求1至5中任一项所述的方法而被构建。9.一种构建知识图谱的装置,包括:数据获取模块,被配置为获取当前数据,所述当前数据具有多种预定数据格式中的一种数据格式;第一关键短语确定模块,被配置为确定针对所述当前数据的第一关键短语,所述第一关键短语对应于所述当前数据的描述;以及
第一构建模块,被配置为基于所述第一关键短语和所述知识图谱中的节点所对应的第二关键短语的匹配度,构建所述知识图谱,所述第二关键短语对应于历史数据描述。10.根据权利要求9所述的装置,其中所述第一关键短语确定模块包括:摘要生成模块,被配置为生成所述当前数据的摘要,所述摘要的字数低于第一预定阈值;以及第二关键短语确定模...
【专利技术属性】
技术研发人员:卞东海,彭卫华,罗雨,郑烨翰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。