【技术实现步骤摘要】
基于知识图谱的视频标签提取方法
[0001]本专利技术涉及的是基于知识图谱的视频标签提取方法,属于深度学习、机器学习和知识图谱
技术介绍
[0002]在信息的基础上,建立实体之间的联系,就能形成“知识”,知识图谱就是这样由一条条知识组成的,每条知识表示为一个spo三元组。知识图谱是Google于2012年提出的,目的是用来优化搜索结果,让计算机理解人类信息内在的相关性。
[0003]经过多年的发展,知识图谱在人工智能的许多行业都拥有了成熟落地的应用。按照知识图谱的覆盖面来看,主要分为通用知识图谱与行业知识图谱。
[0004]由于视频媒体行业的应用标签比较多样和多变,那么通过完全的深度学习模型去进行预测不太可行。关键词匹配算法是相较于正则搜索法效率较高的一种关键词搜索方法,这样的方法结合知识图谱正好可以应用在视频标签提取。对于视频来讲,直接处理视频或者图片本身去打标签的计算复杂度和设备要求比较高,因此,可以选择将视频的音频内容利用现在比较成熟的语音识别技术将其文本化,再处理文本,这样的经济效益要高很多 ...
【技术保护点】
【技术特征摘要】
1.基于知识图谱的视频标签提取方法,其特征是该方法基于深度学习自然语言处理技术和知识图谱技术,应用于视频媒体领域,包括:第一步,根据专业知识整理若干个基础知识包,并将这些基础知识包内的词组按照层级关系整理到excel并导入到知识图谱中,基础知识包是指某一个特定领域的基础知识的所有层级类别以及其对应的实体关键词;第二步,根据第一步得到的基础知识包的特征词的组合特征整理应用知识包,整理这些知识到excel并导入知识图谱中,应用知识包是指视频分类或者应用需要设定的某一些特定规则下的分类标签以及其对应的特征关键词;第三步,利用深度学习的语音识别技术,将视频的字幕信息识别出来,结合标题形成文档并进行预处理;第四步,利用自然语言处理中的关键词匹配技术,按第一步得到的基础知识包的类别分别查找第三步中得到的文档中的基础知识包内的末端节点的关键词及其基础知识包类别;第五步,利用第四步查找的关键词,反向搜索应用知识包标签,最后进行定制化微调,输出标签。2.如权利要求1所述的基于知识图谱的视频标签提取方法,其特征是所述的第一步中,利用Cypher的load csv命令导入到neo4j知识图谱中,设所有基础知识包的末端节点集合为baselist,baselist中包含了所有关键词。3.如权利要求2所述的基于知识图谱的视频标签提取方法,其特征是所述的第二步中,设所有应用知...
【专利技术属性】
技术研发人员:孙伟芳,朱立松,黄建杰,
申请(专利权)人:央视国际网络无锡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。