视频标签的确定方法、装置和计算机设备制造方法及图纸

技术编号:24091649 阅读:47 留言:0更新日期:2020-05-09 08:20
本申请提出一种视频标签的确定方法、装置和计算机设备,涉及数据处理技术领域,其中,方法包括:对视频进行主题识别,得到根据视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的第一标签,根据第一标签,查询相关的第二标签,将第一标签和第二标签作为候选标签提取排序特征,根据排序特征,对各候选标签排序,根据排序从各候选标签中确定视频的目标标签,通过对视频的多维度信息识别确定第一标签,并根据第一标签查询相关的第二标签,基于第一标签和第二标签对应的多重有效信息,进行综合判断,提升了视频标签确定的准确性和标签的完整性,解决现有技术中标题信息不足或者误导带来的视频标签确定错误和漏召回的技术问题。

Determination method, device and computer equipment of video label

【技术实现步骤摘要】
视频标签的确定方法、装置和计算机设备
本申请涉及计算机
,尤其涉及数据处理
,具体涉及一种视频标签的确定方法、装置和计算机设备。
技术介绍
随着计算机技术和网络技术的发展,资讯信息的信息量剧增,基于用户兴趣点的个性化的资讯推荐是资讯消费的新潮流,其中视频资源尤其火爆。然而,要实现视频资源的个性化推荐,需要分析视频资源,实现视频资源的标签化。相关技术中,对视频资源分析,通常采用的做法是对视频的标题进行分析,获取视频资源的标签,但是,视频标题容易信息量不足,且部分情况下只看标题会被误导,导致视频资源标签确定的准确度较低。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种视频标签的确定方法,通过对视频的多维度信息进行识别确定第一标签,并根据第一标签查询相关的第二标签,基于第一标签和第二标签对应的多重有效信息,进行综合判断,提升了视频标签确定的准确性和标签的完整性。本申请的第二个目的在于提出一种视频标签的确定装置。本申请的第三个目的在于提出一种计算机设备。本申请的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本申请第一方面实施例提出了一种视频标签的确定方法,包括:对视频进行主题识别,得到第一标签;其中,所述第一标签是根据所述视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的;根据所述第一标签,查询相关的第二标签;将所述第一标签和所述第二标签作为候选标签提取排序特征;根据所述排序特征,对各候选标签排序;根据排序从所述各候选标签中,确定所述视频的目标标签。为达上述目的,本申请第二方面实施例提出了一种视频标签的确定装置,包括:识别模块,用于对视频进行主题识别,得到第一标签;其中,所述第一标签是根据所述视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的;查询模块,用于根据所述第一标签,查询相关的第二标签;提取模块,用于将所述第一标签和所述第二标签作为候选标签提取排序特征;排序模块,用于根据所述排序特征,对各候选标签排序;确定模块,用于根据排序从所述各候选标签中,确定所述视频的目标标签。为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面所述的视频标签的确定方法。为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的视频标签的确定方法。本申请实施例所提供的技术方案可以包含如下的有益效果:对视频进行主题识别,得到第一标签,其中,第一标签是根据视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的,根据第一标签,查询相关的第二标签,将第一标签和第二标签作为候选标签提取排序特征,根据排序特征,对各候选标签排序,根据排序从各候选标签中,确定视频的目标标签,通过对视频的多维度信息进行识别确定第一标签,并基于第一标签查询相关的第二标签,基于第一标签和第二标签的多重有效信息,进行综合判断,提升了视频标签确定的准确性和标签的完整性。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例所提供的一种视频标签的确定方法的流程示意图;图2为本申请实施例提供的知识图谱的示意图;图3为本申请实施例提供的关注点图谱的示意图;图4为本申请实施例提供的视频标签确定的框架示意图;图5为本申请实施例提供的一种视频标签的确定装置的结构示意图;以及图6为本申请实施例的视频标签的确定方法的电子设备的框图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的视频标签的确定方法、装置和计算机设备。当前,为线上用户进行个性化的视频资讯推荐是资讯消费的新潮流,而要进行视频资讯的个性化推荐,需要对视频资源进行分析,给视频资源打上精准和完善的标签,为视频的个性化推荐打下基础,现有技术中,确定视频的标签的方法主要为:方法一,对视频标题进行自动分析,具体地,利用统计分析的方法分析视频的标题文本,抽取用户的关注点,确定视频的标签,但是,视频标题通常较短,而且口语化较强,可利用的文本信息有限,同时,有些视频的标题还存在误导信息,导致视频标签确定的准确率低;方法二,基于视频内容进行人工标注,但是这种方式效率较低,成本较高。为此,本申请提出了一种视频标签的确定方法,对视频进行主题识别,得到第一标签,其中,第一标签是根据视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的,根据第一标签,查询相关的第二标签,将第一标签和第二标签作为候选标签提取排序特征,根据排序特征,对各候选标签排序,根据排序从各候选标签中,确定视频的目标标签,实现了基于第一标签和第二标签对应的多重有效信息,进行综合判断,提升了视频标签确定的准确性和标签的完整性。图1为本申请实施例所提供的一种视频标签的确定方法的流程示意图。如图1所示,该方法包括以下步骤:步骤101,对视频进行主题识别,得到第一标签,其中,第一标签是根据视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的。具体地,对视频的标题进行关键词识别,得到标题关键词,作为一种可能的实现方式,对视频标题进行短文本重要性分析,得到标题中各个词汇的重要性,基于词汇的重要性确定标题关键词;对视频进行图像内容识别,得到视频中包含的实体,例如,视频中出现的人脸、人名、地名以及出现的时间,或者是专有名词,例如,江苏省,飞机、夏季等;由于视频中包含字幕和左右两侧的节目信息,对视频进行文本识别,得到文本关键词,作为一种可能的实现方式,通过光学字符识别OCR图像识别技术对视频中的文本内容进行识别,得到图像的字幕文本,根据字幕文本的文本结构、语义和主题分类等,确定构成字幕文本的关键词,统计各关键词出现的频次,根据各关键词出现的频率确定文本关键词;根据视频的用户标注信息,识别有效信息,确定用户标注标签,进而根据标题关键词、实体、文本关键词、用户标注标签和视频分类中的多个,确定第一标签,本实施例中通过多种方式将视频的相关信息进行整合,将多维信息作为第一标签,以提高第一标签包含的信息。步骤102,根据第一标签,查询相关的第二标签。...

【技术保护点】
1.一种视频标签的确定方法,其特征在于,所述方法包括:/n对视频进行主题识别,得到第一标签;其中,所述第一标签是根据所述视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的;/n根据所述第一标签,查询相关的第二标签;/n将所述第一标签和所述第二标签作为候选标签提取排序特征;/n根据所述排序特征,对各候选标签排序;/n根据排序从所述各候选标签中,确定所述视频的目标标签。/n

【技术特征摘要】
1.一种视频标签的确定方法,其特征在于,所述方法包括:
对视频进行主题识别,得到第一标签;其中,所述第一标签是根据所述视频的标题、图像内容、文本内容、用户标注信息和视频分类中的多个确定的;
根据所述第一标签,查询相关的第二标签;
将所述第一标签和所述第二标签作为候选标签提取排序特征;
根据所述排序特征,对各候选标签排序;
根据排序从所述各候选标签中,确定所述视频的目标标签。


2.根据权利要求1所述的确定方法,其特征在于,所述对视频进行主题识别,得到第一标签,包括:
对视频的标题进行关键词识别,得到标题关键词;
对所述视频进行图像内容识别,得到实体;
对所述视频进行文本识别,得到文本关键词;
根据所述视频的用户标注信息,确定用户标注标签;
根据所述标题关键词、所述实体、所述文本关键词、所述用户标注标签和视频分类中的多个,确定所述第一标签。


3.根据权利要求1所述的确定方法,其特征在于,所述根据所述第一标签,查询相关的第二标签,包括:
对每一个所述第一标签,查询知识图谱,确定相关的第二标签;其中,所述知识图谱,用于采用相关的第二标签描述所述第一标签;
和/或,对每一个所述第一标签,查询关注点图谱;将共现概率大于阈值的标签作为相关的第二标签;其中,所述关注点图谱,用于指示各标签之间的共现概率。


4.根据权利要求1-3任一项所述的确定方法,其特征在于,所述将所述第一标签和所述第二标签作为候选标签提取排序特征,包括:
根据各候选标签指示的实体在所述视频的内容帧中的呈现信息,确定所述排序特征;
和/或,根据各候选标签指示的实体在所述视频的封面帧中的呈现信息,确定所述排序特征。


5.根据权利要求4所述的确定方法,其特征在于,所述根据各候选标签指示的实体在所述视频的内容帧中的呈现信息,确定所述排序特征,包括:
对每一个候选标签,确定呈现有相应实...

【专利技术属性】
技术研发人员:刘呈祥何伯磊肖欣延
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1