一种视频信息获取方法、装置、设备和存储介质制造方法及图纸

技术编号:36390387 阅读:6 留言:0更新日期:2023-01-18 09:54
本申请公开了一种视频信息获取方法、装置、设备和存储介质,该方法包括:获取视频数据;其中,视频数据包括视频以及视频的初始文本信息;对初始文本信息进行实体识别,得到实体信息;利用实体信息得到视频的补充文本信息;将初始文本信息及补充文本信息作为视频的关联信息;其中,关联信息用于与视频一并保存至影视库中,初始文本信息及补充文本信息用于在影视库中对视频的搜索。通过上述方式,本申请能够提高视频的召回率和相关性。请能够提高视频的召回率和相关性。请能够提高视频的召回率和相关性。

【技术实现步骤摘要】
一种视频信息获取方法、装置、设备和存储介质


[0001]本申请涉及视频信息处理
,特别是涉及一种视频信息获取方法、装置、设备和存储介质。

技术介绍

[0002]随着视频的兴起,观看视频的人越来越多。现有的影视库大多通过用户上传的名称进行信息录入,然后上传至可存储的数据库保存。然而,大多的视频媒资为引人眼球,取的名称十分浮夸,仅按照用户上传的名称进行信息录入,当其他用户想观看目标视频时,会出现召回率和相关性低的问题。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种视频信息获取方法、装置、设备和存储介质,能够提高视频的召回率和相关性。
[0004]为解决上述技术问题,本申请第一方面提供了一种视频信息获取方法,该方法包括:获取视频数据;其中,视频数据包括视频以及视频的初始文本信息;对初始文本信息进行实体识别,得到实体信息;利用实体信息得到视频的补充文本信息;将初始文本信息及补充文本信息作为视频的关联信息;其中,关联信息用于与视频一并保存至影视库中,初始文本信息及补充文本信息用于在影视库中对视频的搜索。
[0005]为解决上述技术问题,本申请第二方面提供了一种视频信息获取装置,该装置包括:第一获取模块,用于获取视频数据;其中,视频数据包括视频以及视频的初始文本信息;实体识别模块,用于对初始文本信息进行实体识别,得到实体信息;第二获取模块,用于利用实体信息得到视频的补充文本信息;存储模块,用于将初始文本信息及补充文本信息作为视频的关联信息;其中,关联信息用于与视频一并保存至影视库中,初始文本信息及补充文本信息用于在影视库中对视频的搜索。
[0006]为解决上述技术问题,本申请第三方面提供了一种视频信息获取设备,该电子设备包括:相互耦接的存储器和处理器,存储器存储有程序指令;处理器用于执行存储器中存储的程序指令,以实现上述第一方面所述的方法。
[0007]为解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,该计算机可读存储介质用于存储程序指令,程序指令能够被执行以实现上述第一方面所述的方法。
[0008]本申请的有益效果是:区别于现有技术的情况,本申请获取视频的初始文本信息后,对初始文本信息进行实体识别,得到实体信息,再利用实体信息得到视频的补充文本信息;将初始文本信息及补充文本信息作为视频的关联信息;其中,关联信息用于与视频一并保存至影视库中,初始文本信息及补充文本信息用于在影视库中对视频的搜索。将初始文本信息及补充文本信息均保存在影视库中,用户在搜索视频时,即可以基于搜索信息与初始文本信息及补充文本信息的匹配度,返回对应的视频。故相对于仅将初始文本信息保存
至影视库的方案,本申请将初始文本信息及补充文本信息均保存在影视库中,可以提高视频的召回率和相关性。
附图说明
[0009]图1是本申请提供的视频信息获取方法第一实施方式的流程示意图;
[0010]图2是本申请提供的数据映射信息表一实施方式的示意图;
[0011]图3是本申请提供的视频信息获取方法第二实施方式的流程示意图;
[0012]图4是本申请提供的视频信息获取方法第三实施方式的流程示意图;
[0013]图5是本申请提供的实体识别模型一实施方式的示意图;
[0014]图6是本申请提供的视频信息获取装置一实施方式的框架示意图;
[0015]图7是本申请提供的视频信息获取装置另一实施方式的示意图;
[0016]图8是本申请提供的视频信息获取设备一实施方式的框架示意图;
[0017]图9是本申请计算机可读存储介质一实施方式的框架示意图。
具体实施方式
[0018]下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]需要说明的是,本申请实施例中有涉及“第一”、“第二”等的描述,该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
[0020]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0021]请参阅图1和图2,图1是本申请提供的视频信息获取方法第一实施方式的流程示意图,图2是本申请提供的数据映射信息表一实施方式的示意图;该方法包括:
[0022]S11:获取视频数据。
[0023]在一实施方式中,视频数据包括视频以及视频的初始文本信息。视频的初始文本信息可以是上传视频的用户对视频的关键信息进行总结后得到的信息,例如初始文本信息包含视频的名称、视频包含的人物、视频类别、视频简介、视频上映时间、视频评分等信息中的至少一者。可以理解地,初始文本信息还可以包含其他信息,此处不做具体限定。视频的初始文本信息还可以是视频需上传的平台的管理员对视频的关键信息进行总结后得到的信息,例如,视频需上传至腾讯视频平台,则可以由腾讯视频平台的管理员对视频的关键信息进行总结,得到初始文本信息。其中,视频可以是短视频。
[0024]S12:对初始文本信息进行实体识别,得到实体信息。
[0025]在一实施方式中,可以由实体识别模型对初始文本信息进行实体识别,得到实体
信息。实体识别模型可以包含三层,第一层先对初始文本信息进行编码,得到初始文本信息的第一编码特征,第一编码特征可以为初始文本信息包含的若干分词的分词特征;第二层对第一编码特征进行特征提取,得到第二编码特征,第二编码特征可以是初始文本信息的文本语义特征;第三层利用第二编码特征进行实体预测,得到实体信息,实体信息可以包含实体名称和实体标签,实体标签用于表示实体的类别,实体标签可以包括地名标签、人名标签、影片标签等。在其他实施方式中,也可以采用其他的方式(如算法)对初始文本信息进行实体识别,得到实体信息,此处不做具体限定。
[0026]在一实施方式中,可以直接对初始文本信息进行实体识别。在其他实施方式中,为了避免初始文本信息中存在异常信息,而导致实体识别结果准确度较低,可以先对初始文本信息进行清洗过滤,以过滤初始文本信息中的异常信息,得到过滤后的初始文本信息;再对过滤后的初始文本信息进行实体识别。其中,异常信息可以包括空格符号、杂乱符号中的至少一者。可以理解地,异常信息还可以包含其他信息,此处不做具体限定。
[0027]S13:利用实体信息得到视频的补充文本信息。
[0028]在一实施方式中,实体信息包含实体名称,可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频信息获取方法,其特征在于,所述方法包括:获取视频数据;其中,所述视频数据包括视频以及所述视频的初始文本信息;对所述初始文本信息进行实体识别,得到实体信息;利用所述实体信息得到所述视频的补充文本信息;将所述初始文本信息及所述补充文本信息作为所述视频的关联信息;其中,所述关联信息用于与所述视频一并保存至影视库中,所述初始文本信息及所述补充文本信息用于在所述影视库中对所述视频的搜索。2.根据权利要求1所述的方法,其特征在于,所述补充文本信息包括视频别名、视频标签、视频包含的人物、视频类别、视频简介中的至少一者;和/或,所述实体信息包括实体名称,所述利用所述实体信息得到所述视频的补充文本信息,包括:从知识库中获取与所述实体名称匹配的补充文本信息。3.根据权利要求1所述的方法,其特征在于,在所述对所述初始文本信息进行实体识别,得到实体信息之后,还包括:获取所述视频在目标信源的目标热度值;所述将所述初始文本信息及所述补充文本信息作为所述视频的关联信息,包括:将所述初始文本信息、所述补充文本信息以及所述目标热度值作为所述视频的关联信息。4.根据权利要求3所述的方法,其特征在于,所述获取所述视频在目标信源的目标热度值,包括:从至少一个其他信源获取所述视频的参考热度值;基于所述参考热度值、以及所述目标信源与所述至少一个其他信源之间的热度值关联关系,得到所述视频在所述目标信源的目标热度值。5.根据权利要求4所述的方法,其特征在于,所述热度值关联关系为线性关系;在基于所述参考热度值、以及所述目标信源与所述至少一个其他信源之间的热度值关联关系,得到所述视频在所述目标信源的目标热度值之前,所述方法还包括:获取若干样本视频在所述至少一个其他信源的第一热度值和所述若干样本视频在所述目标信源的第二热度值;利用所述第一热度值和所述第二热度值进行线性拟合,得到所述目标信源与所述至少一个其他信源之间的热度值关联关系。6.根据权利要求3所述的方法,其特征在于,所述获取所述视频在目标信源的目标热度值,包括:获取预设热度值作为所述视频在目标信源的目标热度值;在将所述视频的关联信息保存至所述影视库之后,还包括:间隔预设时间统计所述视频在所述目标信源的点击量;利用所述点击量更新所述目标热度值。7.根据权利要求1所述的方法,其特征在于,在所述获取视频数据之后,还包括:过滤所述初始文本信息中的异常信息,得到过滤后的初始文本信息;所述异常信息包括空格符号、杂乱符号中的至少一者;
所述对所述初始文本信息进行实体识别,得到实...

【专利技术属性】
技术研发人员:秦昊程磊杨阳陶亚洲杜文贺
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1