信息处理方法、装置、计算机设备以及存储介质制造方法及图纸

技术编号:37409286 阅读:25 留言:0更新日期:2023-04-30 09:35
本申请实施例公开了一种信息处理方法、装置、计算机设备以及存储介质,方法包括:获取搜索信息,基于搜索信息确定初始视频集;获取每个初始视频的视频描述信息,根据每个初始视频的视频描述信息,确定每个初始视频的实体集以及实体集中每个实体的实体信息;基于每个初始视频的视频描述信息以及每个初始视频对应的实体信息确定输入文本,以得到初始视频集对应的输入文本集;对每个输入文本进行类别识别,得到每个输入文本的类别识别结果;从输入文本集中确定目标输入文本,将目标输入文本中包括的视频描述信息对应的初始视频与搜索信息进行关联;目标输入文本包括:类别识别结果为目标类别识别结果的输入文本。以增强搜索信息与召回视频的关联性。召回视频的关联性。召回视频的关联性。

【技术实现步骤摘要】
信息处理方法、装置、计算机设备以及存储介质


[0001]本申请涉及计算机
,尤其涉及一种信息处理方法、装置、计算机设备以及存储介质。

技术介绍

[0002]随着计算机技术和多媒体技术的快速发展,越来越多的短视频可以被分享至各种平台,以供用户观看。通常,用户可以在各种视频平台上进行搜索操作,例如,在搜索输入框中输入相关搜索信息,以得到想要的短视频。目前,在基于用户的搜索信息进行视频推荐时,大多数是基于文本策略召回短视频,但这种策略可能仅是基于在搜索信息命中了某些查询词汇,如搜索信息“大江大河”所召回的短视频可能是关于江河的视频,这些召回视频中可能包含大量用户并不想观看的影视片段。因此,如何基于用户的搜索信息召回较为精确的短视频成为了当前研究热点。

技术实现思路

[0003]本申请实施例提供了一种信息处理方法、装置、计算机设备以及存储介质,可以根据用户的搜索信息挖掘出所需要的实体,使得基于搜索信息所得到的召回视频的视频内容中涉及这些实体,以有效增强搜索信息与召回视频的关联性,也便于后续可以实现更为精准的视频推荐,提高用户体验。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取用户输入的搜索信息,基于所述搜索信息确定初始视频集,所述初始视频集包括一个或多个初始视频;获取每个初始视频的视频描述信息,并根据所述每个初始视频的视频描述信息,确定所述每个初始视频的实体集以及所述实体集中每个实体的实体信息;基于所述每个初始视频的视频描述信息以及所述每个初始视频对应的实体信息确定输入文本,以得到所述初始视频集对应的输入文本集;所述输入文本集包括一个或多个输入文本,一个输入文本对应一个视频描述信息以及一个实体的实体信息;对每个输入文本进行类别识别,得到所述每个输入文本的类别识别结果;从所述输入文本集中确定目标输入文本,并将所述目标输入文本中包括的视频描述信息对应的初始视频与所述搜索信息进行关联;所述目标输入文本包括:类别识别结果为目标类别识别结果的输入文本。2.根据权利要求1所述的方法,其特征在于,所述根据所述每个初始视频的视频描述信息,确定所述每个初始视频的实体集以及所述实体集中每个实体的实体信息,包括:针对所述初始视频集中的任一初始视频,将所述任一初始视频的视频描述信息与知识库中的多个参考实体进行匹配,并将匹配到的参考实体添加到所述任一初始视频的实体集中,所述实体集中包括一个或多个实体;利用所述知识库中实体的实体属性构建所述每个实体的实体信息。3.根据权利要求2所述的方法,其特征在于,所述利用所述知识库中实体的实体属性构建所述每个实体的实体信息,包括:针对所述实体集中的任一实体,从知识库中获取所述任一实体对应的一个或多个实体属性;按照预设属性组合规则将所述一个或多个实体属性以及所述任一实体进行组合,得到所述任一实体的实体信息。4.根据权利要求1所述的方法,其特征在于,所述对每个输入文本进行类别识别,得到所述每个输入文本的类别识别结果之前,包括:获取训练文本集,基于所述训练文本集对预训练模型进行训练,得到文本识别模型,所述训练文本集包括一个或多个训练文本;所述对每个输入文本进行类别识别,得到所述每个输入文本的类别识别结果,包括:调用所述文本识别模型对每个输入文本进行类别识别,得到所述每个输入文本的类别识别结果。5.根据权利要求4所述的方法,其特征在于,所述调用所述文本识别模型对每个输入文本进行类别识别,得到所述每个输入文本的类别识别结果,包括:针对所述输入文本集中的任一输入文本,利用文本识别模型对所述任一输入文本中的指定位置进行掩码处理,得到所述文本识别模型关联参考字典中所有参考数据对应的概率集合;所述任一输入文本中指定位置对应的数据用于指示所述任一输入文本的类别识别结果,所述概率集合包括:所述参考字典中每个参考数据在所述指定位置的出现概率;从所述概率集合中获取多个指定数据的出现概率,并将最大出现概率对应的指定数据作为所述任一输...

【专利技术属性】
技术研发人员:李作潮
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1