【技术实现步骤摘要】
一种数据检索方法、装置、电子设备及存储介质
本申请涉及计算机
,特别是涉及一种数据检索方法、装置、电子设备及存储介质。
技术介绍
为了净化网络环境,需要对视频网站的数据库中存储的全部视频相关数据进行审核清查,即,视频网站的服务器在数据库存储的全部视频相关数据中查找与预设关键词匹配的视频相关数据,再由人工复检查找到的视频相关数据,删除未通过人工复检的视频相关数据。相关技术中,为了便于数据检索,服务器可以采用分词存储方式存储视频相关数据,例如,在存储某一视频的视频名称时,服务器可以对该视频的视频名称“海绵宝宝在做饭”进行分词处理,得到分词“海绵宝宝”、“在”和“做饭”,然后,服务器可以存储得到的分词。后续进行审核清查时,服务器可以针对每个视频相关数据,将该视频相关数据包含的每个分词与每个待匹配的关键词进行匹配。如果匹配成功,则服务器可以将该视频相关数据作为需要进行人工复检的视频相关数据。然而,由于对同一视频相关数据采用不同的分词处理方式,得到的分词也会不同,因此,某一视频相关数据包含的某一关键词可能在分词处理时被解析为不同的分词,导致审核清查时服务器无法在该视频相关数据包含的分词中匹配到该关键词,数据检索的准确率低。
技术实现思路
本申请实施例的目的在于提供一种数据检索方法、装置、电子设备及存储介质,以提高数据检索的准确率。具体技术方案如下:在本申请实施的第一方面,首先提供了一种数据检索方法,所述方法包括:接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;根据所 ...
【技术保护点】
1.一种数据检索方法,其特征在于,所述方法包括:/n接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;/n根据所述多个待匹配的关键词,构建关键词字典树;/n针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;/n根据匹配到关键词的视频相关数据,生成检索结果。/n
【技术特征摘要】
1.一种数据检索方法,其特征在于,所述方法包括:
接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;
根据所述多个待匹配的关键词,构建关键词字典树;
针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;
根据匹配到关键词的视频相关数据,生成检索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据匹配到关键词的视频相关数据,生成检索结果,包括:
针对每个匹配到关键词的视频相关数据,判断与该视频相关数据匹配的关键词是否满足关键词筛选条件;
如果与该视频相关数据匹配的关键词满足所述关键词筛选条件,则根据该视频相关数据,生成检索结果。
3.根据权利要求2所述的方法,其特征在于,所述判断与该视频相关数据匹配的关键词是否满足关键词筛选条件,包括:
如果该视频相关数据匹配到至少两个关键词,则获取所述至少两个关键词的词语属性,所述词语属性包括词性、词语分类类别;
如果所述至少两个关键词的词语属性满足词语属性关联条件,则判定与该视频相关数据匹配的关键词满足关键词筛选条件;
如果所述至少两个关键词的词语属性不满足词语属性关联条件,则判定与该视频相关数据匹配的关键词不满足关键词筛选条件。
4.根据权利要求3所述的方法,其特征在于,所述获取所述至少两个关键词的词语属性之后,还包括:
生成包含所述至少两个关键词的词性的词性组合,包含所述至少两个关键词的词语分类类别的分类类别组合;
所述如果所述至少两个关键词的词语属性满足词语属性关联条件,则判定与该视频相关数据匹配的关键词满足关键词筛选条件,包括:
如果所述词性组合为预设词性组合、且所述分类类别组合为预设分类类别组合,则判定与该视频相关数据匹配的关键词满足关键词筛选条件。
5.根据权利要求2所述的方法,其特征在于,所述判断与该视频相关数据匹配的关键词是否满足关键词筛选条件,包括:
判断与该视频相关数据匹配的关键词的数目是否达到预设数目阈值;
如果所述数目达到所述预设数目阈值,则判定与该视频相关数据匹配的关键词满足关键词筛选条件;
如果所述数目未达到所述预设数目阈值,则判定与该视频相关数据匹配的关键词不满足关键词筛选条件。
6.根据权利要求1所述的方法,其特征在于,所述数据检索请求还携带有属性信息筛选条件...
【专利技术属性】
技术研发人员:王雪锋,袁玮玮,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。