一种数据检索方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24574805 阅读:44 留言:0更新日期:2020-06-21 00:13
本申请提供了一种数据检索方法、装置、电子设备及存储介质,属于数据处理技术领域。所述方法包括:接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;根据所述多个待匹配的关键词,构建关键词字典树;针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;根据匹配到关键词的视频相关数据,生成检索结果。采用本申请提供的技术方案,可以提高数据检索的准确率。

A data retrieval method, device, electronic equipment and storage medium

【技术实现步骤摘要】
一种数据检索方法、装置、电子设备及存储介质
本申请涉及计算机
,特别是涉及一种数据检索方法、装置、电子设备及存储介质。
技术介绍
为了净化网络环境,需要对视频网站的数据库中存储的全部视频相关数据进行审核清查,即,视频网站的服务器在数据库存储的全部视频相关数据中查找与预设关键词匹配的视频相关数据,再由人工复检查找到的视频相关数据,删除未通过人工复检的视频相关数据。相关技术中,为了便于数据检索,服务器可以采用分词存储方式存储视频相关数据,例如,在存储某一视频的视频名称时,服务器可以对该视频的视频名称“海绵宝宝在做饭”进行分词处理,得到分词“海绵宝宝”、“在”和“做饭”,然后,服务器可以存储得到的分词。后续进行审核清查时,服务器可以针对每个视频相关数据,将该视频相关数据包含的每个分词与每个待匹配的关键词进行匹配。如果匹配成功,则服务器可以将该视频相关数据作为需要进行人工复检的视频相关数据。然而,由于对同一视频相关数据采用不同的分词处理方式,得到的分词也会不同,因此,某一视频相关数据包含的某一关键词可能在分词处理时被解析为不同的分词,导致审核清查时服务器无法在该视频相关数据包含的分词中匹配到该关键词,数据检索的准确率低。
技术实现思路
本申请实施例的目的在于提供一种数据检索方法、装置、电子设备及存储介质,以提高数据检索的准确率。具体技术方案如下:在本申请实施的第一方面,首先提供了一种数据检索方法,所述方法包括:接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;根据所述多个待匹配的关键词,构建关键词字典树;针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;根据匹配到关键词的视频相关数据,生成检索结果。在本申请实施的第二方面,提供了一种数据检索装置,所述装置包括:接收模块,用于接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;构建模块,用于根据所述多个待匹配的关键词,构建关键词字典树;匹配模块,用于针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;生成模块,用于根据匹配到关键词的视频相关数据,生成检索结果。在本申请实施的第三方面,提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现任一第一方面所述的方法步骤。在本申请实施的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现任一第一方面所述的方法步骤。在本申请实施的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一第一方面所述的方法步骤。本申请实施例提供的一种数据检索方法、装置、电子设备及存储介质,可以接收数据检索请求,数据检索请求携带有多个待匹配的关键词;根据多个待匹配的关键词,构建关键词字典树;针对待匹配的视频相关数据,通过该视频相关数据遍历关键词字典树,以对该视频相关数据与多个待匹配的关键词进行匹配;根据匹配到关键词的视频相关数据,生成检索结果。由于通过视频相关数据遍历关键词字典树,以对该视频相关数据与多个待匹配的关键词进行匹配,能够实现无需对视频相关数据进行分词处理,即可确定出视频相关数据包含的关键词,因此,能够避免视频相关数据包含的某一关键词被解析为不同的分词时,无法匹配到该关键词的问题,从而能够提高数据检索的准确率。当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。图1为本申请实施例提供的一种数据检索方法的流程图;图2a为本申请实施例提供的一种关键词字典树的示例图;图2b为本申请实施例提供的另一种关键词字典树的示例图;图3为本申请实施例提供的另一种数据检索方法的流程图;图4为本申请实施例提供的另一种数据检索方法的流程图;图5为本申请实施例提供的一种数据检索方法的示例图;图6为本申请实施例提供的一种数据检索装置的结构示意图;图7为本申请实施例提供的另一种数据检索装置的结构示意图;图8为本申请实施例提供的另一种数据检索装置的结构示意图;图9为本申请实施例提供的另一种数据检索装置的结构示意图;图10为本申请实施例提供的另一种数据检索装置的结构示意图;图11为本申请实施例提供的另一种数据检索装置的结构示意图;图12为本申请实施例提供的另一种数据检索装置的结构示意图;图13为本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。本申请实施例提供了一种数据检索方法,该方法可以应用于视频网站的服务器。采用本申请实施例提供的数据检索方法,服务器可以对视频网站的数据库中存储的全部视频相关数据进行审核清查,即,服务器在数据库存储的全部视频相关数据中查找与关键词匹配的视频相关数据,再由人工复检查找到的视频相关数据,删除未通过人工复检的视频相关数据。其中,视频相关数据可以是视频名称、图片名称、视频简介、弹幕和用户名等。下面将结合具体实施方式,对本申请实施例提供的一种数据检索方法进行详细的说明,如图1所示,具体步骤如下:步骤101、接收数据检索请求。其中,数据检索请求携带有多个待匹配的关键词。在实施中,审核人员的控制端中可以预先安装有审核系统,当需要进行审核清查时,审核人员可以对控制端执行预设操作,以使控制端生成数据检索请求,向服务器发送数据检索请求。预设操作可以是在审核系统中的预设输入框中输入多个待匹配的关键词,预设操作也可以是在审核系统中的预设输入框中输入多个待匹配的关键词、待筛选的视频相关数据的属性信息。属性信息包括数据上传时间、数据来源、数据格式、数据分类中的至少一种。由此,服务器可以接收到携带有多个待匹配的关键词的数据检索请求。例如,数据检索请求可以携带有5个待匹配的关键词,5个关键词分别为:海绵宝宝、做手术、爱莎公主、乐园、生日派对。可选的,审核人员可以通过多种方式获取关键词:例如,审核人员可以从预先存储的敏感词库中选取词语,作为待匹配的关键词。敏感词库包含不适合在线上显示的词语、词语的词语属性、词语的敏感程度、用于筛选该词语的词语属性关联条件等。或者,审核人员可以将当前热点事件的检索关键词,作为待匹配的关键词。步骤102、根据多个待匹配的关键词,构建关键词字典树。本申请实施例以多个待匹配的关键词为how、he和her为例本文档来自技高网...

【技术保护点】
1.一种数据检索方法,其特征在于,所述方法包括:/n接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;/n根据所述多个待匹配的关键词,构建关键词字典树;/n针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;/n根据匹配到关键词的视频相关数据,生成检索结果。/n

【技术特征摘要】
1.一种数据检索方法,其特征在于,所述方法包括:
接收数据检索请求,所述数据检索请求携带有多个待匹配的关键词;
根据所述多个待匹配的关键词,构建关键词字典树;
针对待匹配的视频相关数据,通过该视频相关数据遍历所述关键词字典树,以对该视频相关数据与所述多个待匹配的关键词进行匹配;
根据匹配到关键词的视频相关数据,生成检索结果。


2.根据权利要求1所述的方法,其特征在于,所述根据匹配到关键词的视频相关数据,生成检索结果,包括:
针对每个匹配到关键词的视频相关数据,判断与该视频相关数据匹配的关键词是否满足关键词筛选条件;
如果与该视频相关数据匹配的关键词满足所述关键词筛选条件,则根据该视频相关数据,生成检索结果。


3.根据权利要求2所述的方法,其特征在于,所述判断与该视频相关数据匹配的关键词是否满足关键词筛选条件,包括:
如果该视频相关数据匹配到至少两个关键词,则获取所述至少两个关键词的词语属性,所述词语属性包括词性、词语分类类别;
如果所述至少两个关键词的词语属性满足词语属性关联条件,则判定与该视频相关数据匹配的关键词满足关键词筛选条件;
如果所述至少两个关键词的词语属性不满足词语属性关联条件,则判定与该视频相关数据匹配的关键词不满足关键词筛选条件。


4.根据权利要求3所述的方法,其特征在于,所述获取所述至少两个关键词的词语属性之后,还包括:
生成包含所述至少两个关键词的词性的词性组合,包含所述至少两个关键词的词语分类类别的分类类别组合;
所述如果所述至少两个关键词的词语属性满足词语属性关联条件,则判定与该视频相关数据匹配的关键词满足关键词筛选条件,包括:
如果所述词性组合为预设词性组合、且所述分类类别组合为预设分类类别组合,则判定与该视频相关数据匹配的关键词满足关键词筛选条件。


5.根据权利要求2所述的方法,其特征在于,所述判断与该视频相关数据匹配的关键词是否满足关键词筛选条件,包括:
判断与该视频相关数据匹配的关键词的数目是否达到预设数目阈值;
如果所述数目达到所述预设数目阈值,则判定与该视频相关数据匹配的关键词满足关键词筛选条件;
如果所述数目未达到所述预设数目阈值,则判定与该视频相关数据匹配的关键词不满足关键词筛选条件。


6.根据权利要求1所述的方法,其特征在于,所述数据检索请求还携带有属性信息筛选条件...

【专利技术属性】
技术研发人员:王雪锋袁玮玮
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1