【技术实现步骤摘要】
索引数据结构的性能测试方法、装置、设备及存储介质
[0001]本公开涉及计算机
,具体涉及结构化测试技术,尤其涉及一种索引数据结构的性能测试方法、索引数据结构的性能测试装置、电子设备及非瞬时计算机可读存储介质。
技术介绍
[0002]索引数据结构是搜索召回模块最重要的组成部分之一,索引数据结构可以理解为索引数据查询算法和索引数据存储方式的总和。在工业场景中,对索引数据进行查询的复杂度,主要受到索引数据查询算法的复杂度以及索引数据存储方式的共同影响。
[0003]因此,如何向索引数据结构开发者提供高性能、可扩展、数据时效性强的索引数据结构测试框架,是目前亟需解决的一个重要问题。
技术实现思路
[0004]本公开提供了一种用于索引数据结构的性能测试方法、索引数据结构的性能测试装置、电子设备和非瞬时计算机可读存储介质。
[0005]根据本公开的一方面,提供了一种索引数据结构的性能测试方法,包括:
[0006]获取与待测的目标索引数据结构匹配的测试配置信息,其中,测试配置信息中包括:测试 ...
【技术保护点】
【技术特征摘要】
1.一种索引数据结构的性能测试方法,包括:获取与待测的目标索引数据结构匹配的测试配置信息,其中,测试配置信息中包括:测试场景类型、测试指标类型、索引数据位置和查询序列位置;按照索引数据位置加载标准索引数据,并根据标准索引数据和目标索引数据结构,构建待测索引数据;按照查询序列位置加载标准查询序列,并按照测试场景类型加载目标测试场景;在目标测试场景中,针对标准查询序列在待测索引数据中进行索引查找测试,并生成与测试指标类型对应的性能测试结果。2.根据权利要求1所述的方法,还包括:获取统一数据格式的索引备选数据和查询备选序列;调用数据处理器,将索引备选数据生成第一标准格式的标准索引数据,并将查询备选序列生成第二标准格式的标准查询序列;将各标准索引数据和各标准查询序列存储于设定存储区域内。3.根据权利要求2所述的方法,其中,获取统一数据格式的索引备选数据和查询备选序列,包括:在至少一个搜索引擎服务器中,实时收集用户查询请求;根据实时收集到的用户查询请求,构建得到时序索引数据和时序查询序列;将时序索引数据转换为统一数据格式的索引备选数据,并将时序查询序列转换为统一数据格式的查询备选序列。4.根据权利要求3所述的方法,其中,根据实时收集到的用户查询请求,构建得到时序查询序列,包括:获取多个时间区间内的多组用户查询请求,并获取召回系统在多个时间区间内中的任一时间区间内所使用的目标索引数据;使用所述多组用户查询请求作为回放流量,分别对使用目标索引数据的召回系统进行测试;根据测试过程中生成的查询日志,生成时序查询序列。5.根据权利要求3所述的方法,其中,根据实时收集到的用户查询请求,构建得到时序查询序列,包括:获取固定时间区间内的目标用户查询请求,并获取召回系统在多个时间区间内所使用的多个区间索引数据;使用目标用户查询请求作为回放流量,对使用每个区间索引数据的召回系统分别进行测试;根据测试过程中生成的查询日志,生成时序索引数据。6.根据权利要求4或5所述的方法,其中,根据测试过程中生成的查询日志,生成时序查询序列或时序索引数据,包括:根据测试过程中生成的查询日志,构建原始四元组,其中,原始四元组中包括分域标识、字段标识、网址标识和查询标识;在各原始四元组中对相同查询标识的各字段标识和各网址标识进行归并处理,得到归并四元组作为时序查询序列或时序索引数据。
7.根据权利要求1所述的方法,其中,在目标测试场景中,针对标准查询序列在待测索引数据中进行索引查找测试,并生成与测试指标类型对应的性能测试结果,包括:根据标准查询序列以及待测索引数据构建基准测试脚本;将与目标测试场景匹配的第一类标准化接口,以及与测试指标类型对应的第二类标准化接口,分别加入至基准测试脚本中;通过执行基准测试脚本,生成所述性能测试结果。8.根据权利要求2所述的方法,还包括:检测存储区域内存储内容的数据量是否大于预设的存储数据量阈值;若是,则采用预设的压缩算法对存储内容进行压缩处理,并对压缩结果进行分区存储以及分片存储中的至少一项。9.一种索引数据结构的性能测试装置,包括:测试配置信息获取模块,用于获取与待测的目标索引数据结构匹配的测试配置信息,其中,测试配置信息中包括:测试场景类型、测试指标类型、索引数据位置和查询序列位置;待测索引数据构建模块,用于按照索引数据位置加载标准索引数据,并根据标准索引数据和目标索引数据结构,构建待测索引数据;信...
【专利技术属性】
技术研发人员:徐文栋,王宁,
申请(专利权)人:百度时代网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。