搜索引擎中相关性策略之间耦合度的分析方法及装置制造方法及图纸

技术编号:9087051 阅读:152 留言:0更新日期:2013-08-28 23:37
本发明专利技术提出一种搜索引擎中相关性策略之间耦合度的分析方法及装置,其中所述方法包括:获取搜索引擎中的相关性策略集合;对多个相关性策略进行分析以确定每个相关性策略中的策略生效位置;在每个相关性策略中的策略生效位置分别插入探针函数及每个策略生效位置对应的策略标识;以及向搜索引擎输入至少一个搜索词并根据搜索引擎输出的策略路径文件进行耦合度分析,其中,策略路径文件包括搜索引擎为至少一个搜索词调用的相关性策略所对应的策略标识。根据本发明专利技术实施例的方法,能够灵活控制耦合度分析的粗细粒度,且对搜索模块影响小,成本低,对相关性策略定位准确、迅速,提高了耦合度分析效率。

【技术实现步骤摘要】
搜索引擎中相关性策略之间耦合度的分析方法及装置
本专利技术涉及计算机
,特别涉及一种搜索引擎中相关性策略之间耦合度的分析方法及装置。
技术介绍
随着搜索引擎技术的不断发展,搜索引擎中相关性策略变得越来越复杂,策略相互之间很难避免耦合影响,目前搜索引擎的相关性策略耦合影响的分析方法主要有:1)通过分析不同策略在执行开始阶段有一个注册信息得到策略的执行情况(表示策略将要触发),进而获取不同策略间的耦合影响;2)通过分析策略内部打印的调试日志来分析策略间的耦合度;3)通过将一份万级数据量的随机请求作为输入源,对比新旧模块版本运行的输出结果,验证是否有差别,如果没有,则认为策略间无耦合影响。但是上述方法分别存在如下缺点:1)注册信息仅表示策略需要触发,但可能在执行过程中异常退出,策略不一定最终生效,因此据此分析耦合影响理解较粗、不准确;2)策略的调试日志杂乱无序,没有格式规范,不易筛选出有用信息,此方法执行成本较大;3)将万级数据量作为输入,对比新旧模块版本输出结果,运算量庞大,分析效率较低。
技术实现思路
本专利技术的旨在至少解决上述技术缺陷之一。为此,本专利技术第一个目的在于提出一种搜索引擎中相关性策略之间耦合度的分析方法,能够灵活控制耦合度分析的粗细粒度,且对搜索模块影响小,成本低,对相关性策略定位准确、迅速,提高了耦合度分析效率。本专利技术第二个目的在于提出一种搜索引擎中相关性策略之间耦合度的分析装置。为实现上述目的,根据本专利技术第一方面的实施例的搜索引擎中相关性策略之间耦合度的分析方法包括以下步骤:获取搜索引擎中的相关性策略集合,其中,所述相关性策略集合包括多个相关性策略;对所述多个相关性策略进行分析以确定所述每个相关性策略中的策略生效位置;在所述每个相关性策略中的策略生效位置分别插入探针函数及每个所述策略生效位置对应的策略标识,其中,所述探针函数用于在被执行时输出所述探针函数所对应的策略标识;以及向所述搜索引擎输入至少一个搜索词并根据所述搜索引擎输出的策略路径文件进行耦合度分析,其中,所述策略路径文件包括所述搜索引擎为所述至少一个搜索词调用的相关性策略所对应的策略标识。根据本专利技术实施例的搜索引擎中相关性策略之间耦合度的分析方法,在搜索引擎中的相关性策略的生效位置插入对应的探针函数和策略标识,并生成测策略路径文件,通过策略路径文件中的策略标识的对相关性策略间的耦合度进行分析,能够根据选择的策略标识的插入位置灵活控制耦合度分析的粗细粒度,能够成本低并准确的对搜索引擎相关性策略将耦合影响进行分析,并且提高了耦合度分析效率。为实现上述目的,根据本专利技术第二方面的实施例的搜索引擎中相关性策略之间耦合度的分析装置,包括:集合获取模块,用于获取搜索引擎中的相关性策略集合,其中,所述相关性策略集合包括多个相关性策略;分析模块,用于对所述多个相关性策略进行分析以确定所述每个相关性策略中的策略生效位置;插入模块,用于在所述每个相关性策略中的策略生效位置分别插入探针函数及每个所述策略生效位置对应的策略标识,其中,所述探针函数用于在被执行时输出所述探针函数所对应的策略标识;以及耦合度分析模块,用于向所述搜索引擎输入至少一个搜索词并根据所述搜索引擎输出的策略路径文件进行耦合度分析,其中,所述策略路径文件包括所述搜索引擎为所述至少一个搜索词调用的相关性策略所对应的策略标识。根据本专利技术实施例的搜索引擎中相关性策略之间耦合度的分析装置,能够在搜索引擎中的相关性策略的生效位置插入对应的探针函数和策略标识,并生成测策略路径文件,通过策略路径文件中的策略标识的对相关性策略间的耦合度进行分析,能够根据选择的策略标识的插入位置灵活控制耦合度分析的粗细粒度,能够成本低并准确的对搜索引擎相关性策略将耦合影响进行分析,并且提高了耦合度分析效率。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的搜索引擎中相关性策略之间耦合度的分析方法的流程图;图2为根据本专利技术一个实施例的向搜索引擎输入至少一个搜索词并根据输出的策略路径文件进行耦合度分析的流程图;图3为根据本专利技术另一个实施例的搜索引擎中相关性策略之间耦合度的分析方法的流程图;图4为根据本专利技术又一个实施例的搜索引擎中相关性策略之间耦合度的分析方法的流程图;图5为根据本专利技术再一个实施例的搜索引擎中相关性策略之间耦合度的分析方法的流程图;图6为根据本专利技术一个实施例的搜索引擎中相关性策略之间耦合度的分析装置的结构框图;图7为根据本专利技术一个实施例的策略路径的示意图;图8为根据本专利技术一个实施例的策略标识的展现比例图;图9为根据本专利技术一个实施例的有向策略依赖图。具体实施方式下面详细描述本专利技术的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。下面参考附图描述根据本专利技术实施例的搜索引擎中相关性策略之间耦合度的分析方法。一种搜索引擎中相关性策略之间耦合度的分析方法,包括以下步骤:获取搜索引擎中的相关性策略集合,其中,相关性策略集合包括多个相关性策略;对多个相关性策略进行分析以确定每个相关性策略中的策略生效位置;在每个相关性策略中的策略生效位置分别插入探针函数及每个策略生效位置对应的策略标识,其中,探针函数用于在被执行时输出探针函数所对应的策略标识;以及向搜索引擎输入至少一个搜索词并根据搜索引擎输出的策略路径文件进行耦合度分析,其中,策略路径文件包括搜索引擎为至少一个搜索词调用的相关性策略所对应的策略标识。图1为根据本专利技术一个实施例的搜索引擎中相关性策略之间耦合度的分析方法的流程图。如图1所示,根据本专利技术实施例的搜索引擎中相关性策略之间耦合度的分析方法包括下述步骤。S101,获取搜索引擎中的相关性策略集合,其中,相关性策略集合包括多个相关性策略。具体地,搜索引擎中的相关性策略为根据一定信息和规则对搜索结果进行调权或调序的逻辑过程,也就是一段代码或函数集合,并通过搜索引擎最终对返回给用户的网页结果属性或展现形式产本文档来自技高网
...

【技术保护点】
一种搜索引擎中相关性策略之间耦合度的分析方法,其特征在于,包括以下步骤:获取搜索引擎中的相关性策略集合,其中,所述相关性策略集合包括多个相关性策略;对所述多个相关性策略进行分析以确定所述每个相关性策略中的策略生效位置;在所述每个相关性策略中的策略生效位置分别插入探针函数及每个所述策略生效位置对应的策略标识,其中,所述探针函数用于在被执行时输出所述探针函数所对应的策略标识;以及向所述搜索引擎输入至少一个搜索词并根据所述搜索引擎输出的策略路径文件进行耦合度分析,其中,所述策略路径文件包括所述搜索引擎为所述至少一个搜索词调用的相关性策略所对应的策略标识。

【技术特征摘要】
1.一种搜索引擎中相关性策略之间耦合度的分析方法,其特征在于,包括以下步骤:获取搜索引擎中的相关性策略集合,其中,所述相关性策略集合包括多个相关性策略;对所述多个相关性策略进行分析以确定每个所述相关性策略中的策略生效位置;在每个所述相关性策略中的策略生效位置分别插入探针函数及每个所述策略生效位置对应的策略标识,其中,所述探针函数用于在被执行时输出所述探针函数所对应的策略标识;以及向所述搜索引擎输入至少一个搜索词并根据所述搜索引擎输出的策略路径文件进行耦合度分析,其中,所述策略路径文件包括所述搜索引擎为所述至少一个搜索词调用的相关性策略所对应的策略标识。2.如权利要求1所述的方法,其特征在于,所述策略路径文件包括第一策略路径文件和第二策略路径文件,其中,所述向所述搜索引擎输入至少一个搜索词并根据输出的策略路径文件进行耦合度分析进一步包括:向所述搜索引擎输入所述至少一个搜索词以获取第一策略路径文件;修改所述多个相关性策略中的一个相关性策略,并再次向所述搜索引擎输入所述至少一个搜索词以获取第二策略路径文件;以及根据所述第一策略路径文件和第二策略路径文件获取所述一个相关性策略与所述多个相关性策略中其他相关性策略之间的耦合度。3.如权利要求2所述的方法,其特征在于,其中,所述第一策略路径文件和第二策略路径文件包括所述搜索引擎针对所述至少一个搜索词所调用的相关性策略的策略标识。4.如权利要求1-3任一项所述的方法,其特征在于,还包括:对所述多个相关性策略进行分析以确定所述每个相关性策略中的分支生效位置;以及在所述每个相关性策略中的分支生效位置分别插入探针函数及每个所述分支生效位置对应的分支标识,其中,所述探针函数用于在被执行时输出所述探针函数所对应的分支标识。5.如权利要求1所述的方法,其特征在于,所述搜索词为多个。6.如权利要求5所述的方法,其特征在于,所述多个搜索词通过在预设时间段内线上抓取,所述方法还包括:对所述多个搜索词输入所述搜索引擎所产生的多个策略路径文件进行分析;以及统计所述多个策略路径文件中策略标识的出现次数并根据所述出现次数进行所述多个策略路径文件的耦合度分析。7.如权利要求5所述的方法,其特征在于,所述多个搜索词覆盖所述多个相关性策略中的全部策略标识,其中,所述方法还包括:根据所述搜索引擎根据所述多个搜索词生成的多个策略路径文件生成策略依赖图;以及根据所述策略依赖图分析所述多个策略路径文件的耦合度。8.如权利要求6或7所述的方法,其特征在于,所述策略路径文件还包括所述搜索引擎针对所述至少一个搜索词所调用的相关性策略的分支标识。9.如权利要求8所述的方法,其特征在于,其中,一个相关性策略对应一个所述策略标识和一个或多个分支标识。10.一种搜索引擎中相关性策略之...

【专利技术属性】
技术研发人员:孙宇谭广明韩彦俊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1