点击日志的生成方法及装置,搜索结果调整方法及装置制造方法及图纸

技术编号:8532918 阅读:207 留言:0更新日期:2013-04-04 15:56
本发明专利技术提出了一种点击日志生成方法及利用该点击日志进行搜索结果调整的方法。该点击日志生成方法包括以下步骤:分析待测页面,以获得所述待测页面的URL;通过所述待测页面的URL以获得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源码中提取js函数调用;以及在浏览器之中执行所述js函数调用以生成相应的点击日志。通过本发明专利技术实施例,每分钟可生成约600条以上的点击日志,因此大幅度地提高了测试速度。此外,在执行过程中无需人工干预,所以节约了人工成本。

【技术实现步骤摘要】

本专利技术涉及互联网
,特别涉及一种点击日志的自动生成方法及装置,以 及利用该点击日志进行搜索结果调整的方法及装置。
技术介绍
在web应用领域之中,为了得到用户的行为,往往需要在页面上做一些监控,以记 录用户的点击行为。这样,每次点击都将会产生一条点击日志,并将该点击日志发送给服务 器端。后续,服务器端就可以根据大量的用户点击行为进行分析,并根据分析结果获得什么 样的检索结果更好,用户更喜欢,从而提高用户的满意度。目前,对于验证测试页面中点击统计功能是否正常,或者生成点击日志的功能来 说,主要还是通过手工的方式。例如,首先通过人工打开待测页面,并通过手动方式点击待 测页面里面的URL (Uniform Resource Locator,统一资源定位符),然后服务器端获得相应 的点击日志,并根据点击日志进行分析和统计,从而改善检索结果。现有技术存在以下缺点1、手工操作,消耗人力,且效率低下;2、虽然可以借助开源框架的 API (Application Programming Interface,应用程 序编程接口 )来点击,但是稳定性较差,而且速度比较慢;3、目前手动方式不够灵活,不能根据需求,点击特定的页面元素,产生需要的点击 日志。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一,特别是解决目前手动点击 生成点击日志的方式效率低下、不够灵活的缺陷,以及通过开源库的API进行点击的稳定 性差及速度慢的缺陷。本专利技术实施例第一方面提出了一种点击日志生成方法,包括以下步骤分析待测 页面,以获得所述待测页面的统一资源定位符URL ;解析所述待测页面所对应的URL以获得 所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源 码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中的待测页面元素 的URL、题目和标签;以及在浏览器之中执行所述js函数调用以生成相应的点击日志,并将 所述点击日志发送至服务器。本专利技术实施例第二方面提出了一种点击日志生成装置,包括分析模块,用于分析 待测页面,以获得所述待测页面的URL ;HTML源码获得模块,用于解析所述待测页面所对应 的URL以获得所述待测页面所对应的HTML源码;提取模块,用于在所述待测页面所对应的 所述HTML源码中提取所述待测页面元素对应的js函数调用,其中,所述js函数调用之中 填充有所述待测页面中的待测页面元素的URL、题目和标签;点击日志生成模块,用于在浏 览器之中执行所述js函数调用以生成相应的点击日志;以及发送模块,用于将所述点击日志发送至服务器。在本专利技术的一个实施例中,所述提取模块提取所述待测页面中所有能产生点击日 志的待测页面元素的js函数调用。在本专利技术的另一个实施例中,所述提取模块提取所述待测页面中配置项path对 应的页面节点内的所有待测页面元素的js函数调用。在本专利技术的再一个实施例中,所述提取模块提取所述待测页面中配置项fm_type 对应的类型的所述待测页面元素的js函数调用。本专利技术实施例首先通过开源库中的函数实现浏览器打开待检测页面,并通过开源 库函数获取待检测页面的HTML源码。然后,解析待检测页面的HTML源码,并在解析结果中 匹配待测页面元素的特性,从而找出所有待测页面元素的HTML源码。最后,分别从待测页 面元素的HTML源码中提取出js函数调用,并在浏览器端执行,即进行模拟点击,从而产生 待测页面元素的点击日志。通过本专利技术实施例,每分钟可生成约600条以上的点击日志,因 此大幅度地提高了测试速度。此外,在执行过程中无需人工干预,所以节约了人工成本。另外,由于现有技术中仅能测试少量的检索词,而本专利技术实施例可批量地测试大 数量的检索词,从而大幅度地提升了测试检索词的覆盖度。更为重要地,现有技术中仅能 对搜索结果页面元素进行抽样点击以生成点击日志,而本专利技术实施例可对待测页面的所有 待测页面元素进行模拟点击,或者仅针对某个页面节点内的所有待测页面元素进行模拟点 击,或者,仅针对性地对某类型的待测页面元素进行模拟点击并生成点击日志,因此本专利技术 实施例大幅提升了页面内可测元素的覆盖范围,并且在测试对象方面具有可控性。综上所示,本专利技术实施例可灵活地进行配置,因此能够支持当前所有的待测页面 元素以及未来新增的待测页面元素。本专利技术实施例第三方面还提出了一种搜索结果调整方法,包括以下步骤分析待 测页面,以获得所述待测页面的统一资源定位符URL ;解析所述待测页面所对应的URL以获 得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML 源码中提取所述待测页面元素对应的js函数调用,其中,所述js函数调用之中填充有所述 待测页面中的待测页面元素的URL、题目和标签;在浏览器之中执行所述js函数调用以生 成相应的点击日志,并将所述点击日志发送至服务器;所述服务器根据所述点击日志生成 搜索结果的权重;以及根据所述搜索结果的权重对搜索结构进行调整。本专利技术实施例第四方面还提出了一种搜索结果调整系统,包括终端,用于对待测 页面进行分析,并在所述待测页面所对应的HTML源码中提取js函数调用,在所述终端的浏 览器之中执行所述js函数调用以生成相应的点击日志,其中,所述js函数调用之中填充有 所述待测页面中的待测页面元素的URL、题目和标签;以及所述服务器,用于接收所述终端 发送的点击日志,并根据所述点击日志生成搜索结果的权重,以及根据所述搜索结果的权 重对搜索结构进行调整。在本专利技术实施例之中,服务器可以根据模拟的点击日志对搜索结果的权重进行调 整,从而使得搜索结果更准确,有效提高用户满意度。此外,由于本专利技术实施例采用模拟点 击的方式生成点击日志,具有速度快、效率高的优点,因此在此基础上可以根据用户的喜好 随时对检索词进行调整,并生成相应的点击日志,从而根据点击日志对搜索权重及时进行 调整,以更有针对性及更好地满足用户的需求,提高用户的满意度。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变 得明显和容易理解,其中图1为本专利技术实施例的点击日志生成方法的流程图2为本专利技术实施例打开待测页面的流程图3为本专利技术实施例一的js函数调用提取方法流程图图4为本专利技术实施例二的js函数调用提取方法流程图图5为本专利技术实施例三的js函数调用提取方法流程图图6为本专利技术实施例的点击日志生成装置结构图7为本专利技术实施例的搜索结果调整方法流程图8为本专利技术实施例的搜索结果调整系统结构图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖 直”、“水平”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是 为了便于描述本专利技术而不是要求本专利技术必须以特定的方位构造和操作,本文档来自技高网...

【技术保护点】
一种点击日志生成方法,其特征在于,包括以下步骤:分析待测页面,以获得所述待测页面的统一资源定位符URL;通过所述待测页面的URL以获得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及在浏览器之中执行所述js函数调用以生成相应的点击日志。

【技术特征摘要】
1.一种点击日志生成方法,其特征在于,包括以下步骤 分析待测页面,以获得所述待测页面的统一资源定位符URL ; 通过所述待测页面的URL以获得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及在浏览器之中执行所述js函数调用以生成相应的点击日志。2.如权利要求1所述的点击日志生成方法,其特征在于,还包括 通过Selenium开源库打开所述待测页面,并通过Selenium开源库中的get_location函数获得所述待测页面所对应的URL。3.如权利要求2所述的点击日志生成方法,其特征在于,所述通过Selenium开源库打开待测页面进一步包括 通过所述Selenium开源库打开所述浏览器的默认页面; 通过所述Selenium开源库中的ap1: type函数在所述默认页面的输入框中输入一个或多个检索词;以及 通过所述Selenium开源库中的click函数进行点击确认以打开所述待测页面。4.如权利要求3所述的点击日志生成方法,其特征在于,通过所述Selenium开源库中的run_SCript在所述浏览器中执行所述js函数调用。5.如权利要求1所述的点击日志生成方法,其特征在于,通过Ixml开源库解析所述待测页面所对应的URL以获得所述URL对应的HTML源码。6.如权利要求1所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括 从所述HTML源码中获得所有css selector为a[onmousedown]或者a[onclick]的待测页面元素,并将所述待测页面元素添加至第一列表; 遍历所述第一列表之中的待测页面元素,并提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用;以及将所述URL、题目和标签填充至所述js函数调用。7.如权利要求1所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括 根据配置项从所述HTML源码中获得满足所述配置项的页面节点,并将所述页面节点添加至第二列表; 从所述第二列表中获得一个页面节点; 从所述页面节点对应的HTML源码的标签内部获得所有css selector为a [onmousedown]或者a[onclick]的待测页面元素,并将获得的所述待测页面元素添加至第三列表; 遍历所述第三列表之中的待测页面元素,提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用; 将所述URL、题目和标签填充至所述js函数调用;以及 在生成点击日志之后,继续从所述第二列表中获得其他页面节点并获得所述其他页面节点内待测页面元素的js函数调用。8.如权利要求1-7任一项所述的点击日志生成方法,其特征在于,所述根据配置项从所述HTML源码中获得满足所述配置项的页面节点,并将所述页面节点添加至第二列表进一步包括 通过所述Selenium开源库中的getElement函数从所述HTML源码中获得所有满足所述配置项中给定path或者给定css selector的页面节点,并将所述页面节点添加至所述第二列表。9.如权利要求1-8任一项所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括 从所述HTML源码中获得所有css selector为a [onmousedown]或者a[onclick]的待测页面元素,并将所述待测页面元素添加至第四列表; 遍历所述第四列表之中的待测页面元素,并提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用; 根据所述js函数调用获得所述待测页面元素的类型; 判断所述待测页面元素的类型是否与配置项中指定的fm_type相同;以及 如果判断相同,则将所述URL、题目和标签填充至所述js函数调用。10.一种点击日志生成装置,其特征在于,包括 分析模块,用于分析所述待测页面,以获得待测页面的URL ; HTML源码获得模块,用于解析所述待测页面所对应的URL以获得所述待测页面所对应的HTML源码; 提取模块,用于在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及 点击日志生成模块,用于在浏览器之中执行所述js函数调用以生成相应的点击日志。11.如权利要求10所述的点击日志生成装置,其特征在于,所述待测页面开启模块通过Selenium开源库打开待测页面,且所述分析模块通过所述Selenium开源库中的get_location函数获得所述待测页面所对应的URL。12.如权利要求11所述的点击日志生成装置,其特征在于,所述待测页面开启模块进一步包括 开启子模块,用于通过所述Selenium开源库打开所述浏览器的默认页面; 输入子模块,用于通过所述Selenium开源库中的ap1:type函数在所述默认页面的输入框中输入一个或多个检索词;以及 点击确定子模块,用于通过所述Selenium开源库中的click函数进行点击确认以打开所述待测页面。13.如权利要求12所述的点击日志生成装置,其特征在于,所述点击日志生成模块通过所述Selenium开源库中的run_script在所述浏览器中执行所述js函数调用。14.如权利要求10所述的点击日志生成装置,其特征在于,所述HTML源码获得模块通过Ixml开源库解析所述待测页面所对应的URL以获得所述URL对应的HTML源码。15.如权利要求10所述的点击日志生成装置,其特征在于,所述提取模块提取所述待测页面中所有能产生点击日志的待测页面元素的js函数调用。16.如权利要求10所述的点击日志生成装置,其特征在于,所述提取模块提取所述待测页面中配置项path对应的页面节点内的所有待测页面元素的js函数调用。17.如权利要求10所述的点击日志生成装置,其特征在于,所述提取模块提取所述待测页面中配置项fm_type对应的类型的所述待测页面元素的js函数调用。18.一种搜索结果调整方法,其特征在于,包括以下步骤 分析待测页面,以获得所述待测页面的URL ; 解析所述待测页面所对应的URL以获得所述待测页面...

【专利技术属性】
技术研发人员:金敬亭乔敏
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1