【技术实现步骤摘要】
本专利技术涉及互联网
,特别涉及一种点击日志的自动生成方法及装置,以 及利用该点击日志进行搜索结果调整的方法及装置。
技术介绍
在web应用领域之中,为了得到用户的行为,往往需要在页面上做一些监控,以记 录用户的点击行为。这样,每次点击都将会产生一条点击日志,并将该点击日志发送给服务 器端。后续,服务器端就可以根据大量的用户点击行为进行分析,并根据分析结果获得什么 样的检索结果更好,用户更喜欢,从而提高用户的满意度。目前,对于验证测试页面中点击统计功能是否正常,或者生成点击日志的功能来 说,主要还是通过手工的方式。例如,首先通过人工打开待测页面,并通过手动方式点击待 测页面里面的URL (Uniform Resource Locator,统一资源定位符),然后服务器端获得相应 的点击日志,并根据点击日志进行分析和统计,从而改善检索结果。现有技术存在以下缺点1、手工操作,消耗人力,且效率低下;2、虽然可以借助开源框架的 API (Application Programming Interface,应用程 序编程接口 )来点击,但是稳定性较差,而且速度比较慢;3、目前手动方式不够灵活,不能根据需求,点击特定的页面元素,产生需要的点击 日志。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一,特别是解决目前手动点击 生成点击日志的方式效率低下、不够灵活的缺陷,以及通过开源库的API进行点击的稳定 性差及速度慢的缺陷。本专利技术实施例第一方面提出了一种点击日志生成方法,包括以下步骤分析待测 页面,以获得所述待测页面的统一资源定位符URL ;解析 ...
【技术保护点】
一种点击日志生成方法,其特征在于,包括以下步骤:分析待测页面,以获得所述待测页面的统一资源定位符URL;通过所述待测页面的URL以获得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及在浏览器之中执行所述js函数调用以生成相应的点击日志。
【技术特征摘要】
1.一种点击日志生成方法,其特征在于,包括以下步骤 分析待测页面,以获得所述待测页面的统一资源定位符URL ; 通过所述待测页面的URL以获得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及在浏览器之中执行所述js函数调用以生成相应的点击日志。2.如权利要求1所述的点击日志生成方法,其特征在于,还包括 通过Selenium开源库打开所述待测页面,并通过Selenium开源库中的get_location函数获得所述待测页面所对应的URL。3.如权利要求2所述的点击日志生成方法,其特征在于,所述通过Selenium开源库打开待测页面进一步包括 通过所述Selenium开源库打开所述浏览器的默认页面; 通过所述Selenium开源库中的ap1: type函数在所述默认页面的输入框中输入一个或多个检索词;以及 通过所述Selenium开源库中的click函数进行点击确认以打开所述待测页面。4.如权利要求3所述的点击日志生成方法,其特征在于,通过所述Selenium开源库中的run_SCript在所述浏览器中执行所述js函数调用。5.如权利要求1所述的点击日志生成方法,其特征在于,通过Ixml开源库解析所述待测页面所对应的URL以获得所述URL对应的HTML源码。6.如权利要求1所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括 从所述HTML源码中获得所有css selector为a[onmousedown]或者a[onclick]的待测页面元素,并将所述待测页面元素添加至第一列表; 遍历所述第一列表之中的待测页面元素,并提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用;以及将所述URL、题目和标签填充至所述js函数调用。7.如权利要求1所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括 根据配置项从所述HTML源码中获得满足所述配置项的页面节点,并将所述页面节点添加至第二列表; 从所述第二列表中获得一个页面节点; 从所述页面节点对应的HTML源码的标签内部获得所有css selector为a [onmousedown]或者a[onclick]的待测页面元素,并将获得的所述待测页面元素添加至第三列表; 遍历所述第三列表之中的待测页面元素,提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用; 将所述URL、题目和标签填充至所述js函数调用;以及 在生成点击日志之后,继续从所述第二列表中获得其他页面节点并获得所述其他页面节点内待测页面元素的js函数调用。8.如权利要求1-7任一项所述的点击日志生成方法,其特征在于,所述根据配置项从所述HTML源码中获得满足所述配置项的页面节点,并将所述页面节点添加至第二列表进一步包括 通过所述Selenium开源库中的getElement函数从所述HTML源码中获得所有满足所述配置项中给定path或者给定css selector的页面节点,并将所述页面节点添加至所述第二列表。9.如权利要求1-8任一项所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括 从所述HTML源码中获得所有css selector为a [onmousedown]或者a[onclick]的待测页面元素,并将所述待测页面元素添加至第四列表; 遍历所述第四列表之中的待测页面元素,并提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用; 根据所述js函数调用获得所述待测页面元素的类型; 判断所述待测页面元素的类型是否与配置项中指定的fm_type相同;以及 如果判断相同,则将所述URL、题目和标签填充至所述js函数调用。10.一种点击日志生成装置,其特征在于,包括 分析模块,用于分析所述待测页面,以获得待测页面的URL ; HTML源码获得模块,用于解析所述待测页面所对应的URL以获得所述待测页面所对应的HTML源码; 提取模块,用于在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及 点击日志生成模块,用于在浏览器之中执行所述js函数调用以生成相应的点击日志。11.如权利要求10所述的点击日志生成装置,其特征在于,所述待测页面开启模块通过Selenium开源库打开待测页面,且所述分析模块通过所述Selenium开源库中的get_location函数获得所述待测页面所对应的URL。12.如权利要求11所述的点击日志生成装置,其特征在于,所述待测页面开启模块进一步包括 开启子模块,用于通过所述Selenium开源库打开所述浏览器的默认页面; 输入子模块,用于通过所述Selenium开源库中的ap1:type函数在所述默认页面的输入框中输入一个或多个检索词;以及 点击确定子模块,用于通过所述Selenium开源库中的click函数进行点击确认以打开所述待测页面。13.如权利要求12所述的点击日志生成装置,其特征在于,所述点击日志生成模块通过所述Selenium开源库中的run_script在所述浏览器中执行所述js函数调用。14.如权利要求10所述的点击日志生成装置,其特征在于,所述HTML源码获得模块通过Ixml开源库解析所述待测页面所对应的URL以获得所述URL对应的HTML源码。15.如权利要求10所述的点击日志生成装置,其特征在于,所述提取模块提取所述待测页面中所有能产生点击日志的待测页面元素的js函数调用。16.如权利要求10所述的点击日志生成装置,其特征在于,所述提取模块提取所述待测页面中配置项path对应的页面节点内的所有待测页面元素的js函数调用。17.如权利要求10所述的点击日志生成装置,其特征在于,所述提取模块提取所述待测页面中配置项fm_type对应的类型的所述待测页面元素的js函数调用。18.一种搜索结果调整方法,其特征在于,包括以下步骤 分析待测页面,以获得所述待测页面的URL ; 解析所述待测页面所对应的URL以获得所述待测页面...
【专利技术属性】
技术研发人员:金敬亭,乔敏,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。