生成网页的方法和装置制造方法及图纸

技术编号:18444880 阅读:28 留言:0更新日期:2018-07-14 10:21
本申请公开了一种生成网页的方法和装置。该方法的一具体实施方式包括:响应于接收到用户的网页浏览请求,获取用户输入的搜索式;对该搜索式进行解析提取搜索目标词对,其中,搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;将搜索目标词对与根据网页浏览请求获取的所请求页面的各个页面元素内容对应的各个主题分别进行匹配;基于所匹配到的主题,选取所请求页面的页面元素内容进行排序生成网页。该实施方式可以根据用户的搜索式动态生成新网页,从而提高信息推送的针对性。

Methods and devices for generating web pages

The invention discloses a method and device for generating web pages. A specific implementation of this method includes: responding to the user's web browsing request, obtaining the search type of the user input, and extracting the search target word parse to the search formula, in which the search target words include a search object keyword and a search message keyword, and search target words to the root. According to the subject of the page, the page element content of the requested page is sorted to generate the web page. The implementation method can dynamically generate new web pages according to the user's search mode, so as to improve the pertinence of information push.

【技术实现步骤摘要】
生成网页的方法和装置
本申请涉及计算机
,具体涉及互联网
,尤其涉及生成网页的方法和装置。
技术介绍
用户通过互联网在终端搜索一些信息时,往往带有明显的搜索意图,例如用户在搜索医疗方面的信息时,输入搜索式“脑膜炎的症状”,意图是想获取“脑膜炎”这种精确疾病的相关信息,而当用户搜索“头痛是怎么回事”时,则主要是想获取引起头痛相关的原因以及可能的病症。目前,用户根据搜索结果点击进入的搜索结果页面往往是固定形式的页面,而当搜索结果页面包含多种信息时,用户在进入搜索结果页面后无法快速获取所需要的信息。因此,现有的搜索结果页面由于网页内容较固定,导致信息推送的针对性不高。
技术实现思路
本申请的目的在于提出一种改进的生成网页的方法和装置,来解决以上
技术介绍
部分提到的技术问题。一方面,本申请提供了一种生成网页的方法,该方法包括:响应于接收到用户的网页浏览请求,获取用户输入的搜索式;对该搜索式进行解析提取搜索目标词对,其中,搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;将搜索目标词对与根据网页浏览请求获取的所请求页面的各个页面元素内容对应的各个主题分别进行匹配;基于所匹配到的主题,选取所请求页面的页面元素内容进行排序生成网页。在一些实施例中,对上述搜索式进行解析提取搜索目标词对包括:对上述搜索式进行解析提取至少一个候选搜索目标词对,其中,每个搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;根据预先训练的对象重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对,其中,第一候选搜索目标词对包含所解析出的至少一个候选搜索目标词对中对象重要度系数最大的搜索对象关键词;根据预先训练的意图重要度系数,从第一候选搜索目标词对中选取出第二候选搜索目标词对,其中,第二候选搜索目标词对包括第一候选搜索目标词对中意图重要度系数最大的搜索对象关键词;将第二候选搜索目标词对确定为搜索目标词对。在一些实施例中,对上述搜索式进行解析提取至少一个候选搜索目标词对包括:将上述搜索式与预设对象关键词集合进行匹配,以确定候选搜索对象关键词;将上述搜索式与预设意图关键词集合进行匹配,以确定候选搜索意图关键词;基于对所确定的候选搜索对象关键词和候选搜索意图关键词,组合生成候选搜索目标词对。在一些实施例中,根据预先训练的对象重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对包括:确定各个候选搜索目标词对中的候选搜索对象关键词的所属对象类别;根据预先训练的搜索对象关键词所属对象类别的对象类别重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对,其中,第一候选搜索目标词对包含所属对象类别的对象类别重要度系数最大的搜索对象关键词。在一些实施例中,根据预先训练的意图重要度系数,从第一候选搜索目标词对中选取出第二候选搜索目标词对包括:确定各个候选搜索目标词对中的候选搜索意图关键词的所属意图类别;根据预先训练的搜索意图关键词所属意图类别的意图类别重要度系数,从第一候选搜索目标词对中选取出第二候选搜索目标词对,其中,第二候选搜索目标词对包含所属类别的意图类别重要度系数最大的搜索意图关键词。在一些实施例中,对象重要度系数以及意图重要度系数通过以下方法获取:获取一定数量的搜索式和用户根据搜索式所选择的主题作为样本;从样本中的每个搜索式中提取至少一个搜索对象关键词和至少一个搜索意图关键词;基于用户根据搜索式所选择的主题与该搜索式所对应的各个搜索对象关键词的对象相似度,训练各个搜索对象关键词针对各个主题的对象重要度系数;基于用户根据搜索式所选择的主题与该搜索式所对应的各个搜索意图关键词的意图相似度,训练各个搜索意图关键词针对各个主题的意图重要度系数。在一些实施例中,将搜索目标词对与根据网页浏览请求获取所请求页面的页面内容对应的各个主题分别进行匹配包括:根据网页浏览请求获取所请求页面的各个页面元素内容对应的各个主题;计算各个主题与搜索目标词对的关联度;基于各个关联度,确定与搜索目标词对相匹配的主题。在一些实施例中,基于所匹配到的主题对所请求页面的页面内容进行排序生成网页包括:按照与搜索目标词对的关联度由大到小的顺序,对各个所匹配到的主题所对应的页面元素内容进行排序,生成网页。第二方面,本申请提供了一种生成网页的装置,该装置包括:获取模块,配置用于响应于接收到用户的网页浏览请求,获取用户输入的搜索式;解析模块,配置用于对该搜索式进行解析提取搜索目标词对,其中,搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;匹配模块,配置用于将搜索目标词对与根据网页浏览请求获取的所请求页面的各个页面元素内容对应的各个主题分别进行匹配;生成模块,配置用于基于所匹配到的主题,选取所请求页面的页面元素内容进行排序生成网页。在一些实施例中,解析模块包括:提取单元,配置用于对上述搜索式进行解析提取至少一个候选搜索目标词对,其中,每个搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;第一选择单元,配置用于根据预先训练的对象重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对,其中,第一候选搜索目标词对包含所解析出的至少一个候选搜索目标词对中对象重要度系数最大的搜索对象关键词;第二选择单元,配置用于根据预先训练的意图重要度系数从第一候选搜索目标词对中选取出第二候选搜索目标词对,其中,第二候选搜索目标词对包括第一候选搜索目标词对中意图重要度系数最大的搜索对象关键词;确定单元,配置用于将第二候选搜索目标词对确定为搜索目标词对。在一些实施例中,提取单元进一步配置用于:将上述搜索式与预设对象关键词集合进行匹配,以确定候选搜索对象关键词;将上述搜索式与预设意图关键词集合进行匹配,以确定候选搜索意图关键词;基于对所确定的候选搜索对象关键词和候选搜索意图关键词,组合生成候选搜索目标词对。在一些实施例中,第一选择单元进一步配置用于:确定各个候选搜索目标词对中的候选搜索对象关键词的所属对象类别;根据预先训练的搜索对象关键词所属对象类别的对象类别重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对,其中,第一候选搜索目标词对包含所属对象类别的对象类别重要度系数最大的搜索对象关键词。在一些实施例中,第二选择单元进一步配置用于:确定各个候选搜索目标词对中的候选搜索意图关键词的所属意图类别;根据预先训练的搜索意图关键词所属意图类别的意图类别重要度系数,从第一候选搜索目标词对中选取出第二候选搜索目标词对,其中,第二候选搜索目标词对包含所属类别的意图类别重要度系数最大的搜索意图关键词。在一些实施例中,上述装置还包括训练模块,配置用于通过以下方法获取对象重要度系数以及意图重要度系数:获取一定数量的搜索式和用户根据搜索式所选择的主题作为样本;从样本中的每个搜索式中提取至少一个搜索对象关键词和至少一个搜索意图关键词;基于用户根据搜索式所选择的主题与该搜索式所对应的各个搜索对象关键词的对象相似度,训练各个搜索对象关键词针对各个主题的对象重要度系数;基于用户根据搜索式所选择的主题与该搜索式所对应的各个搜索意图关键词的意图相似度,训练各个搜索意图关键词针对各个主题的意图重要度系数。在本文档来自技高网...

【技术保护点】
1.一种生成网页的方法,其特征在于,所述方法包括:响应于接收到用户的网页浏览请求,获取所述用户输入的搜索式;对所述搜索式进行解析提取搜索目标词对,其中,所述搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;将所述搜索目标词对与根据所述网页浏览请求获取的所请求页面的各个页面元素内容对应的各个主题分别进行匹配;基于所匹配到的主题,选取所请求页面的页面元素内容进行排序生成网页。

【技术特征摘要】
1.一种生成网页的方法,其特征在于,所述方法包括:响应于接收到用户的网页浏览请求,获取所述用户输入的搜索式;对所述搜索式进行解析提取搜索目标词对,其中,所述搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;将所述搜索目标词对与根据所述网页浏览请求获取的所请求页面的各个页面元素内容对应的各个主题分别进行匹配;基于所匹配到的主题,选取所请求页面的页面元素内容进行排序生成网页。2.根据权利要求1所述的方法,其特征在于,所述对所述搜索式进行解析提取搜索目标词对包括:对所述搜索式进行解析提取至少一个候选搜索目标词对,其中,每个搜索目标词对包括一个搜索对象关键词与一个搜索意图关键词;根据预先训练的对象重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对,其中,所述第一候选搜索目标词对包含所解析出的至少一个候选搜索目标词对中对象重要度系数最大的搜索对象关键词;根据预先训练的意图重要度系数,从所述第一候选搜索目标词对中选取出第二候选搜索目标词对,其中,所述第二候选搜索目标词对包括所述第一候选搜索目标词对中意图重要度系数最大的搜索对象关键词;将所述第二候选搜索目标词对确定为所述搜索目标词对。3.根据权利要求2所述的方法,其特征在于,所述对所述搜索式进行解析提取至少一个候选搜索目标词对包括:将所述搜索式与预设对象关键词集合进行匹配,以确定候选搜索对象关键词;将所述搜索式与预设意图关键词集合进行匹配,以确定候选搜索意图关键词;基于对所确定的候选搜索对象关键词和候选搜索意图关键词,组合生成候选搜索目标词对。4.根据权利要求2所述的方法,其特征在于,所述根据预先训练的对象重要度系数,从所解析出的至少一个候选搜索目标词对中选取出第一候选搜索目标词对包括:确定各个候选搜索目标词对中的候选搜索对象关键词的所属对象类别;根据预先训练的搜索对象关键词所属对象类别的对象类别重要度系数,从所解析出的至少一个候选搜索目标词对中选取出所述第一候选搜索目标词对,其中,所述第一候选搜索目标词对包含所属对象类别的对象类别重要度系数最大的搜索对象关键词。5.根据权利要求2所述的方法,其特征在于,所述根据预先训练的意图重要度系数,从所述第一候选搜索目标词对中选取出第二候选搜索目标词对包括:确定各个候选搜索目标词对中的候选搜索意图关键词的所属意图类别;根据预先训练的搜索意图关键词所属意图类别的意图类别重要度系数,从所述第一候选搜索目标词对中选取出第二候选搜索目标词对,其中,所述第二候选搜索目标词对包含所属类别的意图类别重要度系数最大的搜索意图关键词。6.根据权利要求2所述的方法,其特征在于,所述对象重要度系数以及意图重要度系数通过以下方法获取:获取一定数量的搜索式和用户根据搜索式所选择的主题作为样本;从样本中的每个搜索式中提取至少一个对象关键词和至少一个意图关键词;基于用户根据搜索式所选择的主题与该搜索式所对应的各个搜索对象关键词的对象相似度,训练各个搜索对象关键词针对各个主题的对象重要度系数;基于用户根据搜索式所选择的主题与该搜索式所对应的各个搜索意图关键词的意图相似度,训练各个搜索意图关键词针对各个主题的意图重要度系数。7.根据权利要求1-6中任一所述的方法,其特征在于,所述将所述搜索目标词对与根据所述网页浏览请求获取所请求页面的页面内容对应的各个主题分别进行匹配包括:根据所述网页浏览请求获取所请求页面的各个页面元素内容对应的各个主题;计算各个主题与所述搜索目标词对的关联度;基于各个关联度,确定与所述搜索目标词对相匹配的主题。8.根据权利要求7所述的方法,其特征在于,所述基于所匹配到的主题,选取所请求页面的页面元素内容进行排序生成网页包括:按照与所述搜索目标词对的关联度由大到小的顺序,对各个所匹配到的主题所对应的页面元素内容进行排序,生成网页。9.一种生成网页的装置,其特征在于,所述装置包括:获取模块...

【专利技术属性】
技术研发人员:姚欣洪马飞超黄飞刘靖雅
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1