【技术实现步骤摘要】
提供数据搜索的方法及装置
本专利技术涉及数据处理技术,尤其涉及提供数据搜索的方法及装置。
技术介绍
进行数据搜索时,网络侧接收来自用户终端的包含原始关键词的搜索指令,由原始关键词搜索出数据,返回给用户终端。搜索出的数据包括页面内容数据,页面内容数据为与关键词直接相关的数据,如包含原始关键词的数据;页面内容数据包含标题、正文等信息。同时,网络侧还基于页面内容数据提取出关键词,展示在页面中,以供用户进行数据搜索。之后,用户终端便可点击页面上的关键词,进一步搜索。页面上展示的这部分关键词为用户很可能会关注的,展示在页面上,便于操作,提升了用户进行数据搜索的体验,也为用户提供了较多的选择。参见图1,为采用现有技术方案展示的页面实例,该实例为用户通过原始关键词“街拍”搜索到的页面;其中的关键词“欧美”、“美女”和“街拍”,从页面内容数据的标题中提取。现有方案只基于页面内容数据提供用以进行数据搜索的关键词,这部分关键词比较局限,仅和页面内容数据相关,限制了进一步搜索的范围。
技术实现思路
本专利技术提供了一种提供数据搜索的方法,该方法能够基于页面内容数据和页面推荐数据,提供用以进 ...
【技术保护点】
一种提供数据搜索的方法,其特征在于,该方法包括:接收用户输入的原始关键词,获取与原始关键词直接关联的页面内容数据,以及与原始关键词间接关联的页面推荐数据;从页面内容数据和页面推荐数据中提取关键词,组成关键词集合;对关键词集合中的关键词进行相关度排序;在排序中从相关度最高的关键词开始,提取出设定个数的关键词;在页面展示页面内容数据、页面推荐数据和提取的关键词。
【技术特征摘要】
1.一种提供数据搜索的方法,其特征在于,该方法包括:接收用户输入的原始关键词,获取与原始关键词直接关联的页面内容数据,以及与原始关键词间接关联的页面推荐数据,所述页面推荐数据为搜索所述原始关键词的其他用户在后续搜索得到的数据;从页面内容数据和页面推荐数据中提取关键词,组成关键词集合;对关键词集合中的关键词进行相关度排序;在排序中从相关度最高的关键词开始,提取出设定个数的关键词;在页面展示页面内容数据、页面推荐数据和提取的关键词。2.如权利要求1所述的方法,其特征在于,所述对关键词集合中的关键词进行相关度排序包括:计算关键词集合中各关键词的关联度,按照关联度对关键词进行排序,所述关联度为所述相关度。3.如权利要求1所述的方法,其特征在于,所述对关键词集合中的关键词进行相关度排序包括:计算关键词集合中各关键词的关联度,将各关键词的关联度与搜索热度进行相乘,按照相乘结果进行排序,所述相乘结果为所述相关度。4.如权利要求2或3所述的方法,其特征在于,所述计算关键词集合中各关键词的关联度包括:确定关键词集合中各关键词的关联度;将相同关键词的关联度进行直接相加或加权相加,将相加结果作为该关键词最终的关联度。5.如权利要求4所述的方法,其特征在于,确定关键词集合中各关键词的关联度时,将从页面内容数据中提取的关键词的关联度确定为1;所述加权相加包括:将相同关键词中最高数值的关联度作为加数,将其它关联度分别乘以0.5,将得到的相乘结果作为被加数,用所述加数与所述被加数进行相加,得到的结果为所述相加结果。6....
【专利技术属性】
技术研发人员:王犇,何军,杨志峰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。