【技术实现步骤摘要】
一种时效性搜索词汇的确定方法及搜索引擎
本申请涉及互联网
,特别涉及一种时效性搜索词汇的确定方法及搜索引擎。
技术介绍
随着互联网的不断发展,网络中的信息也在瞬息万变,用户很多时候会专注于浏览最新的信息。目前,各个网站中通常都会设置搜索引擎,通过搜索引擎,网站可以向用户提供网站内的各项资源。当前,为了向用户提供网站内具备时效性的资源,网站通常会获取站外的一些热搜词汇,然后将这些热搜词汇作为网站内的时效性搜索词汇。当用户输入这些时效性搜索词汇时,便认为用户想要获取最新的相关内容。这样,在向用户反馈搜索结果时,可以优先展示最新上传的资源。然而,从站外获取的热搜词汇,有时候并不能很好地反映站内实际的搜索需求。例如,站外获取的热搜词汇为“霍金去世”,但是当前的网站是一个以漫画为主的网站,在该网站中用户搜索“霍金去世”的次数其实很少。因此,当前这种在网站内确定时效性搜索词汇的方式,无法与网站的实际情况相契合。
技术实现思路
本申请实施方式的目的是提供一种时效性搜索词汇的确定方法及搜索引擎,能够 ...
【技术保护点】
1.一种时效性搜索词汇的确定方法,其特征在于,所述方法包括:/n获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;/n将当前网站内的搜索词汇与所述特征词汇进行对比,以确定与所述特征词汇相似的目标搜索词汇;/n将所述目标搜索词汇作为所述当前网站的时效性搜索词汇。/n
【技术特征摘要】
1.一种时效性搜索词汇的确定方法,其特征在于,所述方法包括:
获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;
将当前网站内的搜索词汇与所述特征词汇进行对比,以确定与所述特征词汇相似的目标搜索词汇;
将所述目标搜索词汇作为所述当前网站的时效性搜索词汇。
2.根据权利要求1所述的方法,其特征在于,获取具备时效性的文本信息包括:
利用爬虫模块获取当前网络中的热搜文本信息,并将所述热搜文本信息作为所述具备时效性的文本信息;
和/或
获取所述当前网站内新增视频的标题信息,并将所述标题信息作为所述具备时效性的文本信息;
和/或
获取所述当前网站中处于未开播状态或者处于更新状态的剧集信息,并将所述剧集信息作为所述具备时效性的文本信息。
3.根据权利要求1或2所述的方法,其特征在于,从所述文本信息中解析出特征词汇包括:
对所述文本信息进行分词处理,并将分词处理的结果中具备指定词性的词汇或者由多个所述具备指定词性的词汇构成的词汇组合作为解析出的特征词汇。
4.根据权利要求1所述的方法,其特征在于,将当前网站内的搜索词汇与所述特征词汇进行对比包括:
分别生成所述搜索词汇和所述特征词汇的词向量,并计算生成的两个所述词向量之间的相似度;
相应地,确定与所述特征词汇相似的目标搜索词汇包括:
当计算的所述相似度大于或者等于指定相似度阈值时,将所述相似度对应的搜索词汇作为与所述特征词汇相似的目标搜索词汇。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
识别所述时效性搜索词汇表征的事件,并确定与所述事件相关联的词汇,并将与所述事件相关联的词汇作为指向所述时效性搜索词汇的搜索意图词汇;其中,当接收到用户输入的所述搜索意图词汇后,向所述用户展示所述时效性搜索词汇的提示信息。
6.根据权利要求1所述的方法,其特征在于,在将所述目标搜索词汇作为所述当前网站的时效性搜索词汇之后,所述方法还包括:
将所述时效性搜索词汇展示于搜索页面的指定位置处,当所述时效性搜索词汇被触发时,从所述搜索页面跳转至搜索结果页面;在所述搜索结果页面中,包括与所述时效性搜索词汇相关联的多个搜索结果,并且所述多个搜索结果按照搜索结果对应的资源类型进行排序。
7.根据权利要求1所述的方法,其特征在于,在将所述目标搜索词汇作为所述当前网站的时效性搜索词汇之后,所述方法还包括:
在接收到用户输入的所述时效性搜索词汇后,向所述用户提供的与所述时效性搜索词汇相关的搜索结果中,按照资源的上传时间进行排序。
8.一种搜索引擎,其特征在于,所述搜索引擎包括:
特征词汇解析单元,用于获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;
词汇比对单元,用于将当前网站内的搜索词汇与所述特征词汇进行对比,以确定与所述特征词...
【专利技术属性】
技术研发人员:张深源,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。