一种基于查询词的检索方法及装置制造方法及图纸

技术编号:10645547 阅读:129 留言:0更新日期:2014-11-12 19:00
本申请提供了一种基于查询词的检索方法及装置,其中所述方法包括接收提交的查询词;判断所述查询词是否存在于第一特征数据库中,其中所述第一特征数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;若是,则按照所述具有指定特征的关键词与对应目标网页数据的关联关系获取与所述查询词匹配的目标网页数据并返回。本申请可以提高检索效率。

【技术实现步骤摘要】

本申请涉及信息搜索的
,特别是涉及一种基于查询词的检索方法,以及,一种基于查询词的检索装置。
技术介绍
随着网络技术的发展和普及,能帮助用户在海量的网络资源中搜索其所需信息的搜索引擎技术也得到了大力发展和普及,目前,搜索引擎已成为每个网民不可缺少的上网工具之一。一般而言,搜索引擎是基于用户提交的查询关键词进行检索,用户在搜索页面输入检索关键词(query),搜索引擎会采用该query在线上进行检索,判断是否有匹配的信息。然而,这样检索过程会导致处理的时间过长,因此,如何提高搜索引擎的搜索效率,成为本领域技术人员迫切需要解决的问题。
技术实现思路
本申请所要解决的技术问题是提供一种基于查询词的检索方法,用以提高检索效率。相应的,本申请还提供了一种基于查询词的检索装置,用以保证上述方法在实际中的应用。为了解决上述问题,本申请公开了一种基于查询词的检索方法,包括:接收提交的查询词;判断所述查询词是否存在于第一特征数据库中,其中所述第一特征数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;若是,则按照所述具有指定特征的关键词与对应目标网页数据的关联关系获取与所述查询词匹配的目标网页数据并返回。优选地,所述方法还包括:若所述查询词不存在于所述第一特征数据库中,从第二特征数据库中查找所述查询词,并返回与所述查询词匹配的目标网页数据,其中,所述第二特征数据库包括具有非指定特征的关键词与对应目标网页数据的关联关系;其中,所述第二特征数据库通过如下方式生成:获取预设时间段内的一个或多个查询词;获取目标网页数据;分别计算所述一个或多个关键词与目标网页数据的相关性;依据所述相关性建立关键词和产品数据的对应关系;从所述关键词和目标网页数据的对应关系中去除所述具有指定特征的关键词和目标网页数据的对应关系,将剩下的关键词和目标网页数据的对应关系作为具有非指定特征的关键词和目标网页数据的对应关系保存为第二特征数据库。优选地,所述方法还包括:若所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词,在所述返回的目标网页数据被点击时,获取与所述目标网页数据对应的具有指定特征的关键词,建立所述具有非指定特征的关键词与具有指定特征的关键词的关联关系。优选地,所述方法还包括:若所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词,将所述查询词作为候选的具有指定特征的关键词。优选地,所述查询词包括提交的查询词以及依据所述提交的查询词生成的扩展查询词。本申请还公开了一种基于查询词的检索装置,包括:查询词接收模块,用于接收提交的查询词;判断模块,用于判断所述查询词是否存在于第一特征数据库中,其中所述第一特征数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;若是,则执行返回模块;返回模块,用于按照所述具有指定特征的关键词与对应目标网页数据的关联关系获取与所述查询词匹配的目标网页数据并返回。优选地,所述装置还包括:查找模块,用于在所述查询词不存在于所述第一特征数据库中时,从第二特征数据库中查找所述查询词,并返回与所述查询词匹配的目标网页数据,其中,所述第二特征数据库包括具有非指定特征的关键词与对应目标网页数据的关联关系;其中,所述第二特征数据库通过如下方式生成:获取预设时间段内的一个或多个查询词;获取目标网页数据;分别计算所述一个或多个关键词与目标网页数据的相关性;依据所述相关性建立关键词和产品数据的对应关系;从所述关键词和目标网页数据的对应关系中去除所述具有指定特征的关键词和目标网页数据的对应关系,将剩下的关键词和目标网页数据的对应关系作为具有非指定特征的关键词和目标网页数据的对应关系保存为第二特征数据库。优选地,所述装置还包括:关联关系建立模块,用于若所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词,在所述返回的目标网页数据被点击时,获取与所述目标网页数据对应的具有指定特征的关键词,建立所述具有非指定特征的关键词与具有指定特征的关键词的关联关系。优选地,所述装置还包括:候选关键词指定模块,用于在所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词时,将所述查询词作为候选的具有指定特征的关键词。优选地,所述查询词包括提交的查询词以及依据所述提交的查询词生成的扩展查询词。与现有技术相比,本申请具有以下优点:第一,本申请通过搜集一段时间内的具有指定特征的关键词,线下计算所述具有指定特征的关键词与对应的目标网页数据的关联关系,并存储于第一特征数据库中。这样当接收到用户提交的查询词时,只需要在所述第一特征数据库中查找所述查询词,若查找成功则返回匹配的目标网页数据,从而提高基于查询词的检索效率。第二,本申请同时在线下预置第二特征数据库,存储有收集来的具有非指定特征的关键词与对应的目标网页数据,当所述用户提交的查询词不能在所述第一特征数据库中找到时,在所述第二特征数据库中查找所述查询词,这样在提高检索效率的同时,也提高了检索的准确率。第三,本申请可以将命中所述第二特征数据库的查询词作为候选的具有指定特征的关键词并推荐给用户,从而提高第一特征数据库中目标网页数据的覆盖率,进一步提高检索的效率。附图说明图1是本申请一种基于查询词的检索方法实施例1的步骤流程图;图2是本申请一种基于查询词的检索方法实施例2的步骤流程图;图3是本申请一种基于查询词的检索方法实施例2中第二特征数据库生成步骤流程图;图4是本申请一种基于查询词的检索方法实施例3的步骤流程图;图5是本申请一种基于查询词的检索方法实施例4的步骤流程图;图6是本申请一种基于查询词的检索装置实施例的结构框图。具体实施方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。本申请实施例的核心构思之一在于,通过获取一段时间内的关键词和目标网页数据,并对其进行相关性计算得到优质绑定关系集合,从所述优质绑定关系集合中过滤掉具有指定特征的关键词与目标网页数据的关系对,获得的是具有非指定特征的关键词与目标网页数据的虚绑定集合,当用户提交的查询词命中所述虚绑定集合时,给出符合用户查询意图的目标网页数据。参照图1,本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201310167400.html" title="一种基于查询词的检索方法及装置原文来自X技术">基于查询词的检索方法及装置</a>

【技术保护点】
一种基于查询词的检索方法,其特征在于,包括:接收提交的查询词;判断所述查询词是否存在于第一特征数据库中,其中所述第一特征数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;若是,则按照所述具有指定特征的关键词与对应目标网页数据的关联关系获取与所述查询词匹配的目标网页数据并返回。

【技术特征摘要】
1.一种基于查询词的检索方法,其特征在于,包括:
接收提交的查询词;
判断所述查询词是否存在于第一特征数据库中,其中所述第一特征
数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;
若是,则按照所述具有指定特征的关键词与对应目标网页数据的关
联关系获取与所述查询词匹配的目标网页数据并返回。
2.根据权利要求1所述的方法,其特征在于,还包括:
若所述查询词不存在于所述第一特征数据库中,从第二特征数据库
中查找所述查询词,并返回与所述查询词匹配的目标网页数据,其中,
所述第二特征数据库包括具有非指定特征的关键词与对应目标网页数据
的关联关系;
其中,所述第二特征数据库通过如下方式生成:
获取预设时间段内的一个或多个查询词;
获取目标网页数据;
分别计算所述一个或多个关键词与目标网页数据的相关性;
依据所述相关性建立关键词和产品数据的对应关系;
从所述关键词和目标网页数据的对应关系中去除所述具有指定特征
的关键词和目标网页数据的对应关系,将剩下的关键词和目标网页数据
的对应关系作为具有非指定特征的关键词和目标网页数据的对应关系保
存为第二特征数据库。
3.根据权利要求2所述的方法,其特征在于,还包括:
若所述第二特征数据库中存在与所述查询词相同的具有非指定特征
的关键词,在所述返回的目标网页数据被点击时,获取与所述目标网页
数据对应的具有指定特征的关键词,建立所述具有非指定特征的关键词
与具有指定特征的关键词的关联关系。
4.根据权利要求2所述的方法,其特征在于,还包括:
若所述第二特征数据库中存在与所述查询词相同的具有非指定特征
的关键词,将所述查询词作为候选的具有指定特征的关键词。
5.根据权利要求1-4任一权利要求所述的方法,其特征在于,所述
查询词包括提交的查询词以及依据所述提交的查询词生成的扩展查询
词。
6.一种基于查询词的检索装置,其特征在于,包括:
查询词接收模块,用于接...

【专利技术属性】
技术研发人员:谢可苏上海黄鹏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1