【技术实现步骤摘要】
一种基于词表的搜索方法和系统
本专利技术涉及互联网
,尤其涉及一种基于词表的搜索方法和系统。
技术介绍
随着互联网社区化进度的逐步加快,网络社区中的人与人之间的关系越来越紧密,网络社区的用户期望通过搜人系统找到感兴趣的人;明星、商家等希望也通过搜人系统被他人追随、认知,从而达到宣传自己、扩大交际圈的目的。由此可以看出,在社区应用中,人物搜索具有较好的发展前景。在目前的网络上已经有很多人物搜索的应用,但大多采用的是传统的基于内容检索的方法,即基于文本模糊检索,这需要检索请求串全匹配才能搜出结果。然而,这对用户要求很高,需要用户很准确的输入关键词,而且不能有多余的干扰因素。现有的人物搜索方法存在搜人不准确、无法处理用户交互式搜人请求、搜索结果不丰富、无法过滤额外干扰信息等缺陷。
技术实现思路
有鉴于此,本专利技术提供一种基于词表的搜索方法和系统,以解决现有的人物搜索方法存在的搜人不准确的问题。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术提供了一种基于词表的搜索方法,该方法包括:通过离线分析用户的检索意图相关数据建立优质词表;将检索请求中的检索串与所述 ...
【技术保护点】
一种基于词表的搜索方法,其特征在于,该方法包括:通过离线分析用户的检索意图相关数据建立优质词表;将检索请求中的检索串与所述优质词表进行匹配,并根据匹配结果修正所述检索串;根据修正后的检索串进行检索,得到检索结果。
【技术特征摘要】
1.一种基于词表的搜索方法,其特征在于,该方法包括:通过离线分析用户的检索意图相关数据建立优质词表;将检索请求中的检索串与所述优质词表进行匹配,并根据匹配结果修正所述检索串;根据修正后的检索串进行检索,得到检索结果;对检索结果进行分析,如果所述检索结果不满足检索需求,则判断检索次数是否达到设定的阈值,如果没有达到,则从所述检索串匹配到的各个分类中选择其他分类,并提取所选分类中匹配到的离线权值最高的词,修正所述检索串,根据修正后的检索串继续进行检索;其中,所述通过离线分析用户的检索意图相关数据建立优质词表,具体为:离线分析用户的检索意图相关数据,从中提取用户检索词,并从搜索系统中提取与所述用户检索词相关的信息,根据所述与用户检索词相关的信息和人工编辑信息对所述用户检索词进行分类存储;根据业务种类和业务的对应参数,对每个分类下的词进行离线权值计算,并按照所述权值大小进行排序。2.根据权利要求1所述基于词表的搜索方法,其特征在于,所述将检索请求中的检索串与所述优质词表进行匹配,并根据匹配结果修正所述检索串,具体为:根据业务需求和当前检索次数,从所述检索串匹配到的各个分类中选择其中一个分类,并提取所选分类中匹配到的离线权值最高的词,修正所述检索串。3.根据权利要求2所述基于词表的搜索方法,其特征在于,该方法还包括:如果所述检索次数达到设定的阈值,则合并多次检索的结果并返回;如果所述检索结果满足检索需求,则正常返回所述检索结果。4.一种基于词表的搜索系统,其特征在于,该系统包括:词表建立模块、...
【专利技术属性】
技术研发人员:石一峰,李强,林僚,潘树燊,张黎明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。