【技术实现步骤摘要】
一种在搜索自动补全中结合与展示多信息源的方法
[0001]本专利技术涉及信息搜索领域,尤其是涉及对用户输入的检索词进行自动补全的方法。
技术介绍
[0002]随着信息时代的到来,信息、数据一直呈爆炸式增长。信息搜索的重要性日益突出,对检索的效率、准确性要求也越来越高。检索词的自动补全,是提高检索效率、准确性的一种重要技术。传统的搜索词自动补全,通常只关注于搜索词本身的信息,补全时并不考虑待检索的信息源、信息库特点,这种补全技术适用于谷歌、百度等通用搜索。但对于特定种类的信息源,例如:针对笔记、商品、明星、企业号、关注的大V这些特定信息源中的一种或者几种,用户检索时,如果还仅仅基于搜索词本身语义补全,或者基于全网检索词数据训练出来的补全系统进行补全,则检索结果的准确性会大大降低。
[0003]另外,大V、明星这些涉及个人信息的信息源中,检索目标的关键词本身往往含有非常用字符,比如“欧阳娜娜”的真实用户名是“欧阳娜娜Nana”,甚至还有个性化的特殊字符、文字图案,这些情况使用现有的搜索词自动补全方式很难补全出适当的联想词 ...
【技术保护点】
【技术特征摘要】
1.一种在搜索自动补全中结合与展示多信息源的方法,其特征在于,包括:接收用户搜索请求的步骤;根据所述用户搜索请求中的搜索词检索前缀树得到候选补全词结果的步骤;比较所述用户搜索请求中的搜索词和亲密度关系表中记录名的相似度,当相似度达到预设阀值时,将记录名加入所述候选补全词结果的步骤;整理并返回所述候选补全词结果的步骤。2.根据权利要求1所述的在搜索自动补全中结合与展示多信息源的方法,其特征在于,所述前缀树通过如下方法构建:记录用户一段时间T内的搜索行为;获取信息源中各记录的名称、ID值;根据所述用户搜索行为和所述信息源中记录的名称、ID值构建所述前缀树。3.根据权利要求2所述的在搜索自动补全中结合与展示多信息源的方法,其特征在于,所述前缀树的节点包括搜索词字符串,还包括与所述搜索词相关的记录名称、ID值、热度、类别、频度中的一种或几种属性。4.根据权利要求1所述的在搜索自动补全中结合与展示多信息源的方法...
【专利技术属性】
技术研发人员:梁宏伟,白云汉,黄恒,杨扬,
申请(专利权)人:行吟信息科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。