【技术实现步骤摘要】
本专利技术涉及数据处理
,特别涉及一种搜索提示信息生成方法及装置。
技术介绍
随着互联网技术的发展,为了满足互联网用户对不同领域信息的获取需求,近年来网络搜索技术成为非常热门的互联网技术之一,在目前绝大部分的搜索引擎中,默认搜索类别是网页搜索,网页搜索是指根据用户的搜索请求对所有网络资源都进行与用户意图搜索的词条相关的搜索。为了避免用户输入较长的搜索关键字,搜索引擎为用户提供了关键字提示功能,即在用户输入搜索关键字的前缀或者后缀的过程中,搜索引擎为用户提示多个常用搜索关键字,用户通过选择确定操作就会直接进行常用搜索关键字的在线搜索。为实现搜索引擎中的关键字提示功能,通常采用如下两种方法:第一,索引搜索方法。首先需要在后台数据库中为用户要搜索的数据源建立索引,在用户输入搜索关键字之后,将用户输入的搜索关键字作为前缀在后台数据库的索引文件中进行查找,得到以所述搜索关键字为前缀的多个数据源,搜索引擎将查找到的多个数据源作为提示用户的常用搜索关键字。例如,当用户在搜索引擎的搜索栏中输入“新浪”时,将用户输入的“新浪”作为前缀在用户要搜索的数据源所在的后台数据库中进行查找,得到以“新浪”为前缀的多个数据源:“新浪新闻”、“新浪短信”、“新浪体育”、“新浪邮件”、“新浪科技”、“新浪财经”,将所述多个数据源作为提示用户的常用搜索关键字。第二,Trie树搜索方法。Trie树又称单词查找树或者键树,典型应用在大量字符串的统计和排序的场景中。在用户输入搜索关键字之后,将用户输入的搜索关键字作为前缀在Trie树中进行查找,用Trie树搜索一个关键字的时间与关键字自身的 ...
【技术保护点】
一种搜索提示信息生成方法,其特征在于,包括:接收用户输入的搜索关键字;根据所述搜索关键字在预先建立的关键字对象列表中进行查找,如果查找成功,获得与所述搜索关键字对应的数据源序号;根据所述数据源序号在预先建立的数据源对象列表中进行查找,如果查找成功,获得与所述数据源序号对应的数据源;将所述数据源作为搜索提示信息呈现给所述用户。
【技术特征摘要】
1.一种搜索提示信息生成方法,其特征在于,包括: 接收用户输入的搜索关键字; 根据所述搜索关键字在预先建立的关键字对象列表中进行查找,如果查找成功,获得与所述搜索关键字对应的数据源序号; 根据所述数据源序号在预先建立的数据源对象列表中进行查找,如果查找成功,获得与所述数据源序号对应的数据源; 将所述数据源作为搜索提示信息呈现给所述用户。2.根据权利要求1所述的方法,其特征在于,在所述接收用户输入的搜索关键字之前,还包括: 根据预设转换规则集合中不同的转换规则,将预设数据源列表中的每个数据源转换为两个以上转换数据源,每个所述转换数据源对应一个转换值,每个所述数据源对应一个转换值集合; 建立与所述预设数据源列表对应的数据源对象列表,所述数据源对象列表中的每个数据源对象中包括数据源序号、所述数据源以及数据源属性列表,其中,所述数据源属性列表中包括与所述数据源对应的所述转换值集合以及与所述数据源对应的关键属性值; 按照字数递增的拆分规则,将每个所述转换数据源拆分为两个以上拆分关键字; 建立与每个所述拆分关键字对应的数据序号对象,所述数据序号对象包括与所述数据源对应的所述数据源序号、与所述转换数据源对应的所述转换值以及与所述数据源对应的所述关键属性值; 根据所述两个以上拆 分关键字、以及与每个所述拆分关键字对应的数据序号对象,建立与所述数据源对象列表对应的关键字对象列表。3.根据权利要求2所述的方法,其特征在于,所述根据所述两个以上拆分关键字、以及与每个所述拆分关键字对应的数据序号对象,建立与所述数据源对象列表对应的关键字对象列表,包括: 将所述拆分关键字作为关键字在所述关键字对象列表中进行查找,如果查找成功,将与所述拆分关键字对应的数据序号对象添加在与所述拆分关键字对应的数据序号对象列表中。4.根据权利要求3所述的方法,其特征在于,还包括: 如果查找失败,建立与所述拆分关键字对应的关键字对象,并将所述关键字对象添加到所述关键字对象列表中,所述关键字对象包括所述拆分关键字以及与所述拆分关键字对应的数据序号对象。5.根据权利要求3所述的方法,其特征在于,在所述将所述关键字对象添加到所述关键子对象列表中之如,还包括: 判断与所述拆分关键字对应的数据序号对象列表中数据序号对象的个数是否大于预设阈值,如果所述数据序号对象的个数大于所述预设阈值,将与所述拆分关键字对应的数据序号对象添加到与所述拆分关键字对应的数据序号对象备选列表中。6.根据权利要求3或5所述的方法,其特征在于,还包括: 根据所述数据序号对象中与所述转换数据源对应的所述转换值以及与所述数据源对应的所述关键属性值,将与所述拆分关键字对应的数据序号对象列表中的数据序号对象和与所述拆分关键字对应的数据序号对象备选列表中的数据序号对象进行排序。7.根据权利要求6所述的方法,其特征在于,还包括: 接收待删除数据源对象中的待删除数据源; 将所述待删除数据源作为关键字在所述数据源对象列表中进行查找,如果查找成功,获取与所述待删除数据源对应的待删除数据源序号; 根据预设转换规则集合中不同的转换规则,将所述待删除数据源转换为两个以上待删除转换数据源; 按照字数递增的拆分规则,将每个所述待删除转换数据源拆分为两个以上待删除拆分关键字; 将每个所述待删除拆分关键字作为关键字在所述关键字对象列表中进行查找,如果查找成功,在与所述待删除拆分关键字对应的数据序号对象列表中查找与所述待删除数据源序号对应的待删除数据序号对象,如果查找成功,在与所述待删除拆分关键字对应的数据序号对象列表中删除所述待删除数据序号对象; 在所述数据源对象列表中删除所述待删除数据源对象。8.根据权利要求7所述的方法,其特征在于,还包括: 如果在与所述待删除拆分关键字对应的数据序号对象列表中查找与所述待删除数据源序号对应的待删除数据序号对象失败,则在与所述待删除拆分关键字对应的数据序号对象备选列表中查找与所述待删除数据源序号对应的待删除数据序号对象,如果查找成功,在与所述待删除拆分关键字对应的数据序号对象备选列表中删除所述待删除数据序号对象; 在所述数据源对象列表中删除所述待删除数据源对象。9.根据权利要求7所述的方法,其特征在于,在所述在与所述待删除拆分关键字对应的数据序号对象列表中删除所述待删除数据序号对象之后,还包括: 判断与所述待删除拆分关键字对应的数据序号对象列表中数据序号对象的个数是否小于所述预设阈值,如果是,将与所述待删除拆分关键字对应的数据序号对象备选列表中最大的数据序号对象转移到与所述待删除拆分关键字对应的数据序号对象列表中。10.根据权利要求6所述的方法,其特征在于,还包括: 接收更新数据源对象中的更新数据源; 将所述更新数据源作为关键字在所述数据源对象列表中进行查找,如果查找成功,获取与所述更新数据源对应的更新数据源序号,更新与所述更新数据源序号对应的待更新关键属性值; 根据预设转换规则集合中不同的转换规则,将所述更新数据源转换为两个以上更新转换数据源; 按照字数递增的拆分规则,将每个所述更新转换数据源拆分为两个以上更新拆分关键字; 将每个所述更新拆分关键 字作为关键字在所述关键字对象列表进行查找,如果查找成功,在与所述更新拆分关键字对应的数据序号对象列表中查找与所述更新数据源序号对应的待更新数据序号对象,如果查找成功,在与所述更新拆分关键字对应的数据序号对象列表中更新所述待更新数据序号对象中的待更新关键属性值。11.据权利要求10所述的方法,其特征在于,还包括: 如果在与所述更新拆分关键字对应的数据序号对象列表中查找与所述更新数据源序号对应的待更新数据序号对象失败,则在与所述更新拆分关键字对应的数据序号对象备选列表中查找与所述更新数据源序号对应的待更新数据序号对象,如果查找成功,在与所述更新拆分关键字对应的数据序号对象备选列表中更新所述待更新数据序号对象中的待更新关键属性值。12.根据权利要求10所述的方法,其特征在于,在所述在与所述更新拆分关键字对应的数据序号对象列表中更新所述待更新数据序号对象中的待更新关键属性值之后,还包括: 判断更新后的数据序号对象是否小于与所述更新拆分关键字对应的数据序号对象备选列表中最大的数据序号对象,如果是,将所述最大的数据序号对象转移到与所述更新拆分关键字对应的数据序号对象列表中,将所述更新后的数据序号对象转移到与所述更新拆分关键字对应的数据序号对象备选列表中。13.一种搜索提示信息生成装置,其特征在于,包括: 接收单元,用于接收用户输入的搜索关键字,将所述搜索关键字发送给查找单元; 所述查找单元,用于在接收到所述搜索关键字之后,根据所述搜索关键字在预先建立的关键字对象列表中进行查找,如果查找成功,获得与所述搜索关键字对应的数据源序号; 所述查找单元,还用于根据所述数据源序号在预先建立的数据源对象列表中进行查找,如果查找成功,获得与所述数据源序号对应的数据源,将所述数据源发送给呈现单元; 所述呈现单元,用于在接收到所述数据源之后,将所述数据源作为搜索提示信息呈现给所述用户。14.根据权利要求13所述的装置,其特征在于,还包括: 数据源转换单元,用于根据预设转换规则集合中不同的转换规则,将预设数据源列表中的每个数据源转换为两个以上转换数据源,每个所述转换数据源对应一个转换值,每个所述数据源对应一个转换值集合,并且,将所述两个以上转换数据源发送给拆分单元,将与每个所述数据源对应的转换值集合发送给数据源对象列表建立单元; 所述数据源对象列表建立单元,用于在接收到所述与每个所述数据源对应的转换值集合之后,建立与所述预设数据源列表对应的数据源对象列表,所述数据源对象列表中的每个数据源对象中包括数据源序号、所述数据源以及数据源属性列表,其中,所述数据源属性列表中包括与所述转换数据源对应的所述转换值集合以及与所述数据源对应的关键属性值; 所述拆分单元,用于在接收到所述两个以上转换数据源之后,按照字数递增的拆分规贝U,将每个所述转换数据源拆分为两个以上拆分关键字,将所述两个以上拆分关键字发送给数据序...
【专利技术属性】
技术研发人员:简勤,郭正平,王全礼,曾东,廖勤耘,杨俊拯,郑长松,
申请(专利权)人:中国移动通信集团四川有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。