【技术实现步骤摘要】
一种搜索推荐方法和装置
[0001]本申请涉及终端领域,尤其涉及一种搜索推荐方法和装置。
技术介绍
[0002]目前,用户可以通过搜索引擎从互联网的海量信息中搜索需要的信息。考虑到用户输入的搜索词普遍较短,搜索引擎可以根据用户输入的搜索词给予用户适当推荐以提高用户搜索效率。
[0003]相关技术中,搜索引擎可能会向用户推荐一些与搜索词相关程度较低的扩展词,即搜索引擎推荐准确度不高,无法有效提高用户的搜索效率,导致用户体验较差。
技术实现思路
[0004]本申请实施例提供一种搜索推荐方法和装置,能够向用户推荐与搜索词相关程度较高的扩展词(相当于本申请中的结果词),提高用户的搜索效率,从而提高用户体验。
[0005]第一方面,本申请实施例提供一种搜索推荐方法,包括:接收用户在搜索框输入的关键词,根据关键词查找关联规则集合;其中,关联规则集合包括多条关联规则,多条关联规则中的每条关联规则包括至少一个前置词和至少一个结果词;确定关联规则集合中与关键词匹配的关联规则;向用户推荐与关键词匹配的关联规则中的 ...
【技术保护点】
【技术特征摘要】
1.一种搜索推荐方法,其特征在于,包括:接收用户在搜索框输入的关键词,根据所述关键词查找关联规则集合;其中,所述关联规则集合包括多条关联规则,所述多条关联规则中的每条关联规则包括至少一个前置词和至少一个结果词;确定所述关联规则集合中与所述关键词匹配的关联规则;向用户推荐与所述关键词匹配的关联规则中的结果词;其中,所述关联规则集合的生成方法包括:获取多个短文档对应的多个项集,所述多个项集中的每个项集包括一个短文档对应的全部实词;根据所述多个项集得到多个频繁项集,所述多个频繁项集中的每个频繁项集的支持度大于或等于最小支持度阈值;根据所述多个项集中每个项集的实词的排列顺序、预设的最大前置词的数量以及所述多个频繁项集生成多条关联规则;对于所述多条关联规则中的每条关联规则,根据该关联规则中前置词与每个结果词之间的置信度调整该关联规则中结果词的顺序,得到所述关联规则集合。2.根据权利要求1所述的方法,其特征在于,所述获取多个短文档对应的多个项集包括:根据标点符号将语料库中的长文档切分为多个短文档;其中,语料库中存储实际使用的语言材料;对所述多个短文档进行分词处理,得到所述多个短文档中每个短文档对应的项集,所述每个短文档对应的项集包括所述每个短文档包括的全部实词。3.根据权利要求1或2所述的方法,其特征在于,所述对所述多个短文档进行分词处理之前,所述方法还包括:对所述多个短文档进行数据预处理,所述数据预处理包括数据清洗、数据转换和去除停用词中的至少一种。4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:过滤所述多个短文档中每个短文档对应的项集中的极低频实词;其中,所述极低频实词包括支持度小于或等于第一预设阈值的实词。5.根据权利要求1或2所述的方法,其特征在于,对于所述关联规则集合中的每条关联规则,该关联规则的前置词包括N个频繁项集,所述N个频繁项集包括的多个项的顺序是根据短文档对应的项集中实词的顺序排列...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。