一种搜索推荐方法及系统技术方案

技术编号:21891859 阅读:24 留言:0更新日期:2019-08-17 14:29
本发明专利技术的技术方案包括一种搜索推荐方法及系统,用于实现:包括获取用户输入的搜索内容,提取搜索文本并调用数据库;根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子;将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;根据评分排序进行用户个性化处理,得到一定数量的句子并推送给用户,其中一定数量可自定义。本发明专利技术的有益效果为:方便用户输入、缩短用户搜索时间、提高搜索准确度以及改善用户的搜索体验。

A Search Recommendation Method and System

【技术实现步骤摘要】
一种搜索推荐方法及系统
本专利技术涉及一种搜索推荐方法及系统,属于互联网

技术介绍
基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。主要是从两个方法来描述基于内容的推荐方法:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值传统的方法是直接从数据库模糊搜索关键字得到列表,推送句子并不符合用户需求,不能满足用户的个性化需求,影响用户体验。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种搜索推荐方法及系统,包括获取用户输入的搜索内容,提取搜索文本并调用数据库;根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子;将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;、根据评分排序进行用户个性化处理,得到一定数量的句子并推送给用户,其中一定数量可自定义。本专利技术解决其问题所采用的技术方案一方面是:一种搜索推荐方法,其特征在于,包括以下步骤:S100、获取用户输入的搜索内容,提取搜索文本并调用数据库;S200、根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子;S300、将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;S400、根据评分排序进行用户个性化处理,得到一定数量的句子并推送给用户,其中一定数量可自定义。进一步的,所述S200还包括:S201、根据搜索文本,调用数据库中各个句子在一定时间内的被调用率,计算转化率分数;S202、根据转化率分数大小生成候选待推送句子,划入推送池中,其中推送池还包括长尾的新词和趋势词。进一步的,所述S300还包括:S301、根据搜索文本的前缀特征以及索引特征获取对应的句子的统计特征;S302、根据索引和句子的编辑距离以及DBOW向量计算句子排序;S303、使用模型计算各个句子在对应文本的相关性分数,其中模型包括但不限于hred模型、lambda模型、mart模型、随机森林模型以及网格查找模型。进一步的,所述S400还包括:S401、将挑选出的句子根据搜索次数、网站成交额变化率以及点击率进行加权融合;S402、对处理后的句子进行贝叶斯平滑处理,同时计算句子静态分,其中静态分包括但不限于pv、ctr、成交转化率、成交笔数、成交金额以及召回商品数。进一步的,所述S400还包括:S401、将挑选出的句子根据时间序列模型进行预测概率大小,其中预测模型包括加法指数平滑模型;S402、根据用户在一定时间内的自主搜索记录来计算句子相对熵和新词的数据,并推送给用户。进一步的,所述S400还包括:S401、获取用户信息,其中用户信息包括但不限于年龄、性别、购买力、短期和长期查询偏好;S402、根据用户信息计算数据库中句子的对应个性化特征;S403、使用LR模型和AUC评价指标计算各个个性化特征权重,根据权重大小将对应句子推送给用户。进一步的,所述S400还包括:S401、根据搜索文本的上下文调用推送池中的句子,映射到对应空间中;S402、计算每个句子与上下文的相似度,根据相似的大小向用户推送句子,其中计算方法包括使用余弦相似度计算。本专利技术解决其问题所采用的技术方案另一方面是:一种搜索推荐系统,其特征在于,包括:文本提取模块,用于获取用户输入的搜索内容,提取搜索文本;数据库,用于存储候选句子并建立用于存储筛选后句子的推送池;匹配模块,用于根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子排序模块,用于将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;个性化模块,用于根据评分排序进行用户个性化处理,得到一定数量的句子并推送给用户。进一步的,所述匹配模块还包括:计算单元,用于据搜索文本,调用数据库中各个句子在一定时间内的被调用率,计算转化率分数;管理单元,用于根据转化率分数大小生成候选待推送句子,划入推送池中,其中推送池还包括长尾的新词和趋势词。进一步的,所述排序模块还包括:统计单元,用于根据搜索文本的前缀特征以及索引特征获取对应的句子的统计特征;排序单元,用于根据索引和句子的编辑距离以及DBOW向量计算句子排序;模型计算单元,用于使用模型计算各个句子在对应文本的相关性分数,其中模型包括但不限于hred模型、lambda模型、mart模型、随机森林模型以及网格查找模型。本专利技术的有益效果是:方便用户输入、缩短用户搜索时间、提高搜索准确度以及改善用户的搜索体验。附图说明图1是根据本专利技术优选实施例的方法流程示意图;图2是根据本专利技术优选实施例的系统结构示意图;图3是根据本专利技术优选实施例的模型预测流程示意图。具体实施方式以下将结合实施例和附图对本专利技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本专利技术的目的、方案和效果。需要说明的是,如无特殊说明,当某一特征被称为“固定”、“连接”在另一个特征,它可以直接固定、连接在另一个特征上,也可以间接地固定、连接在另一个特征上。此外,本公开中所使用的上、下、左、右等描述仅仅是相对于附图中本公开各组成部分的相互位置关系来说的。在本公开中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。此外,除非另有定义,本文所使用的所有的技术和科学术语与本
的技术人员通常理解的含义相同。本文说明书中所使用的术语只是为了描述具体的实施例,而不是为了限制本专利技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的组合。应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种元件,但这些元件不应限于这些术语。这些术语仅用来将同一类型的元件彼此区分开。例如,在不脱离本公开范围的情况下,第一元件也可以被称为第二元件,类似地,第二元件也可以被称为第一元件。本文所提供的任何以及所有实例或示例性语言(“例如”、“如”等)的使用仅意图更好地说明本专利技术的实施例,并且除非另外要求,否则不会对本专利技术的范围施加限制。术语解释:query:推荐句子,即句子;querylog:存储句子的数据库,即全量日志;querysession:查询语句,用户输入的搜索文本;gmv:网站成交金额。参照图1,是根据本专利技术优选实施例的方法流程示意图,S100、获取用户输入的搜索内容,提取搜索文本并调用数据库;S200、根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子;S300、将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;S400、根据本文档来自技高网
...

【技术保护点】
1.一种搜索推荐方法,其特征在于,包括以下步骤:S100、获取用户输入的搜索内容,提取搜索文本并调用数据库;S200、根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子;S300、将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;S400、根据评分排序进行用户个性化处理,得到一定数量的句子并推送给用户,其中一定数量可自定义。

【技术特征摘要】
1.一种搜索推荐方法,其特征在于,包括以下步骤:S100、获取用户输入的搜索内容,提取搜索文本并调用数据库;S200、根据搜索文本进行词句匹配,从数据库中挑选出包含搜索文本的句子;S300、将挑选出的句子根据评分模型进行逐一评分排序,并放入推送池;S400、根据评分排序进行用户个性化处理,得到一定数量的句子并推送给用户,其中一定数量可自定义。2.根据权利要求1所述的搜索推荐方法,其特征在于,所述S200还包括:S201、根据搜索文本,调用数据库中各个句子在一定时间内的被调用率,计算转化率分数;S202、根据转化率分数大小生成候选待推送句子,划入推送池中,其中推送池还包括长尾的新词和趋势词。3.根据权利要求1所述的搜索推荐方法,其特征在于,所述S300还包括:S301、根据搜索文本的前缀特征以及索引特征获取对应的句子的统计特征;S302、根据索引和句子的编辑距离以及DBOW向量计算句子排序;S303、使用模型计算各个句子在对应文本的相关性分数,其中模型包括但不限于hred模型、lambda模型、mart模型、随机森林模型以及网格查找模型。4.根据权利要求1所述的搜索推荐方法,其特征在于,所述S400还包括:S401、将挑选出的句子根据搜索次数、网站成交额变化率以及点击率进行加权融合;S402、对处理后的句子进行贝叶斯平滑处理,同时计算句子静态分,其中静态分包括但不限于pv、ctr、成交转化率、成交笔数、成交金额以及召回商品数。5.根据权利要求1所述的搜索推荐方法,其特征在于,所述S400还包括:S401、将挑选出的句子根据时间序列模型进行预测概率大小,其中预测模型包括加法指数平滑模型;S402、根据用户在一定时间内的自主搜索记录来计算句子相对熵和新词的数据,并推送给用户。6.根据权利要求1所述的搜索推荐方...

【专利技术属性】
技术研发人员:夏进陈顺平陈荣亮
申请(专利权)人:珠海市珠澳跨境工业区好易通科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1