一种搜索推荐系统及方法技术方案

技术编号:33282437 阅读:10 留言:0更新日期:2022-04-30 23:43
本发明专利技术公开了一种搜索推荐系统及方法,属于搜索推荐算法技术领域。本发明专利技术系统,包括:索引模块,所述索引模块采用Elasticsearch作为存储介质,设置Elasticsearch字段的映射模板;所述索引模块对用户获取的匹配词进行索引;数据迁移模块,所述数据迁移模块对原始数据进行导入,并对导入的数据进行清洗,将所述清洗后的数据由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;搜索模块,所述搜索模块接收用户的搜索的关键词,将所述关键词推送至搜索推荐模块;搜索推荐模块,所述搜索推荐模块内置搜索推荐算法,通过所述搜索推荐算法对用户输入的关键词进行分词及过滤,获取匹配词。本发明专利技术采用Elasticsearch作为存储介质,极大的提高了系统的响应。极大的提高了系统的响应。极大的提高了系统的响应。

【技术实现步骤摘要】
一种搜索推荐系统及方法


[0001]本专利技术涉及搜索推荐算法
,并且更具体地,涉及一种搜索推荐系统及方法。

技术介绍

[0002]随着互联网技术的发展更新,数据量越来越大,用户对系统快速响应及智能化的需求与日俱增。一般地,在网站显眼的位置会有搜索框,用户输入关键词后会在下方进行搜索关键词推荐,用户可以在推荐的此条中选择符合自己需求的推荐词条进行搜索。但是在大数据时代,响应速度和准确性成为了更紧迫的需求。面对不同用户群,如果系统响应时间长,不能及时收到推荐;或者搜索时由于用户输入不准确、或者推荐算法参数维度少而造成推荐不符合用户需求,就必须通过多次尝试,或者必须准确输入搜索词来进行更好的搜索匹配,极大影响了用户体验。

技术实现思路

[0003]针对上述问题,本专利技术提出了一种搜索推荐系统,包括:
[0004]索引模块,所述索引模块采用Elasticsearch作为存储介质,设置Elasticsearch字段的映射模板;所述索引模块对用户获取的匹配词进行索引;
[0005]数据迁移模块,所述数据迁移模块对原始数据进行导入,并对导入的数据进行清洗,将所述清洗后的数据由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;
[0006]搜索模块,所述搜索模块接收用户的搜索的关键词,将所述关键词推送至搜索推荐模块;
[0007]搜索推荐模块,所述搜索推荐模块内置搜索推荐算法,通过所述搜索推荐算法对用户输入的关键词进行分词及过滤,获取匹配词
[0008]可选的,索引模块对用户获取的匹配词进行索引,采用jieba和pinyin分词相结合的形式,搜索字段使用jieba进行语义分词并进行前缀、全拼和模糊过滤。
[0009]可选的,原始数据的导入包括全量导入以及增量导入。
[0010]可选的,搜索推荐算法为多维数据加权分排序算法。
[0011]可选的,搜索模块,包括前端页面以及后台程序,所述前端页面用于获取用户输入的关键词,所述后台程序用于将所述关键词传输至搜索推荐模块。
[0012]本专利技术还提出了一种搜索推荐方法,包括:
[0013]设置存储介质Elasticsearch字段的映射模板;
[0014]通过数据迁移模块对原始数据进行导入,并对导入的数据进行清洗,将所述清洗后的数据由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;
[0015]通过搜索模块接收用户的搜索的关键词,将所述关键词推送至搜索推荐模块;
[0016]通过搜索推荐模块内置搜索推荐算法,通过所述搜索推荐算法对用户输入的关键
词进行分词及过滤,获取匹配词;通过索引模块对用户获取的匹配词进行索引。
[0017]可选的,索引模块对用户获取的匹配词进行索引,采用jieba和pinyin分词相结合的形式,搜索字段使用jieba进行语义分词并进行前缀、全拼和模糊过滤。
[0018]可选的,原始数据的导入包括全量导入以及增量导入。
[0019]可选的,搜索推荐算法为多维数据加权分排序算法。
[0020]可选的,搜索模块,包括前端页面以及后台程序,所述前端页面用于获取用户输入的关键词,所述后台程序用于将所述关键词传输至搜索推荐模块。
[0021]本专利技术采用Elasticsearch作为存储介质,极大提高系统响应。词条库每日增量更新,并对每个词条记录更新时间、更新次数。在数据更新时对词条文本信息进行语义分词,并在分词同时进行拼音映射,可以支持用户在搜索时使用拼音全拼、简拼和混合输入。在用户搜索是,对搜索词进行语义分词,用分词后结果进行算法匹配,算法结合前缀优先匹配、拼音汉字混合匹配、词条热度匹配及地理位置优先匹配,并可配置各维度权重,经过计算,最终给出综合判分,然后去重和排序后,给出前n位推荐,极大提高了准确性。
附图说明
[0022]图1为本专利技术系统的结构图;
[0023]图2为本专利技术方法的流程图。
具体实施方式
[0024]现在参考附图介绍本专利技术的示例性实施方式,然而,本专利技术可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本专利技术,并且向所属
的技术人员充分传达本专利技术的范围。对于表示在附图中的示例性实施方式中的术语并不是对本专利技术的限定。在附图中,相同的单元/元件使用相同的附图标记。
[0025]除非另有说明,此处使用的术语(包括科技术语)对所属
的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
[0026]下面结合实施例对本专利技术进行进一步的说明:
[0027]本专利技术提出了一种搜索推荐系统,如图1所示,包括:
[0028]索引模块,所述索引模块采用Elasticsearch作为存储介质,设置Elasticsearch字段的映射模板;所述索引模块对用户获取的匹配词进行索引;
[0029]数据迁移模块,所述数据迁移模块对原始数据进行导入,并对导入的数据进行清洗,将所述清洗后的数据由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;
[0030]搜索模块,所述搜索模块接收用户的搜索的关键词,将所述关键词推送至搜索推荐模块;
[0031]搜索推荐模块,所述搜索推荐模块内置搜索推荐算法,通过所述搜索推荐算法对用户输入的关键词进行分词及过滤,获取匹配词。
[0032]其中,索引模块对用户获取的匹配词进行索引,采用jieba和pinyin分词相结合的
形式,搜索字段使用jieba进行语义分词并进行前缀、全拼和模糊过滤。
[0033]其中,原始数据的导入包括全量导入以及增量导入。
[0034]其中,搜索推荐算法为多维数据加权分排序算法。
[0035]其中,搜索模块,包括前端页面以及后台程序,所述前端页面用于获取用户输入的关键词,所述后台程序用于将所述关键词传输至搜索推荐模块。
[0036]本专利技术采用Elasticsearch作为存储介质,此搜索引擎使用倒排索引极大提高系统响应。
[0037]设置Elasticsearch字段映射模板,对将要进行搜索的字段设置分词算法,本系统采用jieba和pinyin分词相结合,搜索字段使用jieba进行语义分词并分别进行三次过滤:前缀、全拼和模糊,以达到搜索时可以使用拼音全拼、简拼和汉字拼音混合输入的目的。
[0038]数据迁移模块由数据导入、清洗程序,MySQL原始数据库,Elasticsearch目标存储构成,数据导入包括全量导入和增量导入,系统初始会对原始数据进行全量导入,清洗程序在导入过程中会对脏数据进行过滤,最终存储到已经设置字段映射的Elasticsearch索引中。在数据存储或更本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索推荐系统,所述系统,包括:索引模块,所述索引模块采用Elasticsearch作为存储介质,设置Elasticsearch字段的映射模板;所述索引模块对用户获取的匹配词进行索引;数据迁移模块,所述数据迁移模块对原始数据进行导入,并对导入的数据进行清洗,将所述清洗后的数据由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;搜索模块,所述搜索模块接收用户的搜索的关键词,将所述关键词推送至搜索推荐模块;搜索推荐模块,所述搜索推荐模块内置搜索推荐算法,通过所述搜索推荐算法对用户输入的关键词进行分词及过滤,获取匹配词。2.根据权利要求1所述的系统,所述索引模块对用户获取的匹配词进行索引,采用jieba和pinyin分词相结合的形式,搜索字段使用jieba进行语义分词并进行前缀、全拼和模糊过滤。3.根据权利要求1所述的系统,所述原始数据的导入包括全量导入以及增量导入。4.根据权利要求1所述的系统,所述搜索推荐算法为多维数据加权分排序算法。5.根据权利要求1所述的系统,所述搜索模块,包括前端页面以及后台程序,所述前端页面用于获取用户输入的关键词,所述后台...

【专利技术属性】
技术研发人员:李宇圣
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1