一种基于AI与ES的商品检索方法及装置制造方法及图纸

技术编号:43886427 阅读:14 留言:0更新日期:2025-01-03 13:03
本发明专利技术提供一种基于AI与ES的商品检索方法及装置,方法包括:将关键词使用朴素贝叶斯对关键词分类,得到品目结果;构建ES端查询条件query对象,设置品目id作为查询条件;将关键词传入结构化感知机,返回所识别出的字段以及标签,并设置到query对象中;将query对象发送到ES端,ES端根据所述字段,使用对应的分词器进行分词,从领域词库中获取到对应词语;根据所述词语从倒排索引中找到对应的文档,完成检索,在保证搜索性能的同时,大幅提高了商品搜索的准确性,提高用户体验。

【技术实现步骤摘要】

本专利技术涉及数据查询,特别涉及一种基于ai与es的商品检索方法及装置。


技术介绍

1、目前商品搜索在业界最流行的方式是将商品数据导入es(elasticsearch,一种搜索引擎),建立相应的倒排索引,在不同字段上使用wildcard、term、match、match_phrase等方法(es最常用的几个方法)进行搜索。

2、1.模糊匹配,将关键字使用通配符(*,星号)后,使用wildcard搜索,在商品的名称、品目、品牌、型号、供应商等字段上分别进行匹配,能够搜索出含有完整关键词的商品。

3、2.分词搜索,使用match或match_phrase方法搜索,依赖es底层倒排索引;搜索时使用先将关键词进行分词,再去倒排索引中查询匹配到的分词所对应的数据文档。

4、3.完全匹配,使用term完全匹配字段内容,适用于知道搜索字段并且完全匹配的情况。

5、4.权重搜索,在关键词搜索中有的字段例如供应商名称、产地等字段实际搜索占比很低,而品目、品牌的实际搜索占比很高;通过统计分析搜索日志,提高实际搜索占比较高的字段对本文档来自技高网...

【技术保护点】

1.一种基于AI与ES的商品检索方法,其特征在于,包括:

2.根据权利要求1所述的一种基于AI与ES的商品检索方法,其特征在于,所述步骤1具体为:根据商品数据计算商品每种品目的词汇在文档中的TF-IDF值,构建出每种品目对应文档的TF-IDF向量,将所述TF-IDF向量作为关键特征,驱动朴素贝叶斯分类器的训练;在训练阶段,朴素贝叶斯分类器根据所述关键特征,学习并建立起TF-IDF向量与不同品目类别之间的映射关系,完成朴素贝叶斯分类器建立;将所述关键词转化为相应的TF-IDF向量,并输入至已训练完成的朴素贝叶斯分类器中,得到品目结果。

3.根据权利要求1所述的一种基...

【技术特征摘要】

1.一种基于ai与es的商品检索方法,其特征在于,包括:

2.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤1具体为:根据商品数据计算商品每种品目的词汇在文档中的tf-idf值,构建出每种品目对应文档的tf-idf向量,将所述tf-idf向量作为关键特征,驱动朴素贝叶斯分类器的训练;在训练阶段,朴素贝叶斯分类器根据所述关键特征,学习并建立起tf-idf向量与不同品目类别之间的映射关系,完成朴素贝叶斯分类器建立;将所述关键词转化为相应的tf-idf向量,并输入至已训练完成的朴素贝叶斯分类器中,得到品目结果。

3.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤4中所述领域词库建设包括:在政府采购领域,收集商品的品目、品牌、参数名和参数值,同时按照不同业务划分;将收集到的数据去掉多余的空格、特殊符号、纠错、去重,最后人工复核后纳入领域词库;通过品目、品牌、参数名和参数值分别形成对应的词库;

4.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤5具体为:根据所述词语从倒排索引中找到对应的文档,用bm25评分模型,所述bm25评分模型的计算公式中包括可调整参数k1和b,将k1设置为0,b调整为0.75,并使用es端的function_score或script_score调整bm25文档评分,将更匹配的商品优先展示,完成检索。

5.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤3具体为:采用ner技术识别出关键词中每个分词的标签,

6...

【专利技术属性】
技术研发人员:杨彪刘荧杰林泽然林雨堆蒙锐
申请(专利权)人:博思数采科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1