【技术实现步骤摘要】
本专利技术涉及数据查询,特别涉及一种基于ai与es的商品检索方法及装置。
技术介绍
1、目前商品搜索在业界最流行的方式是将商品数据导入es(elasticsearch,一种搜索引擎),建立相应的倒排索引,在不同字段上使用wildcard、term、match、match_phrase等方法(es最常用的几个方法)进行搜索。
2、1.模糊匹配,将关键字使用通配符(*,星号)后,使用wildcard搜索,在商品的名称、品目、品牌、型号、供应商等字段上分别进行匹配,能够搜索出含有完整关键词的商品。
3、2.分词搜索,使用match或match_phrase方法搜索,依赖es底层倒排索引;搜索时使用先将关键词进行分词,再去倒排索引中查询匹配到的分词所对应的数据文档。
4、3.完全匹配,使用term完全匹配字段内容,适用于知道搜索字段并且完全匹配的情况。
5、4.权重搜索,在关键词搜索中有的字段例如供应商名称、产地等字段实际搜索占比很低,而品目、品牌的实际搜索占比很高;通过统计分析搜索日志,提高实际
...【技术保护点】
1.一种基于AI与ES的商品检索方法,其特征在于,包括:
2.根据权利要求1所述的一种基于AI与ES的商品检索方法,其特征在于,所述步骤1具体为:根据商品数据计算商品每种品目的词汇在文档中的TF-IDF值,构建出每种品目对应文档的TF-IDF向量,将所述TF-IDF向量作为关键特征,驱动朴素贝叶斯分类器的训练;在训练阶段,朴素贝叶斯分类器根据所述关键特征,学习并建立起TF-IDF向量与不同品目类别之间的映射关系,完成朴素贝叶斯分类器建立;将所述关键词转化为相应的TF-IDF向量,并输入至已训练完成的朴素贝叶斯分类器中,得到品目结果。
3.根据权
...【技术特征摘要】
1.一种基于ai与es的商品检索方法,其特征在于,包括:
2.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤1具体为:根据商品数据计算商品每种品目的词汇在文档中的tf-idf值,构建出每种品目对应文档的tf-idf向量,将所述tf-idf向量作为关键特征,驱动朴素贝叶斯分类器的训练;在训练阶段,朴素贝叶斯分类器根据所述关键特征,学习并建立起tf-idf向量与不同品目类别之间的映射关系,完成朴素贝叶斯分类器建立;将所述关键词转化为相应的tf-idf向量,并输入至已训练完成的朴素贝叶斯分类器中,得到品目结果。
3.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤4中所述领域词库建设包括:在政府采购领域,收集商品的品目、品牌、参数名和参数值,同时按照不同业务划分;将收集到的数据去掉多余的空格、特殊符号、纠错、去重,最后人工复核后纳入领域词库;通过品目、品牌、参数名和参数值分别形成对应的词库;
4.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤5具体为:根据所述词语从倒排索引中找到对应的文档,用bm25评分模型,所述bm25评分模型的计算公式中包括可调整参数k1和b,将k1设置为0,b调整为0.75,并使用es端的function_score或script_score调整bm25文档评分,将更匹配的商品优先展示,完成检索。
5.根据权利要求1所述的一种基于ai与es的商品检索方法,其特征在于,所述步骤3具体为:采用ner技术识别出关键词中每个分词的标签,
6...
【专利技术属性】
技术研发人员:杨彪,刘荧杰,林泽然,林雨堆,蒙锐,
申请(专利权)人:博思数采科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。