负例样本构建方法、商品搜索方法、装置及电子设备制造方法及图纸

技术编号:40161801 阅读:20 留言:0更新日期:2024-01-26 23:35
本公开提出一种负例样本构建方法、商品搜索方法、装置及电子设备,涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能技术领域。方案为:获取正例样本数据,对查询语句及目标商品标题进行实体识别,以获取正例样本数据中包括的第一品牌词,再基于第一品牌词,与候选品牌词集中每个候选品牌词间的字面相似度,从候选品牌词集中获取第一参考品牌词,并利用第一参考品牌词替换目标商品标题中的第一品牌词,以获取噪声商品标题,基于噪声商品标题及查询语句,生成负例样本数据。由此,通过利用与商品标题包含的品牌词相似度高的参考品牌词替换对应品牌词,获得噪声商品标题及负例样本数据,降低负例样本获取成本,提高相关性模型的性能。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及自然语言处理、深度学习等人工智能,具体涉及一种负例样本构建方法、商品搜索方法、装置及电子设备


技术介绍

1、目前,可以通过相关性模型对查询语句query与候选结果标题title进行打分,并基于打分结果召回title。且相关性模型通常是基于人工标注的样本数据训练得到的,样本数据的获取成本高,效率低。


技术实现思路

1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。

2、本公开第一方面实施例提出了一种负例样本构建方法,包括:

3、获取正例样本数据,其中,所述正例样本数据中包括查询语句及目标商品标题;

4、对所述查询语句及所述目标商品标题进行实体识别,以获取所述正例样本数据中包括的第一品牌词,其中,所述第一品牌词为第一语言类型词;

5、基于所述第一品牌词,与候选品牌词集中每个候选品牌词间的字面相似度,从所述候选品牌词集中获取第一参考品牌词,其中,所述候选品牌词与所述第一品牌词的语言类型相同;

6、利用所述第一参考品牌词本文档来自技高网...

【技术保护点】

1.一种负例样本构建方法,包括:

2.如权利要求1所述的方法,其中,在所述从所述候选品牌词集中获取第一参考品牌词之前,还包括:

3.如权利要求2所述的方法,其中,所述根据所述第一总数量及所述第二总数量,确定参考数量,包括:

4.如权利要求2所述的方法,其中,所述基于所述第一品牌词,与候选品牌词集中每个候选品牌词间的字面相似度,从所述候选品牌词集中获取第一参考品牌词,包括:

5.如权利要求4所述的方法,其中,所述方法还包括:

6.如权利要求1-5任一项所述的方法,其中,所述利用所述第一参考品牌词替换所述目标商品标题中的第一品牌词,...

【技术特征摘要】

1.一种负例样本构建方法,包括:

2.如权利要求1所述的方法,其中,在所述从所述候选品牌词集中获取第一参考品牌词之前,还包括:

3.如权利要求2所述的方法,其中,所述根据所述第一总数量及所述第二总数量,确定参考数量,包括:

4.如权利要求2所述的方法,其中,所述基于所述第一品牌词,与候选品牌词集中每个候选品牌词间的字面相似度,从所述候选品牌词集中获取第一参考品牌词,包括:

5.如权利要求4所述的方法,其中,所述方法还包括:

6.如权利要求1-5任一项所述的方法,其中,所述利用所述第一参考品牌词替换所述目标商品标题中的第一品牌词,以获取噪声商品标题,包括:

7.如权利要求6所述的方法,其中,所述获取所述第一参考品牌词对应的第二参考品牌词,包括:

8.如权利要求7所述的方法,其中,在所述遍历所述参考词组对集之后,还包括:

9.一种商品搜索方法,包括:

10.一种负例样本构建装置,包括:

<...

【专利技术属性】
技术研发人员:阮慧彬陈艳刘璟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1