关键词识别模型的训练方法及装置制造方法及图纸

技术编号:35545942 阅读:20 留言:0更新日期:2022-11-12 15:24
本公开提供了一种关键词识别模型的训练方法及装置。包括:获取训练样本;训练样本包括:初始菜品的菜品名称、菜品多域信息及与初始菜品关联的多个初始关键词;将菜品名称、菜品多域信息和多个初始关键词输入至待训练关键词识别模型;调用待训练关键词识别模型对菜品名称、菜品多域信息和多个初始关键词进行处理,获取待训练关键词识别模型输出的多个初始关键词相对于初始菜品的预测概率;根据预测概率计算得到待训练关键词识别模型的损失函数;根据损失函数调整待训练关键词识别模型的模型参数;迭代执行获取训练样本,至根据损失函数调整待训练关键词识别模型的模型参数的步骤,直至得到目标关键词识别模型。本公开可以提升关键词预测的准确率。提升关键词预测的准确率。提升关键词预测的准确率。

【技术实现步骤摘要】
关键词识别模型的训练方法及装置


[0001]本公开的实施例涉及模型训练
,尤其涉及一种关键词识别模型的训练方法及装置。

技术介绍

[0002]搜索广告本质上是一个信息检索系统,用户输入查询词后,从海量广告数据中寻找与用户需求最匹配的结果。为了提升广告投放的精细度,广告主通过关键词对广告进行竞价。广告系统通过将查询词与关键词进行关联,进而召回相应的广告。
[0003]出于降低广告主的投放成本考虑,系统可以自动地根据广告主提供的文本或物料信息,挖掘相应的关键词。如何为广告主商家挖掘尽可能多地高相关的关键词,成为搜索广告系统的重点研究方向之一。
[0004]目前,通常是采用迭代式挖掘算法,基于文本信息里词

词的共现关系计算词的重要度,选取重要度高的词作为关键词。或者,以广告标题、描述等文本信息作为输入,通过序列标注式模型抽取其中的核心词汇作为关键词。或者,以广告标题、描述等文本信息作为输入,通过Seq2Seq生成式网络模型生成关键词。
[0005]然而,上述方案中,数据挖掘方式生成的关键词,依赖人工规则保证相关性,通用性较差,不利于后续迭代优化;而信息抽取方式得到的关键词,只能是广告文本信息的子串,一般准确性较高,由于无法挖掘文本不相关但语义相关的关键词,多样性较差;文本生成方法能挖掘与原始文本无关但语义相关的关键词,多样性较好,但往往存在过度泛化问题,进而降低准确性。

技术实现思路

[0006]本公开的实施例提供一种关键词识别模型的训练方法及装置,用以在保证准确率的同时,又能保持多样性,提升模型去噪能力,提升模型准确率。
[0007]根据本公开的实施例的第一方面,提供了一种关键词识别模型的训练方法,包括:
[0008]获取训练样本;所述训练样本包括:初始菜品的菜品名称、菜品多域信息及与所述初始菜品关联的多个初始关键词;
[0009]将所述菜品名称、所述菜品多域信息和所述多个初始关键词输入至待训练关键词识别模型;
[0010]调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率;
[0011]根据所述预测概率,计算得到所述待训练关键词识别模型对应的损失函数;
[0012]根据所述损失函数调整所述待训练关键词识别模型的模型参数;
[0013]迭代执行所述获取训练样本,至所述根据所述损失函数调整所述待训练关键词识别模型的模型参数的步骤,直至得到目标关键词识别模型。
[0014]可选地,所述待训练关键词识别模型包括:特征嵌入层、注意力机制层和解码层,
[0015]所述调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率,包括:
[0016]调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息;
[0017]调用所述注意力机制层对所述菜品词位置信息、所述重要指标信息和字粒度信息进行处理,得到所述菜品多域信息对应的关注度信息;
[0018]调用所述解码层对所述关注度信息进行解码处理,得到所述多个初始关键词相对于所述初始菜品的预测概率。
[0019]可选地,所述特征嵌入层包括:位置信息标识单元、重要指标获取单元和字粒度信息获取单元,
[0020]所述调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息,包括:
[0021]调用所述位置信息标识单元对所述菜品名称进行标识处理,以标识所述菜品名称中各菜品词的菜品词位置信息;
[0022]调用所述重要指标获取单元对所述菜品多域信息和所述菜品名称进行处理,以获取所述菜品多域信息对所述菜品名称的重要指标信息;
[0023]调用所述字粒度信息获取单元对所述菜品多域信息进行处理,以得到所述菜品多域信息对应的字粒度信息。
[0024]可选地,在所述得到目标关键词识别模型之后,还包括:
[0025]获取用户输入的查询关键词;
[0026]将所述查询关键词输入至所述目标关键词识别模型,以获取由所述目标关键词识别模型输出的所述查询关键词对应的查询标签序列,及所述查询标签序列对应的标签概率;
[0027]根据所述标签概率,从所述查询标签序列中筛选出N个目标查询标签序列,N为大于等于1的正整数;
[0028]对所述目标查询标签序列进行转换处理,生成所述目标查询标签序列对应的目标关键词;
[0029]根据所述目标关键词,查询得到目标菜品。
[0030]可选地,所述根据所述标签概率,从所述查询标签序列中筛选出N个目标查询,包括:
[0031]根据所述标签概率由大到小的顺序对所述查询标签序列进行排序,得到排序结果;
[0032]根据所述排序结果,从所述查询标签序列中筛选出排序在前N位的查询标签序列作为所述目标查询标签序列。
[0033]根据本公开的实施例的第二方面,提供了一种关键词识别模型的训练装置,包括:
[0034]训练样本获取模块,用于获取训练样本;所述训练样本包括:初始菜品的菜品名
称、菜品多域信息及与所述初始菜品关联的多个初始关键词;
[0035]训练样本输入模块,用于将所述菜品名称、所述菜品多域信息和所述多个初始关键词输入至待训练关键词识别模型;
[0036]预测概率获取模块,用于调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率;
[0037]损失函数计算模块,用于根据所述预测概率,计算得到所述待训练关键词识别模型对应的损失函数;
[0038]模型参数调整模块,用于根据所述损失函数调整所述待训练关键词识别模型的模型参数;
[0039]目标识别模型获取模块,用于迭代执行所述训练样本获取模块、所述训练样本输入模块、所述预测概率获取模块、所述损失函数计算模块和所述模型参数调整模块,直至得到目标关键词识别模型。
[0040]可选地,所述待训练关键词识别模型包括:特征嵌入层、注意力机制层和解码层,
[0041]所述预测概率获取模块包括:
[0042]位置指标信息获取子模块,用于调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息;
[0043]关注度获取子模块,用于调用所述注意力机制层对所述菜品词位置信息、所述重要指标信息和字粒度信息进行处理,得到所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关键词识别模型的训练方法,其特征在于,包括:获取训练样本;所述训练样本包括:初始菜品的菜品名称、菜品多域信息及与所述初始菜品关联的多个初始关键词;将所述菜品名称、所述菜品多域信息和所述多个初始关键词输入至待训练关键词识别模型;调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率;根据所述预测概率,计算得到所述待训练关键词识别模型对应的损失函数;根据所述损失函数调整所述待训练关键词识别模型的模型参数;迭代执行所述获取训练样本,至所述根据所述损失函数调整所述待训练关键词识别模型的模型参数的步骤,直至得到目标关键词识别模型。2.根据权利要求1所述的方法,其特征在于,所述待训练关键词识别模型包括:特征嵌入层、注意力机制层和解码层,所述调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率,包括:调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息;调用所述注意力机制层对所述菜品词位置信息、所述重要指标信息和字粒度信息进行处理,得到所述菜品多域信息对应的关注度信息;调用所述解码层对所述关注度信息进行解码处理,得到所述多个初始关键词相对于所述初始菜品的预测概率。3.根据权利要求2所述的方法,其特征在于,所述特征嵌入层包括:位置信息标识单元、重要指标获取单元和字粒度信息获取单元,所述调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息,包括:调用所述位置信息标识单元对所述菜品名称进行标识处理,以标识所述菜品名称中各菜品词的菜品词位置信息;调用所述重要指标获取单元对所述菜品多域信息和所述菜品名称进行处理,以获取所述菜品多域信息对所述菜品名称的重要指标信息;调用所述字粒度信息获取单元对所述菜品多域信息进行处理,以得到所述菜品多域信息对应的字粒度信息。4.根据权利要求1所述的方法,其特征在于,在所述得到目标关键词识别模型之后,还包括:获取用户输入的查询关键词;将所述查询关键词输入至所述目标关键词识别模型,以获取由所述目标关键词识别模型输出的所述查询关键词对应的查询标签序列,及所述查询标签序列对应的标签概率;
根据所述标签概率,从所述查询标签序列中筛选出N个目标查询标签序列,N为大于等于1的正整数;对所述目标查询标签序列进行转换处理,生成所述目标查询标签序列对应的目标关键词;根据所述目标关键词,查询得到目标菜品。5.根据权利要求4所述的方法,其特征在于,所述根据所述标签概率,从所述查询标签序列中筛选出N个目标查询,包括:根据所述标签概率由大到小的顺序对所述查询标签序列进行排序,得到排序结果;根据所述排序结果,从所述查询标签序列中筛选出排序在前N位的查询标签序列作为所述目标查询标签序列。6.一种关键词识别模型的训练装置,其特征在于,包括:训练样本获取模块,用于获取训练样本;所述训练样本包括:初始菜品的菜品名称、菜品多域信息及与所述初始菜品关联的多个初始关键词;训练样本输入模块,用于将所述菜品名称、所述菜品多域信息和所述多个...

【专利技术属性】
技术研发人员:向超能王泽华陈应虎
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1