【技术实现步骤摘要】
模型训练方法、信息生成方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及模型训练方法、信息生成方法、装置、电子设备和计算机可读介质。
技术介绍
文本的标签词是能够反映出文本内容及读者兴趣的词语。通常,一个文本可以具有一个或多个标签词。准确地确定文本的标签词,能够有助于读者快速了解到全文的内容。对于文本的分类、推荐、关联等具有重要的作用。现有的确定文本标签词的方式,通常是抽取文本中较为重要的词语,作为文本的标签词。然而,这种方式无法生成出不在文本中出现的标签词,导致所确定的标签词不够准确。
技术实现思路
本申请实施例提出了模型训练方法、信息生成方法、装置、电子设备和计算机可读介质,以解决现有技术中由于采用抽取方式无法生成未出现在文本中的标签词,导致所确定的标签词不够准确的技术问题。第一方面,本申请实施例提供了一种模型训练方法,包括:从样本集中提取样本文本和样本文本的标签词序列;确定样本文本对应的第一词向量序列和标签词序列对应的第二词向量序列;将第一词向量序列作为预先建立的第一初始模型的输入,将第一初始模型的输出和第一词向量序列作为预先建立的第二初始模型的输入,将第二词向量序列作为第二初始模型的输出,利用机器学习方法,对第一初始模型和第二初始模型进行训练;将训练完成后的第一初始模型确定为语义向量生成模型,将训练后的第二初始模型确定为标签词生成模型。在一些实施例中,第一初始模型为使用自注意力机制的机器翻译模型中的编码模型,第二初始模型为机器翻译模型中的解码模型。在一些实施例中,样本集中包括多个样本文本和多个样本文本中的各样本文本的标签词序 ...
【技术保护点】
1.一种模型训练方法,其特征在于,包括:从样本集中提取样本文本和所述样本文本的标签词序列;确定所述样本文本对应的第一词向量序列和所述标签词序列对应的第二词向量序列;将所述第一词向量序列作为预先建立的第一初始模型的输入,将所述第一初始模型的输出和所述第一词向量序列作为预先建立的第二初始模型的输入,将所述第二词向量序列作为所述第二初始模型的输出,利用机器学习方法,对所述第一初始模型和所述第二初始模型进行训练;将训练完成后的所述第一初始模型确定为语义向量生成模型,将训练后的所述第二初始模型确定为标签词生成模型。
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:从样本集中提取样本文本和所述样本文本的标签词序列;确定所述样本文本对应的第一词向量序列和所述标签词序列对应的第二词向量序列;将所述第一词向量序列作为预先建立的第一初始模型的输入,将所述第一初始模型的输出和所述第一词向量序列作为预先建立的第二初始模型的输入,将所述第二词向量序列作为所述第二初始模型的输出,利用机器学习方法,对所述第一初始模型和所述第二初始模型进行训练;将训练完成后的所述第一初始模型确定为语义向量生成模型,将训练后的所述第二初始模型确定为标签词生成模型。2.根据权利要求1所述的模型训练方法,其特征在于,所述第一初始模型为使用自注意力机制的机器翻译模型中的编码模型,所述第二初始模型为所述机器翻译模型中的解码模型。3.根据权利要求1所述的模型训练方法,其特征在于,所述样本集中包括多个样本文本和所述多个样本文本中的各样本文本的标签词序列;以及在所述从样本集中提取样本文本和所述样本文本的标签词序列之前,所述方法还包括:对样本集中的各样本文本进行分词;将分词后所得到的各词和所述标签词序列中的标签词汇总为词表;对于所述词表中的每一个词,随机初始化预设维数的向量作为该词的词向量。4.根据权利要求3所述的模型训练方法,其特征在于,所述确定所述样本文本对应的第一词向量序列和所述标签词序列对应的第二词向量序列,包括:将所提取的样本文本作为目标样本文本,从随机初始化的词向量中,提取对所述目标样本文本分词后所得到的各个词的词向量,得到与所述目标样本文本对应的第一词向量序列;将所述目标样本文本的标签词序列作为目标标签词序列,从随机初始化的词向量中,提取所述目标标签词序列中的各词对应的词向量,得到与所述目标标签词序列对应的第二词向量序列。5.一种模型训练装置,其特征在于,包括:提取单元,被配置成从样本集中提取样本文本和所述样本文本的标签词序列;第一确定单元,被配置成确定所述样本文本对应的第一词向量序列和所述标签词序列对应的第二词向量序列;训练单元,被配置成将所述第一词向量序列作为预先建立的第一初始模型的输入,将所述第一初始模型的输出和所述第一词向量序列作为预先建立的第二初始模型的输入,将所述第二词向量序列作为所述第二初始模型的输出,利用机器学习装置,对所述第一初始模型和所述第二初始模型进行训练;第二确定单元,被配置成将训练完成后的所述第一初始模型确定为语义向量生成模型,将训练后的所述第二初始模型确定为标签词生成模型。6.根据权利要求5所述的模型训练装置,其特征在于,所述第一初始模型为使用自注意力机制的机器翻译模型中的编码模型,所述第二初始模型为所述机器翻译模型中的解码模型。7.根据权利...
【专利技术属性】
技术研发人员:张轩玮,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。