基于人工智能的句子向量生成方法、装置、设备及介质制造方法及图纸

技术编号:32674683 阅读:23 留言:0更新日期:2022-03-17 11:30
本申请涉及人工智能技术领域,揭示了一种基于人工智能的句子向量生成方法、装置、设备及介质,其中方法包括:将所述目标文本输入句子向量生成模型进行句子向量生成得到目标句子向量;采用获取的多个训练样本对预设的双塔模型进行无监督训练,所述双塔模型包括正模型和负模型,多个所述训练样本是由多个正样本和多个负样本组成,同一个所述正样本中的原始文本和对比文本是相同的文本,同一个所述负样本中的所述原始文本和所述对比文本是不相同的文本;将训练结束的所述双塔模型中的所述正模型作为所述句子向量生成模型。从而将模型训练的目标转移到句子向量的学习上,有利于训练出能获取到较为泛化的句子向量,提高了句子向量的准确性。的准确性。的准确性。

【技术实现步骤摘要】
基于人工智能的句子向量生成方法、装置、设备及介质


[0001]本申请涉及到人工智能
,特别是涉及到一种基于人工智能的句子向量生成方法、装置、设备及介质。

技术介绍

[0002]随着自然语言处理领域技术逐步运用到现实生活中,句子向量(sentence embedding)越来越成为学者的研究热点。在不同的研究中,句子向量经常被运用到不同的任务,比如,分类、相似性计算、聚类等任务,准确的句子向量对任务的执行结果的准确性至关重要。
[0003]传统的基于Bert(Bidirectional Encoder Representation from Transformers)模型获取句子向量的方法,主要是将句子输入到预先训练的Bert模型中,将模型最后一层输出的多个词向量计算平均值作为最终的句子向量,该方法简单方便且不用对模型进行微调训练,但是句子向量不是Bert模型预训练的目标,因此通过最后一层得到的句子向量往往没有中间层的词向量效果好,从而导致句子向量的准确性不高。

技术实现思路

[0004]本申请的主要目的为提供一种基本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的句子向量生成方法,其特征在于,所述方法包括:获取目标文本;将所述目标文本输入句子向量生成模型进行句子向量生成;获取所述句子向量生成模型输出的所述句子向量作为所述目标文本对应的目标句子向量;其中,所述句子向量生成模型通过如下步骤得到:采用获取的多个训练样本对预设的双塔模型进行无监督训练,其中,所述双塔模型包括正模型和负模型,多个所述训练样本是由多个正样本和多个负样本组成,同一个所述正样本中的原始文本和对比文本是相同的文本,同一个所述负样本中的所述原始文本和所述对比文本是不相同的文本;将训练结束的所述双塔模型中的所述正模型作为所述句子向量生成模型。2.根据权利要求1所述的基于人工智能的句子向量生成方法,其特征在于,所述将所述目标文本输入句子向量生成模型进行句子向量生成,得到所述目标文本对应的目标句子向量的步骤之前,还包括:获取多个所述训练样本;将所述训练样本的原始文本输入所述双塔模型的所述正模型进行句子向量生成,得到第一句子向量;将所述训练样本的对比文本输入所述双塔模型的所述负模型进行句子向量生成,得到第二句子向量;采用所述双塔模型的相似度计算层,计算所述第一句子向量和所述第二句子向量之间的相似度,得到目标相似度;根据所述目标相似度和所述训练样本的样本标定值训练所述双塔模型,直至达到第一训练目标,将达到所述第一训练目标的所述双塔模型中的所述正模型作为所述句子向量生成模型。3.根据权利要求2所述的基于人工智能的句子向量生成方法,其特征在于,所述正模型和所述负模型均采用Bert模型,所述将所述训练样本的原始文本输入所述双塔模型的所述正模型进行句子向量生成,得到第一句子向量的步骤,包括:将所述训练样本的所述原始文本输入所述正模型,获取所述正模型针对标志位的输出向量作为所述第一句子向量;所述将所述训练样本的对比文本输入所述双塔模型的所述负模型进行句子向量生成,得到第二句子向量的步骤,包括:将所述训练样本的所述对比文本输入所述负模型,获取所述负模型针对所述标志位的输出向量作为所述第二句子向量。4.根据权利要求2所述的基于人工智能的句子向量生成方法,其特征在于,所述获取多个所述训练样本的步骤,包括:获取待提取文本集;从所述待提取文本集中获取一个文本作为待分析文本;将所述待分析文本作为所述待分析文本对应的所述正样本的所述原始文本和所述对比文本;
将正样本标定值作为所述待分析文本对应的所述正样本的所述样本标定值,将所述正样本作为一个所述训练样本;从所述待提取文本集中的所述待分析文本以外的各个所述文本中获取一个所述文本作为所述待分析文本对应的负文本;将所述待分析文本作为所述待分析文本对应的所述负样本的所述原始文本;将所述负文本作为所述待分析文本对应的所述负样本的所述对比文本;将负样本标定值作为所述待分析文本对应的所述负样本的所述样本标定值,将所述负样本作为一个所述训练样本;重复执行所述从所述待提取文本集中的所述待分析文本以外的各个所述文本中获取一个所述文本作为所述待分析文本对应的负文本的步骤,直至迭代次数达到预设次数;重复执行所述从所述待提取文本集中获取一个文本作为待分析文本的步骤,直至完成所述待提取文本集中的所述文本的获取。5.根据权利要求4所述的基...

【专利技术属性】
技术研发人员:陈浩
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1