基于人工智能的文本向量生成方法、装置、设备及介质制造方法及图纸

技术编号:34567528 阅读:19 留言:0更新日期:2022-08-17 12:57
本申请涉及人工智能技术领域,揭示了一种基于人工智能的文本向量生成方法、装置、设备及介质,其中方法包括:获取目标文本;将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量;其中,所述文本向量生成模型是采用孪生技术和停止梯度技术,对预设的初始模型训练得到的模型;所述初始模型依次包括:特征提取初始单元、平均池化初始单元和线性映射初始单元。通过在初始模型中添加线性映射初始单元和通过停止梯度技术,使初始模型可以学习到文本有意义的表示向量,而且避免了将所有数据的表示都学习到非常相似,从而解决了孪生网络的奔溃解,从而提高了确定的目标文本向量的准确性。从而提高了确定的目标文本向量的准确性。从而提高了确定的目标文本向量的准确性。

【技术实现步骤摘要】
基于人工智能的文本向量生成方法、装置、设备及介质


[0001]本申请涉及到人工智能
,特别是涉及到一种基于人工智能的文本向量生成方法、装置、设备及介质。

技术介绍

[0002]无论是在推荐算法还是在搜索算法,对文本和/或图像的表示学习是非常重要的任务。以搜索算法为例,算法的核心是,根据查询的对象的表示向量,通过余弦相似度,匹配数据库中被查询的对象的表示向量,因此表示向量至关重要。
[0003]在无监督的表示学习中,孪生网络是标配结构。孪生网络是指将数据输入到两个相同的编码器提取特征,最后判断两组数据是否相似。然而孪生网络往往存在奔溃解,导致将所有数据的表示都学习到非常相似。

技术实现思路

[0004]本申请的主要目的为提供一种基于人工智能的文本向量生成方法、装置、设备及介质,旨在解决现有技术的孪生网络往往存在奔溃解,导致将所有数据的表示都学习到非常相似的技术问题。
[0005]为了实现上述专利技术目的,本申请提出一种基于人工智能的文本向量生成方法,所述方法包括:
[0006]获取目标文本;
[0007]将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量;
[0008]其中,所述文本向量生成模型是采用孪生技术和停止梯度技术,对预设的初始模型训练得到的模型;
[0009]所述初始模型依次包括:特征提取初始单元、平均池化初始单元和线性映射初始单元。
[0010]进一步的,所述将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量的步骤,包括:
[0011]将所述目标文本输入所述文本向量生成模型的特征提取单元进行特征提取,得到第一特征;
[0012]将所述第一特征输入所述文本向量生成模型的平均池化单元进行平均池化,得到第二特征;
[0013]将所述第二特征输入所述文本向量生成模型的线性映射单元进行文本向量生成,得到所述目标文本对应的所述目标文本向量。
[0014]进一步的,所述将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量的步骤之前,还包括:
[0015]获取多个训练样本,其中,各个所述训练样本中的每个所述训练样本包括:第一文
本样本、第二文本样本和文本相似标签;
[0016]将所述初始模型分别作为孪生网络的第一分支模型及第二分支模型,并根据预设的相似度算法和所述停止梯度技术确定所述孪生网络的相似度计算层的算法;
[0017]根据各个所述训练样本,对所述孪生网络进行训练,将训练结束的所述孪生网络中的所述第一分支模型或所述第二分支模型作为所述文本向量生成模型。
[0018]进一步的,所述获取多个训练样本的步骤之前,还包括:
[0019]获取多个待处理文本;
[0020]将各个所述待处理文本中的任一个所述待处理文本作为待分析文本;
[0021]从预设的翻译模型对库中获取一个翻译模型对作为目标翻译模型对;
[0022]采用所述目标翻译模型对中的第一语言翻译模型,对所述待分析文本进行翻译,得到翻译后文本;
[0023]采用所述目标翻译模型对中的第一语言回译模型,对所述翻译后文本进行翻译,得到回译后文本;
[0024]将所述待分析文本作为所述待分析文本对应的所述训练样本的所述第一文本样本;
[0025]将所述回译后文本作为所述待分析文本对应的所述训练样本的所述第二文本样本;
[0026]将预设的相同文本标识作为所述待分析文本对应的所述训练样本的所述文本相似标签。
[0027]进一步的,所述根据各个所述训练样本,对所述孪生网络进行训练,将训练结束的所述孪生网络中的所述第一分支模型或所述第二分支模型作为所述文本向量生成模型的步骤,包括:
[0028]从各个所述训练样本中获取任一个所述训练样本作为目标训练样本;
[0029]将所述目标训练样本中的所述第一文本样本输入所述孪生网络中的所述第一分支模型,并将所述第一分支模型的所述平均池化初始单元输出的向量作为第一池化向量,将所述第一分支模型输出的文本向量作为第一文本向量;
[0030]将所述目标训练样本中的所述第二文本样本输入所述孪生网络中的所述第二分支模型,并将所述第二分支模型的所述平均池化初始单元输出的向量作为第二池化向量,将所述第二分支模型输出的文本向量作为第二文本向量;
[0031]根据所述第一文本向量、所述第二文本向量、所述第一池化向量、所述第二池化向量、所述目标训练样本中的所述文本相似标签和所述孪生网络的所述相似度计算层进行损失值计算;
[0032]根据所述损失值,对所述孪生网络的网络参数进行更新;
[0033]重复执行所述从各个所述训练样本中获取任一个所述训练样本作为目标训练样本的步骤,直至达到预设的模型训练结束条件;
[0034]将达到所述模型训练结束条件的所述孪生网络中的所述第一分支模型或所述第二分支模型作为所述文本向量生成模型。
[0035]进一步的,所述根据所述第一文本向量、所述第二文本向量、所述第一池化向量、所述第二池化向量、所述目标训练样本中的所述文本相似标签和所述孪生网络的所述相似
度计算层进行损失值计算的步骤,包括:
[0036]根据所述停止梯度技术,将所述第一文本向量和所述第二池化向量输入所述相似度计算层进行相似度计算,得到第一相似度;
[0037]根据所述停止梯度技术,将所述第二文本向量和所述第一池化向量输入所述相似度计算层进行相似度计算,得到第二相似度;
[0038]根据所述第一相似度和所述第二相似度进行所述损失值计算。
[0039]进一步的,所述损失值的计算公式ζ为:
[0040]ζ=(D(p1,stopgrad(z2))+D(p2,stopgrad(z1)))/2
[0041][0042][0043]其中,p1是所述第一文本向量,p2是所述第二文本向量,z1是所述第一池化向量,z2是所述第二池化向量,D(p1,stopgrad(z2))是所述第一相似度,D(p2,stopgrad(z1))是所述第二相似度。
[0044]本申请还提出了一种基于人工智能的文本向量生成装置,所述装置包括:
[0045]数据获取模块,用于获取目标文本;
[0046]目标文本向量确定模块,用于将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量;
[0047]模型训练模块,用于采用孪生技术和停止梯度技术,对预设的初始模型训练得到所述文本向量生成模型,所述初始模型依次包括:特征提取初始单元、平均池化初始单元和线性映射初始单元。
[0048]本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的文本向量生成方法,其特征在于,所述方法包括:获取目标文本;将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量;其中,所述文本向量生成模型是采用孪生技术和停止梯度技术,对预设的初始模型训练得到的模型;所述初始模型依次包括:特征提取初始单元、平均池化初始单元和线性映射初始单元。2.根据权利要求1所述的基于人工智能的文本向量生成方法,其特征在于,所述将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量的步骤,包括:将所述目标文本输入所述文本向量生成模型的特征提取单元进行特征提取,得到第一特征;将所述第一特征输入所述文本向量生成模型的平均池化单元进行平均池化,得到第二特征;将所述第二特征输入所述文本向量生成模型的线性映射单元进行文本向量生成,得到所述目标文本对应的所述目标文本向量。3.根据权利要求1所述的基于人工智能的文本向量生成方法,其特征在于,所述将所述目标文本输入预设的文本向量生成模型进行文本向量生成,得到所述目标文本对应的目标文本向量的步骤之前,还包括:获取多个训练样本,其中,各个所述训练样本中的每个所述训练样本包括:第一文本样本、第二文本样本和文本相似标签;将所述初始模型分别作为孪生网络的第一分支模型及第二分支模型,并根据预设的相似度算法和所述停止梯度技术确定所述孪生网络的相似度计算层的算法;根据各个所述训练样本,对所述孪生网络进行训练,将训练结束的所述孪生网络中的所述第一分支模型或所述第二分支模型作为所述文本向量生成模型。4.根据权利要求3所述的基于人工智能的文本向量生成方法,其特征在于,所述获取多个训练样本的步骤之前,还包括:获取多个待处理文本;将各个所述待处理文本中的任一个所述待处理文本作为待分析文本;从预设的翻译模型对库中获取一个翻译模型对作为目标翻译模型对;采用所述目标翻译模型对中的第一语言翻译模型,对所述待分析文本进行翻译,得到翻译后文本;采用所述目标翻译模型对中的第一语言回译模型,对所述翻译后文本进行翻译,得到回译后文本;将所述待分析文本作为所述待分析文本对应的所述训练样本的所述第一文本样本;将所述回译后文本作为所述待分析文本对应的所述训练样本的所述第二文本样本;将预设的相同文本标识作为所述待分析文本对应的所述训练样本的所述文本相似标签。5.根据权利要求3所述的基于人工智能的文本向量生成方法,其特征在于,所述根据各
个所述训练样本,对所述孪生网络进行训练,将训练结束的所述孪生网络中的所述第一分支模型或所述第二分支模型作为所述文本向量生成模型的步骤,包括:从各个所述训练样本中获取任一个所述训练样本作为目标训练样本;将所述目标训练样本中的所述第一文本样本输入所述孪生网络中的所述第一分支模型,...

【专利技术属性】
技术研发人员:唐小初舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1