System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 句向量模型的优化方法、文本相似度计算方法以及装置制造方法及图纸_技高网

句向量模型的优化方法、文本相似度计算方法以及装置制造方法及图纸

技术编号:41058639 阅读:2 留言:0更新日期:2024-04-24 11:09
本申请涉及人工智能句向量技术领域,提出一种句向量模型的优化方法、文本相似度计算方法、装置、电子设备以及存储介质,该方法包括:根据对比学习损失函数,确定第一句向量模型;其中,所述第一句向量模型包括若干多头注意力模块以及若干前馈神经网络模块;计算每个所述多头注意力模块中第一网络参数的重要程度分数以及每个所述前馈神经网络模块中第二网络参数的重要程度分数;根据所述第一网络参数的重要程度分数以及所述第二网络参数的重要程度分数,对所述第一句向量模型进行网络参数裁剪,获得第二句向量模型;对所述第二句向量模型进行模型重训练,获得最优句向量模型,提升了最优句向量模型的语义表达效果。

【技术实现步骤摘要】

本申请实施例涉及人工智能句向量,尤其涉及一种句向量模型的优化方法、文本相似度计算方法、装置、电子设备以及存储介质。


技术介绍

1、在人工智能领域,句向量技术,属于自然语言处理中的文本表示领域。文本表示的目标是将文本数据转换为计算机可以理解和处理的向量形式,以便进行各种自然语言处理任务,如情感分析、文本分类、问答系统等。句向量是一种文本表示方法,它将整个句子映射到一个固定维度的向量空间中,捕捉句子的语义信息和上下文关系,从而方便后续的机器学习或深度学习处理。

2、然而,目前的句向量模型中,存在网络参数对于句向量模型的语义表达效果贡献不均匀、甚至有害的现象,导致句向量模型的语义表达效果降低。


技术实现思路

1、本申请实施例提供了一种句向量模型的优化方法、文本相似度计算方法、装置、电子设备以及存储介质,可以提高句向量模型的语义表达效果,该技术方案如下:

2、第一方面,本申请实施例提供了一种句向量模型的优化方法,包括步骤:

3、根据对比学习损失函数,确定第一句向量模型;其中,第一句向量模型包括若干多头注意力模块以及若干前馈神经网络模块;

4、计算每个多头注意力模块中第一网络参数的重要程度分数以及每个前馈神经网络模块中第二网络参数的重要程度分数;

5、根据第一网络参数的重要程度分数以及第二网络参数的重要程度分数,对第一句向量模型进行网络参数裁剪,获得第二句向量模型;

6、对第二句向量模型进行模型重训练,获得最优句向量模型

7、第二方面,本申请实施例提供了一种文本相似度计算方法,方法包括如下步骤:

8、获取文本语料;文本语料包括若干文本;

9、将每个文本输入至根据上述的句向量模型的优化方法获得的最优句向量模型中,获得对应的句向量表示;

10、根据句向量表示,计算若干文本之间的相似度。

11、第三方面,本申请实施例提供了一种句向量模型的优化装置,包括:

12、第一句向量模型确定模块,用于根据对比学习损失函数,确定第一句向量模型;其中,第一句向量模型包括若干多头注意力模块以及若干前馈神经网络模块;

13、重要程度分数计算模块,用于计算每个多头注意力模块中第一网络参数的重要程度分数以及每个前馈神经网络模块中第二网络参数的重要程度分数;

14、第二句向量模型获得模块,用于根据第一网络参数的重要程度分数以及第二网络参数的重要程度分数,对第一句向量模型进行网络参数裁剪,获得第二句向量模型;

15、最优句向量模型获得模块,用于对第二句向量模型进行模型重训练,获得最优句向量模型。

16、第四方面,本申请实施例提供了一种文本相似度计算装置,包括:

17、文本语料获取模块,用于获取文本语料;文本语料包括若干文本;

18、句向量表示获得模块,用于将每个文本输入至根据上述的句向量模型的优化方法获得的最优句向量模型中,获得对应的句向量表示;

19、相似度计算模块,用于根据句向量表示,计算若干文本之间的相似度。

20、第五方面,本申请实施例提供了一种电子设备,处理器、存储器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面或第二方面方法的步骤。

21、第六方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面方法的步骤。

22、本申请实施例根据对比学习损失函数,确定第一句向量模型;其中,第一句向量模型包括若干多头注意力模块以及若干前馈神经网络模块;计算每个多头注意力模块中第一网络参数的重要程度分数以及每个前馈神经网络模块中第二网络参数的重要程度分数;根据第一网络参数的重要程度分数以及第二网络参数的重要程度分数,对第一句向量模型进行网络参数裁剪,获得第二句向量模型;对第二句向量模型进行模型重训练,获得最优句向量模型。本申请通过对第一句向量模型进行网络参数裁剪,过滤了有害网络参数和低贡献网络参数,获得第二句向量模型,对第二句向量模型进行重训练,获得最优句向量模型,提升了最优句向量模型的语义表达效果。

23、为了更好地理解和实施,下面结合附图详细说明本申请的技术方案。

本文档来自技高网...

【技术保护点】

1.一种句向量模型的优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的句向量模型的优化方法,其特征在于:

3.根据权利要求1所述的句向量模型的优化方法,其特征在于:

4.根据权利要求1至3任意一项所述的句向量模型的优化方法,其特征在于:

5.根据权利要求4所述的句向量模型的优化方法,其特征在于:

6.一种文本相似度计算方法,其特征在于,包括如下步骤:

7.一种句向量模型的优化装置,其特征在于,包括:

8.一种文本相似度计算装置,其特征在于,包括:

9.一种电子设备,包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任意一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述方法的步骤。

【技术特征摘要】

1.一种句向量模型的优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的句向量模型的优化方法,其特征在于:

3.根据权利要求1所述的句向量模型的优化方法,其特征在于:

4.根据权利要求1至3任意一项所述的句向量模型的优化方法,其特征在于:

5.根据权利要求4所述的句向量模型的优化方法,其特征在于:

6.一种文本相似度计算方法,其特征在于,包括如下步骤:

7.一种句向量模型...

【专利技术属性】
技术研发人员:宋大为安睿泽张辰
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1