文本分类方法、文本分类模型训练方法、装置及设备制造方法及图纸

技术编号：40278038 阅读：15 留言：0更新日期：2024-02-02 23:05

本公开提供了一种文本分类方法、装置、电子设备及存储介质，可以应用于人工智能技术领域和金融技术领域。该方法包括：对待分类文本中的文本片段进行特征提取，得到文本词特征向量和文本数字特征向量；根据文本词特征向量和文本数字特征向量，得到文本片段的文本片段特征向量；对与待分类文本对应的音频中的音频片段进行特征提取，得到音频片段特征向量，其中，音频片段与文本片段相互对应；根据文本片段特征向量和音频片段特征向量，得到待分类文本的类别信息。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能和金融，尤其涉及一种文本分类方法、文本分类模型训练方法、装置、设备、介质和程序产品。

技术介绍

1、文本分类是指根据文本内容自动地将文本分配到预定义类别的过程，是自然语言处理基本的任务，也能够为更复杂的语言理解任务提供基础。

2、在实现本公开专利技术构思的过程中，专利技术人发现，在相关技术中，对文本进行分类存在准确性较低的问题。

技术实现思路

1、鉴于上述问题，本公开提供了一种文本分类方法、文本分类模型训练方法、装置、设备、介质和程序产品。

2、根据本公开的第一个方面，提供了一种文本分类方法，包括：对待分类文本中的文本片段进行特征提取，得到文本词特征向量和文本数字特征向量；根据文本词特征向量和文本数字特征向量，得到文本片段的文本片段特征向量；对与待分类文本对应的音频中的音频片段进行特征提取，得到音频片段特征向量，其中，音频片段与文本片段相互对应；根据文本片段特征向量和音频片段特征向量，得到待分类文本的类别信息。

3、根据本公开的实施例，对与待分类文本对应的音频中的音频片段进行特征提取，得到音频片段特征向量，包括：按照不同的特征类型，对音频片段进行特征提取，得到多个类型的音频片段特征向量；对多个类型的音频片段特征向量进行初始化处理，得到具有多个维度的音频片段特征向量，其中，多个维度和多个类型之间一一对应。

4、根据本公开的实施例，上述文本分类方法还包括：利用文本处理工具处理待分类文本和与待分类文本对应的音频，得到文本片

5、根据本公开的第二个方面，提供了一种文本分类模型训练方法，包括：对训练文本中的训练文本片段进行特征提取，得到训练文本词特征向量和训练文本数字特征向量；根据训练文本词特征向量和训练文本数字特征向量，得到训练文本片段的训练文本片段特征向量；对与训练文本对应的训练音频中的训练音频片段进行特征提取，得到训练音频片段特征向量，其中，训练音频片段与训练文本片段相互对应；利用训练文本片段特征向量和训练音频片段特征向量训练第一模型，得到第一目标模型，其中，第一目标模型用于确定待分类文本的类别信息。

6、根据本公开的实施例，利用训练文本片段特征向量和训练音频片段特征向量训练第一模型，得到第一目标模型，包括：根据训练文本片段特征向量、训练音频片段特征向量和噪声向量，得到目标训练特征向量；将目标训练特征向量输入第一模型，利用目标梯度下降算法，训练第一模型，得到第一目标模型，其中，目标梯度下降算法是利用梯度裁剪方法处理原始梯度下降算法得到的。

7、根据本公开的实施例，根据训练文本片段特征向量、训练音频片段特征向量和噪声向量，得到目标训练特征向量，包括：对训练文本片段特征向量和训练音频片段特征向量进行拼接处理，得到训练片段拼接向量；根据训练文本片段在训练文本中的位置信息，得到与训练文本片段对应的片段位置向量；根据片段位置向量和训练片段拼接向量，得到目标训练片段拼接向量；将噪声向量添加到目标训练片段拼接向量中，得到目标训练特征向量。

8、根据本公开的实施例，将噪声向量添加到目标训练片段拼接向量中，得到目标训练特征向量，包括：将噪声向量添加至目标训练片段拼接向量，得到目标片段噪声向量；根据目标片段噪声向量的片段结构，对目标片段噪声向量进行编码处理，得到目标训练特征向量。

9、根据本公开的实施例，目标训练特征向量为多个，第一模型为多个，多个第一模型与多个目标训练特征向量一一对应，多个目标训练特征向量各来自不同的训练服务器；将目标训练特征向量输入第一模型，利用目标梯度下降算法，训练第一模型，得到第一目标模型，包括在第一模型的模型参数不满足预设条件的情况下，重复执行以下操作：从多个训练服务器中，确定多个目标训练服务器，调用多个目标训练服务器，利用与多个目标训练服务器各自对应的多个目标训练特征向量，训练与多个目标训练服务器各自对应的多个第一模型，得到与多个第一模型各自对应的多个模型参数，根据多个模型参数，确定新的模型参数；在模型参数满足预设条件的情况下，根据满足预设条件的模型参数和第一模型，得到第一目标模型。

10、根据本公开的实施例，第一模型包括目标词级编码层，目标词级编码层是利用文本数值比较任务训练中间词级编码层得到的，中间词级编码层是利用文本数字分类任务训练初始词级编码层得到的，文本数字分类任务表征对文本中的数字进行分类的任务，文本数值比较任务表征对文本中属于同一类别的数字进行数值比较的任务；对训练文本中的训练文本片段进行特征提取，得到训练文本词特征向量和训练文本数字特征向量，包括：利用目标词级编码层对训练文本片段进行特征提取，得到训练文本词特征向量和训练文本数字特征向量。

11、本公开的第三方面提供了一种文本分类装置，包括：第一提取模块，用于对待分类文本中的文本片段进行特征提取，得到文本词特征向量和文本数字特征向量；第一获取模块，用于根据文本词特征向量和文本数字特征向量，得到文本片段的文本片段特征向量；第二提取模块，用于对与待分类文本对应的音频中的音频片段进行特征提取，得到音频片段特征向量，其中，音频片段与文本片段相互对应；第二获取模块，用于根据文本片段特征向量和音频片段特征向量，得到待分类文本的类别信息。

12、本公开的第四方面提供了一种文本分类模型训练装置，包括：第三提取模块，用于对训练文本中的训练文本片段进行特征提取，得到训练文本词特征向量和训练文本数字特征向量；第三获取模块，用于根据训练文本词特征向量和训练文本数字特征向量，得到训练文本片段的训练文本片段特征向量；第四提取模块，用于对与训练文本对应的训练音频中的训练音频片段进行特征提取，得到训练音频片段特征向量，其中，训练音频片段与训练文本片段相互对应；训练模块，用于利用训练文本片段特征向量和训练音频片段特征向量训练第一模型，得到第一目标模型，其中，第一目标模型用于确定待分类文本的类别信息。

13、本公开的第五方面提供了一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得一个或多个处理器执行上述方法。

14、本公开的第六方面还提供了一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行上述方法。

15、本公开的第七方面还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述方法。

16、根据本公开提供的文本分类方法、文本分类模型训练方法、装置、设备、介质和程序产品，通过对文本进行特征提取，得到文本中文本词的文本词特征向量和文本中文本数字的文本数字特征向量，由此，不仅利用了文本中文本词的特征向量，还充分利用了文本数字的特征向量，进而可以得到文本片段特征向量。基于此，在文本中包括较多数字的情况下，可以提高对文本分类的准确性。并且，由于使用与文本对应的音频，来提取得到音频片段特征向量，进而可以将文本片段特征向量和音频片段特本文档来自技高网...

【技术保护点】

1.一种文本分类方法，包括：

2.根据权利要求1所述的方法，其中，所述对与所述待分类文本对应的音频中的音频片段进行特征提取，得到音频片段特征向量，包括：

3.根据权利要求1或2所述的方法，还包括：

4.一种文本分类模型训练方法，包括：

5.根据权利要求4所述的方法，其中，所述利用所述训练文本片段特征向量和所述训练音频片段特征向量训练第一模型，得到第一目标模型，包括：

6.根据权利要求5所述的方法，其中，所述根据所述训练文本片段特征向量、所述训练音频片段特征向量和噪声向量，得到目标训练特征向量，包括：

7.根据权利要求6所述的方法，其中，所述将所述噪声向量添加到所述目标训练片段拼接向量中，得到所述目标训练特征向量，包括：

8.根据权利要求5～7中任一项所述的方法，其中，所述目标训练特征向量为多个，所述第一模型为多个，所述多个第一模型与所述多个目标训练特征向量一一对应，所述多个目标训练特征向量各来自不同的训练服务器；

9.根据权利要求4～7中任一项所述的方法，其中，所述第一模型包括目标词级

10.一种文本分类装置，包括：

11.一种文本分类模型训练装置，包括：

12.一种电子设备，包括：

13.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行根据权利要求1～3或者权利要求4～9中任一项所述的方法。

14.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1～3或者权利要求4～9中任一项所述的方法。

...

【技术特征摘要】