文本分类模型的训练方法、文本分类方法及相关装置制造方法及图纸

技术编号：31717539 阅读：25 留言：0更新日期：2022-01-01 11:25

本申请实施例提出一种文本分类模型的训练方法、文本分类方法及相关装置，涉及自然语言处理技术领域。该方法利用预先构建的文本分类模型的词特征提取网络对训练文本进行处理得到词特征融合向量；词特征融合向量由训练文本的句子中各个单词对应的词向量和词特征向量拼接得到；将词特征融合向量输入词注意力层获得句子对应的句向量；将句向量输入句特征提取网络获得训练文本中句子对应的句特征融合向量；句特征融合向量由句向量与句特征向量拼接得到；将句特征融合向量输入句注意力层，获得结果向量；根据结果向量和训练文本对应的标签值更新该文本分类模型的参数。使训练后的文本分类模型能够更有效地提取文本特征，提高文本分类精确度。本分类精确度。本分类精确度。

全部详细技术资料下载

【技术实现步骤摘要】
文本分类模型的训练方法、文本分类方法及相关装置

[0001]本申请涉及自然语言处理
，具体而言，涉及一种文本分类模型的训练方法、文本分类方法及相关装置。

技术介绍

[0002]文本分类任务是自然语言处理领域中的经典任务，基于深度学习理论的文本分类任务是近年来的热门研究方向，目前HAN模型将注意力机制应用于文本分类任务中，从而能够注意到文本中不同词对于分类的重要程度。
[0003]但现有技术中HAN模型使用层次注意力的方式进行特征提取，在进行文本分类时并不能精确地提取特征，从而导致分类不精确。

技术实现思路

[0004]有鉴于此，本申请的目的在于提供一种文本分类模型的训练方法、文本分类方法及相关装置，以精确提取文本特征，实现文本的精确分类。
[0005]为了实现上述目的，本申请实施例采用的技术方案如下：
[0006]第一方面，本申请提供一种文本分类模型的训练方法，所述方法包括：
[0007]将训练文本输入预先构建的文本分类模型，利用所述文本分类模型的词特征提取网络对所述训练...

【技术保护点】

【技术特征摘要】
1.一种文本分类模型的训练方法，其特征在于，所述方法包括：将训练文本输入预先构建的文本分类模型，利用所述文本分类模型的词特征提取网络对所述训练文本进行处理，得到词特征融合向量；所述词特征融合向量由所述训练文本的句子中各个单词对应的词向量和词特征向量拼接得到；将所述词特征融合向量输入所述文本分类模型的词注意力层，获得所述句子对应的句向量；将所述句向量输入所述文本分类模型的句特征提取网络，获得所述训练文本中所述句子对应的句特征融合向量；所述句特征融合向量由所述句向量与句特征向量拼接得到；将所述句特征融合向量输入所述文本分类模型的句注意力层，获得结果向量；根据所述结果向量和所述训练文本对应的标签值更新所述文本分类模型的参数。2.根据权利要求1所述的方法，其特征在于，所述词特征提取网络包括词嵌入层、第一双向循环神经网络和词特征融合网络，所述利用所述文本分类模型的词特征提取网络对所述训练文本进行处理，得到词特征融合向量，包括：利用所述词嵌入层对所述训练文本进行处理，得到所述训练文本的句子中各个单词对应的词向量；将所述训练文本的每个句子中各个单词对应的词向量输入所述第一双向循环神经网络，得到所述训练文本的句子中各个单词对应的词特征向量；利用所述词特征融合网络对所述训练文本的句子中各个单词对应的词向量和词特征向量进行拼接，得到词特征融合向量。3.根据权利要求1所述的方法，其特征在于，所述句特征提取网络包括第二双向循环神经网络和句特征融合网络，所述将所述句向量输入所述文本分类模型的句特征向量提取网络，获得所述训练文本中所述句子对应的句特征融合向量，包括：将所述句向量输入所述第二双向循环神经网络，得到所述训练文本中所述句子对应的句特征向量；利用所述句特征融合网络对所述训练文本的所述句子对应的句向量和句特征向量进行拼接，获得所述训练文本中所述句子对应的句特征融合向量。4.根据权利要求1所述的方法，其特征在于，所述根据所述结果向量和所述训练文本对应的标签值更新所述文本分类模型的参数包括：根据所述结果向量和所述训练文本对应的标签值计算层内损失值和层间损失值；根据所述层内损失值和所述层间损失值更新所述文本分类模型的参数。5.一种文本分类方法，其特征在于，所述方法包括：获取待分类文本；将所述待分类文本输入如权利要求1
‑

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：成都数联云算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人