基于句向量预训练模型的文本处理方法及相关设备技术

技术编号：30167321 阅读：13 留言：0更新日期：2021-09-25 15:23

本发明专利技术涉及人工智能技术领域，提供一种基于句向量预训练模型的文本处理方法及相关设备，所述方法包括：获取目标语料文本和文本处理任务；对目标语料文本进行分词处理，得到多个分词；根据文本处理任务的任务类型构建包含有语法关系识别层和语法关系添加层的句向量预训练模型；根据训练集训练文本处理任务的任务类型对应的构建好的句向量预训练模型；将多个分词输入至训练好的句向量预训练模型中，得到文本处理任务的执行结果。本发明专利技术通过在句向量预训练模型增加了语法关系识别层和语法关系添加层，将语法关系融入至目标语料文本中，丰富了提取句向量时的输入信息，获得更好的句向量，进而提高了文本处理任务的执行效率和准确率。确率。确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于句向量预训练模型的文本处理方法及相关设备

[0001]本专利技术涉及人工智能
，具体涉及一种基于句向量预训练模型的文本处理方法及相关设备。

技术介绍

[0002]在文本处理领域，针对文本分类，语义匹配等，都需要获取句向量后进行分类、匹配等计算，现有技术通过RNN网络对句向量进行学习，或者BERT模型对整个句子进行计算得到句向量。
[0003]然而，现有技术在获取句向量阶段，针对模型进行了优化，未考虑文本中的语法关系，无法获取较好的句向量，进而导致文本处理的准确率低。
[0004]因此，有必要提供一种可以快速准确的文本处理方法。

技术实现思路

[0005]鉴于以上内容，有必要提出一种基于句向量预训练模型的文本处理方法及相关设备，通过在句向量预训练模型增加了语法关系识别层和语法关系添加层，将语法关系融入至目标语料文本中，丰富了提取句向量时的输入信息，获得更好的句向量，进而提高了文本处理任务的执行效率和准确率。
[0006]本专利技术的第一方面提供一种基于句向量预训练模型的文本处理方法，所述方法包括：
[0007]接收用户输入的文本处理请求，解析所述文本处理请求获取目标语料文本和文本处理任务；
[0008]对所述目标语料文本进行分词处理，得到多个分词；
[0009]根据所述文本处理任务的任务类型构建句向量预训练模型，其中，所述句向量预训练模型中包含有语法关系识别层和语法关系添加层；
[0010]根据训练集训练所述文本处理任务的任务类型对应的构...

【技术保护点】

【技术特征摘要】
1.一种基于句向量预训练模型的文本处理方法，其特征在于，所述方法包括：接收用户输入的文本处理请求，解析所述文本处理请求获取目标语料文本和文本处理任务；对所述目标语料文本进行分词处理，得到多个分词；根据所述文本处理任务的任务类型构建句向量预训练模型，其中，所述句向量预训练模型中包含有语法关系识别层和语法关系添加层；根据训练集训练所述文本处理任务的任务类型对应的构建好的句向量预训练模型；将所述多个分词输入至所述文本处理任务的任务类型对应的训练好的句向量预训练模型中，得到所述文本处理任务的执行结果。2.如权利要求1所述的基于句向量预训练模型的文本处理方法，其特征在于，所述根据所述文本处理任务的任务类型构建句向量预训练模型包括：当所述文本处理任务的任务类型为命名实体识别时，句向量预训练模型包括：预训练的词向量提取模型、与所述预训练的词向量提取模型连接的双向LSTM模型以及与所述双向LSTM模型连接的第一输出层，其中，所述双向LSTM模型中包含有语法关系识别层和与所述语法关系识别层连接的语法关系添加层，所述第一输出层包含有CRF层。3.如权利要求1所述的基于句向量预训练模型的文本处理方法，其特征在于，所述根据所述文本处理任务的任务类型构建句向量预训练模型包括：当所述文本处理任务的任务类型为句子分类时，句向量预训练模型包括：预训练的词向量提取模型、与所述预训练的词向量提取模型连接的双向LSTM模型以及与所述双向LSTM模型连接的第二输出层，其中，所述双向LSTM模型中包含有语法关系识别层和与所述语法关系识别层连接的语法关系添加层，所述第二输出层包含有全连接层以及与所述全连接层连接的Softmax层。4.如权利要求1所述的基于句向量预训练模型的文本处理方法，其特征在于，所述将所述多个分词输入至所述文本处理任务的任务类型对应的训练好的句向量预训练模型中，得到所述文本处理任务的执行结果包括：当所述文本处理任务的任务类型为命名实体识别，将所述多个分词输出至所述预训练的词向量提取模型，得到多个目标词向量，并将所述多个目标词向量进行归类，得到多个第一句向量；将所述多个第一句向量输入至双向LSTM模型的语法关系识别层，通过所述语法关系识别层识别每个所述第一句向量中各个词之间的语法关系，并将每个所述第一句向量中各个词之间的语法关系通过所述语法关系添加层添加至对应第一句向量中，得到多个第二句向量；按照预设的输入形式对每个所述第一句向量和每个所述第二句向量进行编码，得到多个目标句向量；将所述多个目标句向量输入至CRF层，所述CRF层对所述多个目标句向量中的每个词进行实体标注，解码出实体标签，并将解码出实体标签确定为所述文本处理任务的执行结果。5.如权利要求1所述的基于句向量预训练模型的文本处理方法，其特征在于，所述将所述多个分词输入至所述文本处理任务的任务类型对应的训练好的句向量预训练模型...

【专利技术属性】
技术研发人员：孙超，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人